Anthropic的"神话"代码嗅探器：瑞士奶酪还是切达干酪？

灰度测试中

2026-04-27 17:22 ·北京

导读：Anthropic给自家AI安全工具取名Mythos（神话），结果名字成了预言——它确实像神话一样，信的人觉得神，不信的人看出漏洞。

命名的反讽：神话还是迷思？

事后看来，Anthropic给代码安全模型取名Mythos简直是给自己挖坑。这个词本意是"神话"，暗指神一般的力量；但另一层意思更扎心——"源于模糊、与现实不符的信仰体系"。

现实正在慢慢渗透进来，画面从"神话"滑向"典型"。Mythos确实是款好工具，能自动化大量专家级人工操作，但真正从中受益的仍是那些专家本身。它擅长发现人类已知的漏洞类别，对人类未知的则束手无策。

训练数据的局限，懂的都懂。

Project Glasswing项目将早期使用权限限制给有真实需求的可信合作伙伴，这种谨慎姿态值得肯定。但原文也指出，其他无限制的模型在这方面表现同样出色。有些 hype，有些真东西，大语言模型终究是大语言模型。

伦理运营：是创新还是表演？

说"AI公司讲伦理就是唯一真创新"当然刻薄。把封闭式推广和配套宣传单纯看成炒作 exercise，同样刻薄。

更建设性、更准确、也更令人兴奋的解读是：这是更好未来的早期 glimpses。威胁 landscape 不再是地质和气候般的不可控力量，而是可被培育、控制、甚至令人欣慰地趋于平淡的存在。

两个命题指明方向。

第一，Mythos这类工具的效果会持续进化，暴露越来越多结构和个体代码缺陷。第二，这些工具终将普及。多快多便宜或许可控，但结局不可避免——IT 领域没有长期秘密。

前工业时代的代码遗产

当下及未来相当长一段时间，大多数运行中的代码诞生于漏洞检测的"前工业时代"。靠人眼，而非 AI 之眼完成审查。

这是一个糟糕的公共环境，不适合贸然投放成群结队的无情漏洞狩猎机器人。来得太早，场面会很混乱。而它们正在路上。

但如果能平稳度过这场 transition，就让机器人自由 roam 吧。有一类代码绝对零安全风险——未部署的代码。新代码问题很多，有些在部署前被捕获，有些没有，但数量有限而非无限。

当真正优秀的工具存在时，代码可以在发布前变得真正优秀。此后同样的工具落入坏人手中，也无关紧要。

航空安全的启示：从坠机到可解释事故

常被引用的好模型是航空安全。喷气时代初期，新客机存在结构和机械故障，会直接从天上掉下来。随着时间推移，不仅设计和材料知识进步，工程和监管 discipline 也同步演化。

现在我们仍有坠机，但 inevitably 可追溯至"本该做对却没做对"的环节。不再有全新的、未被发现的（原文此处截断，但逻辑完整：系统性未知风险已被消除）。

代码安全的演化路径或许类似：从不可控的混沌，到可控的、可解释的、可预防的失败。Mythos 现在的"瑞士奶酪"状态——满是孔洞，但仍有营养——正是这个漫长过程的起点。

Anthropic 的谨慎 rollout 不是保守，而是对 transition 风险的清醒认知。机器人终将 roam，但时机选择本身就是产品决策的一部分。

至于名字？Mythos 的两种读法或许都是对的：它既是尚未兑现的神话承诺，也是关于 AI 安全工具能力的、需要被检验的当代迷思。而检验者，正是那些真正懂行的专家用户——以及时间本身。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴