导读:Anthropic给自家AI安全工具取名Mythos(神话),结果名字成了预言——它确实像神话一样,信的人觉得神,不信的人看出漏洞。

命名的反讽:神话还是迷思?

打开网易新闻 查看精彩图片

事后看来,Anthropic给代码安全模型取名Mythos简直是给自己挖坑。这个词本意是"神话",暗指神一般的力量;但另一层意思更扎心——"源于模糊、与现实不符的信仰体系"。

现实正在慢慢渗透进来,画面从"神话"滑向"典型"。Mythos确实是款好工具,能自动化大量专家级人工操作,但真正从中受益的仍是那些专家本身。它擅长发现人类已知的漏洞类别,对人类未知的则束手无策。

训练数据的局限,懂的都懂。

Project Glasswing项目将早期使用权限限制给有真实需求的可信合作伙伴,这种谨慎姿态值得肯定。但原文也指出,其他无限制的模型在这方面表现同样出色。有些 hype,有些真东西,大语言模型终究是大语言模型。

伦理运营:是创新还是表演?

说"AI公司讲伦理就是唯一真创新"当然刻薄。把封闭式推广和配套宣传单纯看成炒作 exercise,同样刻薄。

更建设性、更准确、也更令人兴奋的解读是:这是更好未来的早期 glimpses。威胁 landscape 不再是地质和气候般的不可控力量,而是可被培育、控制、甚至令人欣慰地趋于平淡的存在。

两个命题指明方向。

第一,Mythos这类工具的效果会持续进化,暴露越来越多结构和个体代码缺陷。第二,这些工具终将普及。多快多便宜或许可控,但结局不可避免——IT 领域没有长期秘密。

前工业时代的代码遗产

当下及未来相当长一段时间,大多数运行中的代码诞生于漏洞检测的"前工业时代"。靠人眼,而非 AI 之眼完成审查。

这是一个糟糕的公共环境,不适合贸然投放成群结队的无情漏洞狩猎机器人。来得太早,场面会很混乱。而它们正在路上。

但如果能平稳度过这场 transition,就让机器人自由 roam 吧。有一类代码绝对零安全风险——未部署的代码。新代码问题很多,有些在部署前被捕获,有些没有,但数量有限而非无限。

当真正优秀的工具存在时,代码可以在发布前变得真正优秀。此后同样的工具落入坏人手中,也无关紧要。

航空安全的启示:从坠机到可解释事故

常被引用的好模型是航空安全。喷气时代初期,新客机存在结构和机械故障,会直接从天上掉下来。随着时间推移,不仅设计和材料知识进步,工程和监管 discipline 也同步演化。

现在我们仍有坠机,但 inevitably 可追溯至"本该做对却没做对"的环节。不再有全新的、未被发现的(原文此处截断,但逻辑完整:系统性未知风险已被消除)。

代码安全的演化路径或许类似:从不可控的混沌,到可控的、可解释的、可预防的失败。Mythos 现在的"瑞士奶酪"状态——满是孔洞,但仍有营养——正是这个漫长过程的起点。

Anthropic 的谨慎 rollout 不是保守,而是对 transition 风险的清醒认知。机器人终将 roam,但时机选择本身就是产品决策的一部分。

至于名字?Mythos 的两种读法或许都是对的:它既是尚未兑现的神话承诺,也是关于 AI 安全工具能力的、需要被检验的当代迷思。而检验者,正是那些真正懂行的专家用户——以及时间本身。