一家AI公司把产品命名为"Mythos"(神话),结果成了最精准的自我预言——不是神力的那种神话,是"与现实脱节的信仰体系"那种神话。
这是Anthropic最新发布的代码安全模型。上线前被寄予厚望,实测后露出熟悉的轮廓:擅长发现人类已知的漏洞类型,对人类尚未意识到的漏洞视而不见。训练数据的边界,就是它的边界。
命名即命运
回看这个命名,Anthropic或许想暗示神级能力。但词源学开了个玩笑——Mythos的另一种释义,恰恰是"起源不明、与现实不兼容的信仰集合"。
这种双关现在成了最诚实的评测。模型确实能自动化大量专家级工作,但专家才是最大受益者。它放大了已有知识,而非创造新知。
Project Glasswing的受限发布策略值得玩味:仅向有真实需求的可信合作伙伴开放。这种克制在AI行业并不常见。但原文也指出,其他无限制模型在同类任务上表现相当。LLM的赛道,终究是LLM的赛道。
两条必然路径
工具效能会持续进化,暴露更多结构性缺陷。这是第一条命题。
通用可用性不可避免,这是第二条。IT领域没有长期秘密,释放节奏和成本或许可控,结局已定。
当前大部分运行代码诞生于"漏洞检测的前工业时代"——靠人眼而非AI。这不是理想的过渡环境。成群的自动化漏洞猎手若来得太急,局面会混乱。但它们正在来。
航空业的安全隐喻
一个被频繁引用的模型:喷气时代初期,新客机因结构和机械缺陷坠毁。随着时间推移,设计、材料知识进步,工程与监管纪律同步演化。
如今空难仍可发生,但必然可追溯至"本该做对却未做对"的环节——不再有全新的、未被发现的失效模式。
代码安全的未来或许类似。唯一绝对安全的代码是未部署的代码。新代码问题有限,优秀工具能在发布前将其打磨至优秀。此后工具是否落入恶人之手,已不再重要。
冷幽默
最乐观的结局:我们成功穿越混乱过渡期,让机器人自由漫游。届时Anthropic或许该考虑改名——Mythos已经用完了它的讽刺配额,而"Glasswing"(玻璃翼)听起来更像一种会碎的东西。
热门跟贴