4月7日,Anthropic发布Claude Mythos Preview的消息,震动的远不止是网络安全圈。英国财政大臣在IMF会议上讨论它,英国央行行长称必须"非常严肃对待",英国政府更是向全国企业领袖发出公开信。一款AI安全研究工具,为何惊动了一国政府?
答案在于Mythos的自主发现能力。它无需人工指导,就找到了数千个关键和高危漏洞,覆盖所有主流操作系统和浏览器,包括OpenBSD中一个潜伏27年的缺陷。英国AI安全研究所(AISI)的测试更具冲击力:Mythos完成了一个32步的模拟企业网络攻击,从侦察到完全接管,而人类安全专家完成同等任务约需20小时。
但这里有一个重要限定——这些结果来自实验室环境。Anthropic的Mythos系统卡明确指出:模拟中没有主动防御、安全监控极少、缺乏防御工具,Firefox漏洞利用测试甚至未启用浏览器的进程沙箱。Mythos确实令人印象深刻,但它尚未与加固的、主动防御的系统正面交锋。
即便如此,趋势已不可逆转。AISI估计,前沿模型的网络能力正以每四个月翻一倍的速度增长。而且,其他模型厂商终将推出类似功能,却未必会像Anthropic这样限制访问。
安全正在变成经济学问题
AISI为每次网络攻击模拟预留了1亿token的预算。十次运行中,Mythos三次完成全部32步攻击。关键发现是:随着token预算增加,没有任何模型出现收益递减,性能持续上升。直白地说,攻击者投入的算力越多,发现的漏洞就越多。
这引出一个棘手问题:加固系统是否需要比攻击者更多的token投入来发现漏洞?CSA和SANS的"Mythos就绪"简报提出了应对思路:建立永久性的漏洞运营职能,在整个软件资产上持续运行AI驱动的漏洞发现。依赖年度渗透测试已无法匹配现实节奏——token支出可能成为新的渗透测试。
补丁即信号
Project Glasswing预计将带来漏洞披露潮,约40家主要软件厂商已获得Mythos早期访问权限以审查代码库。这种协调负责任的披露方式固然正确,却制造了次生问题:每个补丁都在向对手发出信号,指明该往哪里寻找。
AI正在加速补丁差异分析(patch-diffing)——对比新旧代码,逆向工程修复了什么、什么曾可被利用。
热门跟贴