AI的网络攻击能力正在以超出预期的速度进化。英国人工智能安全研究所(AISI)在短短几个月内两次上调了对前沿AI网络能力的评估预期,而最新测试结果显示,现实可能比官方修订后的预测还要激进。

2025年11月,AISI估计AI网络能力每8个月翻一倍。到了2026年2月,这一数字被压缩至4.7个月。而Anthropic的Claude Mythos Preview和OpenAI的GPT-5.5已经"大幅超越"了这一加速后的时间线。这种跃升究竟是新趋势的开端,还是一次性的能力跳跃,目前尚无定论。

打开网易新闻 查看精彩图片

在AISI设计的复杂攻击模拟测试中,Mythos Preview创造了历史。该机构设置了一套名为"网络靶场"的实战化评估体系,其中一项模拟要求完成32个步骤的企业网络渗透攻击——据AISI称,人类专家完成同等任务大约需要20小时。最新版本的Mythos Preview在10次尝试中成功6次。值得注意的是,这一版本已向合作伙伴开放。而此前测试的旧版本成功率仅为3/10。

更具标志性意义的是工业控制系统模拟"冷却塔"(Cooling Tower)。Mythos Preview在10次尝试中成功3次,成为首个通过该测试的模型,包括其早期版本在内的所有前辈均未能突破这一关卡。

独立安全公司XBOW的验证为这一评估提供了交叉印证。该公司组织10名安全专家对Mythos Preview进行测试,结论是该模型代表了"重大进步",在漏洞检测上展现出"逐词元级别的前所未有的精确度"。与Anthropic自家的Opus 4.6相比,Mythos Preview将漏报率降低了42%;在额外提供源代码访问权限的情况下,这一降幅达到55%。

XBOW的报告揭示了一个反复出现的模式:Mythos Preview擅长编写代码,但更擅长阅读代码。源代码分析被确认为该模型的核心优势。测试中发现,它甚至能够在Chromium浏览器的V8沙箱等复杂环境中定位漏洞——这一领域向来以分析难度著称。

AISI的表态为这一系列测试划下了注脚:"发展方向很明确:网络能力正在快速进步,近期模型相比前代出现了实质性的能力提升。"该机构已开始构建带有主动防御机制的更难评估体系,试图跟上技术演进的节奏。