英国AI安全机构测试：Claude Mythos首次通关全部网络攻击模拟|mythos|preview|沙箱|源代码|网络攻击

AI的网络攻击能力正在以超出预期的速度进化。英国人工智能安全研究所（AISI）在短短几个月内两次上调了对前沿AI网络能力的评估预期，而最新测试结果显示，现实可能比官方修订后的预测还要激进。

2025年11月，AISI估计AI网络能力每8个月翻一倍。到了2026年2月，这一数字被压缩至4.7个月。而Anthropic的Claude Mythos Preview和OpenAI的GPT-5.5已经"大幅超越"了这一加速后的时间线。这种跃升究竟是新趋势的开端，还是一次性的能力跳跃，目前尚无定论。

在AISI设计的复杂攻击模拟测试中，Mythos Preview创造了历史。该机构设置了一套名为"网络靶场"的实战化评估体系，其中一项模拟要求完成32个步骤的企业网络渗透攻击——据AISI称，人类专家完成同等任务大约需要20小时。最新版本的Mythos Preview在10次尝试中成功6次。值得注意的是，这一版本已向合作伙伴开放。而此前测试的旧版本成功率仅为3/10。

更具标志性意义的是工业控制系统模拟"冷却塔"（Cooling Tower）。Mythos Preview在10次尝试中成功3次，成为首个通过该测试的模型，包括其早期版本在内的所有前辈均未能突破这一关卡。

独立安全公司XBOW的验证为这一评估提供了交叉印证。该公司组织10名安全专家对Mythos Preview进行测试，结论是该模型代表了"重大进步"，在漏洞检测上展现出"逐词元级别的前所未有的精确度"。与Anthropic自家的Opus 4.6相比，Mythos Preview将漏报率降低了42%；在额外提供源代码访问权限的情况下，这一降幅达到55%。

XBOW的报告揭示了一个反复出现的模式：Mythos Preview擅长编写代码，但更擅长阅读代码。源代码分析被确认为该模型的核心优势。测试中发现，它甚至能够在Chromium浏览器的V8沙箱等复杂环境中定位漏洞——这一领域向来以分析难度著称。

AISI的表态为这一系列测试划下了注脚："发展方向很明确：网络能力正在快速进步，近期模型相比前代出现了实质性的能力提升。"该机构已开始构建带有主动防御机制的更难评估体系，试图跟上技术演进的节奏。