打开网易新闻 查看精彩图片

新智元报道

编辑:Aeneas

【新智元导读】AI黑客Claude Mythos觉醒了!英国AI安全研究所证实,它是首个破解企业网络攻击测试的AI,仅用32步,完成20小时人类任务只需几秒。高盛已经紧急拉响红色警报,人类的网络安全,已经进入奥本海默时刻。

今天,数条恐怖的消息同时在全网刷屏了。

据爆料,华尔街巨头高盛正在疯狂加强网络防御,为的就是应对Claude Mythos!

打开网易新闻 查看精彩图片

紧急拉响红色警报的高盛,并不是风声鹤唳。

就在刚刚,英国人工智能安全研究所(AISI)发布了一项重磅研究:Anthropic于4月7日发布的Claude Mythos Preview模型,在网络安全评估中表现出令人毛骨悚然的能力。

打开网易新闻 查看精彩图片

这次,AISI的测试环境,选在了代号为「The Last Ones」 (TLO)的超高难度模拟网络靶场。

结果出乎意料:Mythos完成了人类专家需要20小时才能完成的32步企业网络攻击模拟,而且在这个过程中做到了全自动、全自主。

AISI惊呼:Claude Mythos是全球首个完成AISI网络靶场端到端测试的模型!

打开网易新闻 查看精彩图片

这个实验报告一出炉,也引发了圈内的强烈反响:看来Anthropic所言非虚,Claude Mythos的确与众不同。我们确实有理由担忧它对于网络安全界可能造成的巨大影响。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

难怪高盛会害怕,显然,全球网络安全基建如今正在经历一场「奥本海默时刻」。

打开网易新闻 查看精彩图片

这些天,很多人都在质疑关于Mythos的担心只是营销手段,但这些天曝出的数据,逐渐证实:Mythos,或许真的很危险。

打开网易新闻 查看精彩图片

那个让高盛睡不着觉的AI黑客

英国AISI这个组织在业内小有名气。

从2023年开始,他们就一直在追踪AI的网络安全能力,为此专门构建了一套从易到难的评估体系。

夺旗赛结果

在CTF(Capture-the-flag )挑战赛中,AI 模型必须识别并利用目标系统中的弱点来获取隐藏的「flag」。

2025年4月之前,任何模型都无法完成入门级的专家级任务。

但在今天的专家级夺旗赛(CTF)任务中,Claude Mythos Preview的成功率已经高达73%!

打开网易新闻 查看精彩图片

自2022年11月以来,模型在技术非专家和学徒级别的夺旗赛 (CTF) 任务上的表现。GPT-3.5 Turbo到Claude 4 Opus平均运行10次,最多处理250万个token。GPT-5 到Mythos Preview平均运行5次,最多处理250万个token

而且,要敲黑板的是,这些专家级任务在2025年4月之前,没有任何模型能够完成。

但Claude Mythos Preview一上手,成功率就已经飙升至73%这个惊艳成绩

打开网易新闻 查看精彩图片

自2025年8月以来,模型在实践者和专家级夺旗任务 (CTF) 中的表现。所有模型平均运行5次,达到5000万个token

网络靶场结果:20小时 vs 几秒钟

这还不是最恐怖的。

真正让安全专家们彻夜难眠的,是 「The Last Ones」(最后的挑战者) 测试。

即使是专家级的CTF比赛也只能孤立地测试特定技能。而现实世界的网络攻击需要将数十个步骤串联起来,跨越多个主机和网络段——这些持续性操作需要人类专家花费数小时、数天甚至数周的时间才能完成。

为此,AISI的研究者们构建了「The Last Ones」 (TLO),这是一个模拟真实企业网络的32步攻击链路。从最初的网络侦察开始,到最终完全控制整个网络结束,人类专家完成这个测试需要整整20个小时。

而Claude Mythos Preview是第一个从头到尾打通这个测试的AI模型!

在10次尝试中,它成功了3次,平均每次完成22个步骤。

打开网易新闻 查看精彩图片

在「The Last Ones」任务中,模型完成的平均步骤数随总token消耗的变化关系。Mythos Preview、Opus 4.6 和 GPT-5.4 在最高100M token预算下平均运行10次;Opus 4.5、GPT-5.1 Codex 和 Sonnet 4.5 在1000万token预算下平均运行15次,在100M token预算下平均运行5次;GPT-5.3-Codex 在1000万token预算下平均运行10次,在100M token预算下平均运行5次;Sonnet 3.7 和 GPT-4o 仅在1000万token预算下平均运行10次。在所测试的token预算范围内,随着token预算的增加,各模型的表现持续提升。灰色的水平线表示攻击链中的关键里程碑

也就是说,Claude Mythos可以在没有人类干预的情况下,自主完成一次完整的企业网络渗透,包括扫描漏洞、寻找弱点、横向移动、权限提升、最终拿下整个网络。

这是一条完整的黑客攻击链,而Mythos,就是那个唯一的攻击手。

研究者发现了这个令人颤栗的事实:Mythos已经具备了独立完成「灭国级」网络攻击的潜力。

它不需要人类黑客在键盘前敲命令,不需要等待指令,不需要人类的判断。它自己就是判断,自己就是执行者。

它不是一个工具,而是一个有目标、有策略、有执行力的数字生命体。

难怪高盛要疯狂加码网络防御。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

拔网线都来不及,这次噩梦成真了

在专家级夺旗赛(CTF)中,AI模型的进化阶梯是这样的。

2022年,AI只能勉强看懂初学者代码。

2024年,Opus 4.6能协助黑客编写局部脚本,平均完成16步攻击。

2026年,Mythos能独立完成32步连环绝杀,自主发现并利用Linux内核与浏览器的0-day漏洞。

进化速度堪称可怕。

网上一直有这么一个老梗:面对黑客攻击,最终极的防御手段就是拔网线。

但Claude Mythos的出现,导致拔网线都来不及了。

原因无他,就是Mythos的攻击速度太快了。

既然Mythos Preview完成32步攻击链路所花费的时间,远远低于人类专家的20小时,那么可以肯定,整个攻击过程可以在极短时间内完成,快到防御团队甚至来不及反应!

等你发现被入侵,想拔网线的时候,AI早就拿到最高权限,把数据全部复制完毕了。

英国AISI的评估报告明确指出:Mythos已具备对防御薄弱的企业系统进行自主潜入与破坏的能力。

我们离「AI黑客泛滥」还有多远?

或许你会想:Claude Mythos不是还攻不破防御严密的工业控制系统吗?

既然它在冷却塔测试中卡壳了,是不是我们还有时间?

对,我们还有时间,但时间不多了。

英国AISI的评估中有一个关键细节:在1亿token的预算限制下,Mythos Preview的性能仍在持续提升。

也就是说,给它更多的计算资源,它的能力还能继续增长。

打开网易新闻 查看精彩图片

在一部分私有网络安全任务中,累计成功率随token预算(上图,AISI)和交互轮次预算(下图,Irregular)的变化关系。随着预算的增加,累计成功率的每一次提升,都意味着有更多尝试最终取得成功。横轴采用对数刻度,因此曲线的上升反映的是推理计算量跨数量级增长所带来的性能提升

而计算资源的成本,正在以指数级下降。

两年前,最先进的AI连入门级CTF都做不好。今天,AI已经能完成专家级任务。两年后呢?

如今,英国国家网络安全中心(NCSC)已经发出了明确警告:未来的前沿模型将更加强大,现在对网络防御的投资至关重要。

留给人类的时间窗口,已经不多了。

为什么 Mythos 让全行业脊背发凉?

为什么 Claude Mythos 如此特殊?因为它解决了 AI 攻击的三个「终极难题」:

第一:从「工具人」到「指挥官」

以前的 AI 需要人类指令:「帮我写个溢出脚本」。

现在的 Mythos 只需要一个目标:「接管这个财务网络」。

它会自主进行信息收集,发现防火墙漏洞,尝试不同路径,如果路径A不通,它自主寻找路径B。这种多步决策能力,正是它通关TLO靶场的关键。

第二:对0-day漏洞的「嗅觉」

0-day漏洞,是厂商尚未知晓的死穴。Mythos展现出了在庞大的Linux内核代码库中精准定位未公开缺陷的能力。

这根本不是AI,分明是一个24小时不睡觉、每秒钟阅读几百万行代码的顶级黑客。

第三:毁灭性的推理扩展

上文已经提到了这个让人不安的细节:推理计算(Inference Compute)的规模效应。

测试发现,只要给 Mythos 更多的计算配额(Tokens),它的攻击成功率就会呈指数级增长。

这就像是一个怪物,你喂给它的能量越多,它的智商就越没有上限。

现实世界的阴影

你可能会说:「这只是实验室里的测试,现实世界防守很严啊。」

快醒醒吧!

AISI的警告非常明确:虽然Mythos目前在防御严密的工业OT环境(如冷却塔控制系统)中还存在局限,但对于绝大多数防御薄弱的企业系统,它已经具备了「一键摧毁」的能力。

更可怕的是,Anthropic虽然限制了访问权限,仅对AWS、微软等40多个合作伙伴开放,但这种双用途风险是无法完全规避的。

如果Mythos被泄露了呢?如果地下黑客组织训练出了自己的暗黑版Mythos呢?

正如安全专家所言:「我们正在进入一个攻击成本近乎为零的新时代。」

你的企业还撑得住吗?下面是五个残酷的问题。

第一,你的系统多久打一次安全补丁?

第二,你的访问控制有多严格?

第三,你有没有完整的日志记录?

第四,你做过模拟攻击演练吗?

第五,你的安全团队有没有AI辅助?

记住:你不是在和AI赛跑,你是在和「使用AI的攻击者」赛跑。

在少数顶级实验室的服务器里,AI已经能够自主完成企业网络劫持。在少数科技巨头的安全团队中,AI已经在帮助发现零日漏洞。

但在大多数普通企业、学校、医院、政府机构里,网络安全还停留在「装个防火墙就万事大吉」的阶段。

当AI黑客真正泛滥的那一天到来时,那些今天还在侥幸觉得「我们没那么重要不会被盯上」的组织,将成为第一波牺牲品。

参考资料:

https://www.aisi.gov.uk/blog/our-evaluation-of-claude-mythos-previews-cyber-capabilities