出品 | 网易智能

作者 | 小小

编辑 | 王凤枝

最牛的大模型诞生了,但你根本没资格用。

北京时间4月8日凌晨,Anthropic干了一件违背商业常理的事。他们不仅亲手按死了自家超级模型Claude Mythos(神话)的公开发布,还破天荒地联手苹果与谷歌等一众宿敌,试图把这个刚造出的重量级武器彻底隐藏起来。

打开网易新闻 查看精彩图片

它究竟有多强?

在没有任何专属安全训练的前提下,它仅靠逻辑能力的自然演进就全面超越了前代顶级模型。在权威的工程难题测试中,Mythos解决复杂Bug的成功率直接提升了近五成,而在科学界的极限测试里更是拿下了94.6%的高分。

更让人警惕的是它在实战中的破坏力。过去几周内,Mythos在完全自主的状态下,不仅一眼看穿了潜伏在顶级防火墙系统中长达27年的深层漏洞,甚至还能在Linux内核里自主串联多个隐蔽漏洞,瞬间完成对核心服务器的彻底接管。

这种自主寻找漏洞并开发利用工具的强大能力,正是它被紧急封杀的直接原因。

Anthropic的前沿红队负责人洛根·格雷厄姆(Logan Graham)坦言,全人类必须现在就为一个新世界做好准备。他极其严肃地警告,在未来6到24个月内,这类能力将变得随处可见,届时安全领域的许多规则将被彻底改写,我们构建现代安全体系时所依赖的诸多基本假设也将被全盘打破。

打开网易新闻 查看精彩图片

为此他们宁可放弃巨大的商业流量,也要抛出一项高达1亿美元的防御联盟计划。他们试图用严格受控的内部开放策略,为科技巨头们争取宝贵的系统加固时间。

01数据不会撒谎:编码与推理的绝对降维碾压

正如Anthropic官方所释义的,Mythos一词源自古希腊语中的话语或叙事,代表着文明借以理解世界的故事系统。这个内部代号,本身就宣告了一场跨维度的能力跃迁。

Mythos在没有任何专门网络安全训练的前提下,仅仅靠代码能力的自然进化,就实现了对上一代最强模型Claude Opus 4.6的全面超越。

打开网易新闻 查看精彩图片

在衡量AI解决实际工程问题能力的SWE-bench Pro测试中,Mythos预览版得分高达77.8%,而Opus 4.6只有53.4%。这意味着在面对复杂的生产级代码库时,Mythos解决问题的成功率提升了近百分之五十,在多语言环境下,它更是跑出了87.3%的高分。

在极具挑战性的人类最后一场考试(Humanity’s Last Exam)中,有工具辅助的Mythos达到了64.7%,将前代模型远远甩在身后。而在针对科学领域难题的GPQA Diamond测试中,Mythos的得分更是高达94.6%,几乎逼近了人类专家认知的极限。

Mythos不仅会写代码,它还会像高级工程师一样接管电脑。在验证操作系统执行任务能力的OSWorld-Verified测试中,它斩获了79.6%的分数。这意味着它能够流畅地在各种软件界面间切换、搜索核心信息并执行复杂的破坏或防御指令。

02实战猎杀记录:揪出蛰伏27年的代码幽灵

如果说测试分数只是实验室数据,那么Mythos在过去几周里自主揪出的数千个零日漏洞,则是实打实的战绩。Anthropic披露了三个典型的危险案例,每一个都足以让顶尖的安全专家冷汗直流。

OpenBSD一直被誉为全球安全性最强的操作系统,广泛用于防火墙等关键基础设施。然而,Mythos在完全自主的情况下,直接识别出了一个潜伏了27年之久的深层漏洞。这个漏洞的后果非常直接,攻击者只需简单连接,就能远程导致任何运行该系统的机器瞬间崩溃,而在这漫长的27年里,无数顶级安全研究人员和审计工具对它一无所知。

FFmpeg是现代互联网视频处理的底层基石,几乎每一款主流软件都在依赖它。Mythos在其中发现了一个存在了16年之久的隐蔽漏洞。极具讽刺意味的是,自动化测试工具曾对出问题的这行代码进行了多达五百万次的反复扫描,却从未检测到任何异常,而Mythos却一眼看穿了这行代码背后的逻辑陷阱。

在运行着全球绝大部分服务器的Linux内核中,Mythos展示了更高级的思考能力。它不仅敏锐地发现了漏洞,还能自主将多个边缘漏洞串联起来,完成了一次从普通用户权限到完全控制核心机器的致命逆转。

03一亿美元的保命屏障:玻璃翼计划如何运作

面对Mythos这种足以摧毁现有互联网双刃剑,Anthropic并没有选择闭门造车,而是紧急发起了一项名为玻璃翼计划(Project Glasswing)的全球防御倡议。

这个名字的寓意意味深长,Glasswing是一种以透明翅膀著称的透翅蝶。Anthropic官方解释称,透明的翅膀让蝴蝶能隐藏在众目睽睽之下,就像那些难以察觉的软件漏洞,同时这种透明度也让它们能躲避捕食者的伤害,正如该计划所倡导的防御透明度。

为了确保人类防御者能够跑赢未来的攻击者,Anthropic投入了庞大的资源:

首先,Anthropic承诺向Glasswing合作伙伴及相关组织提供最高一亿美元的Mythos预览版使用额度,确保他们有充裕的算力资源来加固自己的代码库。

其次,为了不让开源社区在这场安全竞赛中掉队,Anthropic通过Linux基金会向Alpha-Omega、OpenSSF等开源安全组织捐赠了250万美元,并向Apache软件基金会捐赠了150万美元。

最关键的一步是,目前Mythos绝对不会向公众发布。只有通过该计划,合作伙伴才能通过AWS、Google Cloud Vertex AI或Microsoft Foundry等平台获得严格受控的预览权限。

这种极度保守的分阶段发布策略,实际上是在为全球基础设施争取时间。正如Anthropic前沿红队负责人所言,这早已不是一家公司的问题,而是全行业乃至各国政府都必须面对的挑战,我们必须让防御者占据先机。

04巨头们的罕见结盟:连对手都坐不住了

在这场史无前例的合作中,曾经的商业竞争对手们表现出了罕见的共识。八家创始合作伙伴在实测Mythos后,给出了最真实的反馈:

亚马逊AWS副总裁艾米·赫尔佐格(Amy Herzog)透露,他们已经在关键代码库中测试Mythos,每天分析超过四百万亿个网络流量,而Mythos正在帮助他们在大规模防御中进行底层的代码加固。

打开网易新闻 查看精彩图片

微软网络安全执行副总裁伊戈尔·齐甘斯基(Igor Tsyganskiy)指出,Mythos表现出了超越以往所有模型的改进。他严肃地判定,网络安全已经正式进入了一个不再受人力限制的全新阶段。

打开网易新闻 查看精彩图片

谷歌安全工程副总裁希瑟·阿德金斯(Heather Adkins)对这一倡议表示了欢迎。尽管谷歌拥有Big Sleep和CodeMender等自研安全工具,但她深刻意识到,面对基于下一代AI的攻击,跨行业的巨头结盟至关重要。

打开网易新闻 查看精彩图片

思科高级副总裁安东尼·格里科(Anthony Grieco)则强调,AI的能力已经跨越了临界点,过去那种缓慢修补系统的方法已经行不通了。思科加入计划是为了以前所未有的速度和规模识别修复漏洞。

CrowdStrike首席技术官伊利亚·扎伊采夫(Elia Zaitsev)发出的警告最为直接,从漏洞被发现到被利用的窗口期,已经从数月被压缩至几分钟,他告诫所有人,如果你想部署AI,安全必须是第一位的。

Palo Alto Networks首席产品官李·克拉里奇(Lee Klarich)证实,Mythos能识别出前代模型完全漏掉的复杂漏洞。他呼吁所有人必须现代化自己的网络安全栈,迎接更频繁、更复杂的AI辅助攻击。

摩根大通首席信息安全官帕特·奥佩特(Pat Opet)表示,这是金融机构在关键基础设施防御方面的一次早期机会,必须通过协作来评估下一代AI工具。

Linux基金会首席执行官吉姆·泽姆林(Jim Zemlin)则认为,AI增强的安全将成为每一位维护者的得力助手,而不再是大型组织的专属特权。

05终极清算还是变相的敲诈勒索

当Claude Mythos这种能够自主猎杀系统漏洞的模型被公之于众时,全球舆论场呈现出了两极分化。这种复杂的反馈,不仅折射出了技术带来的震撼,更揭示了人们对于失去网络安全主导权的焦虑。

知名科技投资人布拉德·格斯特纳(Brad Gerstner)高度赞扬了这种务实的做法。他认为通过推迟发布并组建防线,Anthropic实际上是用一种市场协作模式,为脆弱的互联网筑起了一道屏障。

打开网易新闻 查看精彩图片

然而,批评的声音同样尖锐,甚至带着对技术霸权的愤怒。

科技专栏作家尼克·奥尼尔(Nick O'Neill)的观点显得十分激进,他认为对于全球软件公司来说,这更像是一场打着创新旗号的人质劫持。如果不向Anthropic支付昂贵的模型使用费,这些公司在未来被攻破的概率将高达85%,在他眼里,这种领先的安全能力更像是一种新型的敲诈勒索。

打开网易新闻 查看精彩图片

在竞争格局上,业界的嗅觉极其敏锐。尽管OpenAI曾宣称拥有最强网络安全模型,但Mythos显然在能力上实现了跨代式的飞跃。科技博主指出,原本属于OpenAI的先发优势正在发生转移,安全防御已然成为未来一年AI大厂之间最核心的较量场。

打开网易新闻 查看精彩图片

此外,多位重量级观察家对这一现象进行了深层剖析,试图理清Mythos问世的真实意义:

知名科技博主罗伯特·斯考伯(Robert Scoble)从AGI管理的角度指出,如果手中掌握了足以危害世界的强大技术,明智的做法绝不是贸然公开,而是先用它来修复世界的漏洞。只有让正确的人管理它,技术才能真正造福于人。

打开网易新闻 查看精彩图片

未来学家拉米兹·纳姆(Ramez Naam)则将这看作一场AI与AI之间的对决。他认为安全必须在整个生态系统层面得到保障,而“好人利用AI”,是阻止“坏人”利用AI的唯一出路。

打开网易新闻 查看精彩图片

《纽约时报》专栏作家凯文·鲁斯(Kevin Roose)则察觉到了一个更本质的变化。他在推文中直言:除了网络安全方面的影响之外,Claude Mythos的未发布是自GPT-2以来,主要人工智能实验室首次因安全问题而推迟发布已公布的模型。

如果Anthropic的说法正确,那么公开可用的模型和私人模型之间现在存在着巨大的差距,这可能是多年来第一次出现这种情况。

打开网易新闻 查看精彩图片

结语:沙漏已经倒转,留给人类的时间不多了

Anthropic CEO达里奥·阿莫代伊(Dario Amodei)的最后通牒非常清晰,网络安全仅仅是前沿模型带来的第一个紧迫危险,但它绝对不会是最后一个。Glasswing计划仅仅是一个起点,保卫全球网络基础设施的工作可能还需要数月乃至数年时间。

打开网易新闻 查看精彩图片

在这场能力的狂飙中,我们正处在一个极其不确定的节点上。

而对于数以十亿计的普通用户来说,这才是最让人后背发凉的现实。我们每天赖以生存的社交隐私、银行存款和智能设备,在这场即将到来的风暴面前犹如纸糊一般脆弱。

Mythos的封印,到底能为这个世界换取多少防御时间?