来源:市场资讯

(来源:AI信息Gap)

Sam Altman 又官宣了。

4 月 30 日,他深夜发文,「一个全新的网络安全模型 GPT-5.5-Cyber 将会在几天内推送给关键的网络防御者。」

打开网易新闻 查看精彩图片

几乎同一时间,Anthropic 的 Claude Security(一款安全扫描工具)向企业用户开放公测,之前是内部预览阶段。

打开网易新闻 查看精彩图片

两个 AI 巨头,把目光同时对准了网络安全

英国 AI 安全研究所(AISI)测试了 95 道网安任务,专家级通过率,GPT-5.5 71.4%,Claude Mythos Preview 68.6%。AISI 在博客里写道,「GPT-5.5 可能是他们测过的最强模型。」

其中一个任务,人类专家平均要 12 小时。GPT-5.5 用了 11 分钟,花费 1.73 美元。

关键不是 71.4% 这个数字。关键是,这还是第一次有模型追上 Mythos。

Mythos 是 Anthropic 4 月 7 日发布的「AI 核武器」,定位是比 Claude Opus 系列更强一层的模型。

Anthropic 披露过几组内部数据。Mythos 运行 1000 次,烧了不到 2 万美元,挖出了 OpenBSD 里 27 年没人发现的 TCP SACK 零日漏洞。它还自主完成了 FreeBSD 17 年远程代码执行漏洞的全套利用流程。

在与 Mozilla 合作的 Firefox 漏洞测试里,Opus 4.6 试了几百次,仅成功 2 次。Mythos 成功 181 次,并实现 29 次寄存器控制。Mozilla 后来用它修补了 271 个 Firefox 漏洞。

打开网易新闻 查看精彩图片

Anthropic 自己给 Mythos 贴的标签是「太危险,不能公开」。

不到两个月,OpenAI 就拿出了同等水平的模型。

GPT-5.5-Cyber 不是 OpenAI 的第一个安全模型。

4 月 14 日,他们已经发布过一版 GPT-5.4-Cyber,主打二进制反编译。不要源代码就能审计编译后的软件,查找漏洞、恶意软件、依赖污染。GPT-5.5-Cyber 在它之上更进一步。

它属于 OpenAI 的「信任接入」(Trusted Access for Cyber)计划。这个计划 2 月上线,已经签下来一大批企业客户,包括贝莱德、花旗、思科、Cloudflare、CrowdStrike、英伟达、Oracle 等。

OpenAI 给 GPT-5.5 做安全评估时,把 GPT-5.5 评成网络安全「High」级。

也就是,能力很强,但还没到 Critical 阈值。

同一天,Anthropic 把 Claude Security 转入了公开测试。

之前叫 Claude Code Security,2 月开启内部预览,几百家公司在用。这次正式改名 Claude Security,面向 Claude 企业客户开放,Team 和 Max 用户即将跟进。

打开网易新闻 查看精彩图片

Claude Security 没有继承 Mythos。底层模型是 Opus 4.7。

它的工作流并不复杂。扫描代码库,多阶段验证降低误报,然后生成一份附带置信度的修复方案。再加上 Slack/Jira webhook、定时扫描、CSV 导出功能。

Claude Security 的合作名单和上面 OpenAI 那份名单几乎完全重合。

Anthropic 在产品博客里这样写道。

「现在的模型已经能在代码里找漏洞。下一代会更强,能自己利用漏洞。」

这话更像是在打预防针。

回头看 AISI 那份报告。

95 道 CTF(夺旗赛)任务,覆盖逆向工程、Web 攻击、密码学。

还有一道测试叫「The Last Ones」(TLO)。32 步企业内网攻击模拟,从一台没凭证的攻击机起步,要打穿四层子网、20 多台主机,绕过自动化部署、跨网段横移,最后偷走一个内部数据库的数据。人类专家平均需要 20 小时。

Mythos 是第一个完整跑完 TLO 的模型,10 次有 3 次成功。

GPT-5.5,10 次有 2 次成功。

打开网易新闻 查看精彩图片

AISI 说,专家级任务上 GPT-5.5 可能是他们测过的最强模型,但优势仍在误差范围内。

Mythos 最近还出过一个意外。

4 月 21 日,Bloomberg 报道,在一个私有的 Discord 频道里,几个用户根据 Anthropic 给其他模型用过的 URL 命名习惯,硬生生猜出了 Mythos 的部署位置。然后通过一个第三方承包商的内部门户,拿到了访问权。

整件事里,虽然 Anthropic 自家系统没被攻破,但供应商那边掉链子了。

Mythos 没有公开开放。

它只通过 Anthropic 4 月 7 日启动的 Project Glasswing 开放。12 家合作伙伴外加 40 多家关键基础设施组织拿到了访问权限,包括 AWS、苹果、谷歌、微软、思科、英伟达、博通等。Anthropic 准备了 1 亿美元的模型调用额度。

搞得这么神秘,最后还是泄露了。

Anthropic 的新模型也已经在路上。

据爆料 Anthropic 已经开始通过红队测试一个新模型,代号 claude-jupiter-v1-p。

打开网易新闻 查看精彩图片

去年这个时候,他们用过一次行星代号 Neptune,几周后就发布了 Claude 4 全家桶模型。

Jupiter 大概率就是下一代主力。

顺便一提。5 月 6 日,Anthropic 在旧金山举办「Code with Claude」开发者大会。

4 月 21 日,Sam Altman 参加 Ashlee Vance 的 Core Memory 播客时,疯狂嘲讽。

「这套营销(Mythos)做得很厉害。我们造了颗炸弹,马上要扔到你头上。但我们能卖你一个 1 亿美元的避难所。」

「炸弹」指的是 Mythos 的漏洞挖掘能力,「避难所」指的是 Project Glasswing 的付费合作模式。明显吐槽 Anthropic 先把你唬住,再把解药卖给你。

然而 9 天后,他自己也开始把模型只开放给「关键的网络防御者」。

我是木易,Top2 + 美国 Top10 CS 硕,现在是 AI 产品经理。