光速打脸！刚嘲讽完 Anthropic，Sam Altman 连夜祭出自家「AI 黑客」|ai黑客|altman|anthropic|sam|人工智能模型|源代码|网络安全

来源：市场资讯

（来源：AI信息Gap）

Sam Altman 又官宣了。

4 月 30 日，他深夜发文，「一个全新的网络安全模型 GPT-5.5-Cyber 将会在几天内推送给关键的网络防御者。」

几乎同一时间，Anthropic 的 Claude Security（一款安全扫描工具）向企业用户开放公测，之前是内部预览阶段。

两个 AI 巨头，把目光同时对准了网络安全。

英国 AI 安全研究所（AISI）测试了 95 道网安任务，专家级通过率，GPT-5.5 71.4%，Claude Mythos Preview 68.6%。AISI 在博客里写道，「GPT-5.5 可能是他们测过的最强模型。」

其中一个任务，人类专家平均要 12 小时。GPT-5.5 用了 11 分钟，花费 1.73 美元。

关键不是 71.4% 这个数字。关键是，这还是第一次有模型追上 Mythos。

Mythos 是 Anthropic 4 月 7 日发布的「AI 核武器」，定位是比 Claude Opus 系列更强一层的模型。

Anthropic 披露过几组内部数据。Mythos 运行 1000 次，烧了不到 2 万美元，挖出了 OpenBSD 里 27 年没人发现的 TCP SACK 零日漏洞。它还自主完成了 FreeBSD 17 年远程代码执行漏洞的全套利用流程。

在与 Mozilla 合作的 Firefox 漏洞测试里，Opus 4.6 试了几百次，仅成功 2 次。Mythos 成功 181 次，并实现 29 次寄存器控制。Mozilla 后来用它修补了 271 个 Firefox 漏洞。

Anthropic 自己给 Mythos 贴的标签是「太危险，不能公开」。

不到两个月，OpenAI 就拿出了同等水平的模型。

GPT-5.5-Cyber 不是 OpenAI 的第一个安全模型。

4 月 14 日，他们已经发布过一版 GPT-5.4-Cyber，主打二进制反编译。不要源代码就能审计编译后的软件，查找漏洞、恶意软件、依赖污染。GPT-5.5-Cyber 在它之上更进一步。

它属于 OpenAI 的「信任接入」（Trusted Access for Cyber）计划。这个计划 2 月上线，已经签下来一大批企业客户，包括贝莱德、花旗、思科、Cloudflare、CrowdStrike、英伟达、Oracle 等。

OpenAI 给 GPT-5.5 做安全评估时，把 GPT-5.5 评成网络安全「High」级。

也就是，能力很强，但还没到 Critical 阈值。

同一天，Anthropic 把 Claude Security 转入了公开测试。

之前叫 Claude Code Security，2 月开启内部预览，几百家公司在用。这次正式改名 Claude Security，面向 Claude 企业客户开放，Team 和 Max 用户即将跟进。

Claude Security 没有继承 Mythos。底层模型是 Opus 4.7。

它的工作流并不复杂。扫描代码库，多阶段验证降低误报，然后生成一份附带置信度的修复方案。再加上 Slack/Jira webhook、定时扫描、CSV 导出功能。

Claude Security 的合作名单和上面 OpenAI 那份名单几乎完全重合。

Anthropic 在产品博客里这样写道。

「现在的模型已经能在代码里找漏洞。下一代会更强，能自己利用漏洞。」

这话更像是在打预防针。

回头看 AISI 那份报告。

95 道 CTF（夺旗赛）任务，覆盖逆向工程、Web 攻击、密码学。

还有一道测试叫「The Last Ones」（TLO）。32 步企业内网攻击模拟，从一台没凭证的攻击机起步，要打穿四层子网、20 多台主机，绕过自动化部署、跨网段横移，最后偷走一个内部数据库的数据。人类专家平均需要 20 小时。

Mythos 是第一个完整跑完 TLO 的模型，10 次有 3 次成功。

GPT-5.5，10 次有 2 次成功。

AISI 说，专家级任务上 GPT-5.5 可能是他们测过的最强模型，但优势仍在误差范围内。

Mythos 最近还出过一个意外。

4 月 21 日，Bloomberg 报道，在一个私有的 Discord 频道里，几个用户根据 Anthropic 给其他模型用过的 URL 命名习惯，硬生生猜出了 Mythos 的部署位置。然后通过一个第三方承包商的内部门户，拿到了访问权。

整件事里，虽然 Anthropic 自家系统没被攻破，但供应商那边掉链子了。

Mythos 没有公开开放。

它只通过 Anthropic 4 月 7 日启动的 Project Glasswing 开放。12 家合作伙伴外加 40 多家关键基础设施组织拿到了访问权限，包括 AWS、苹果、谷歌、微软、思科、英伟达、博通等。Anthropic 准备了 1 亿美元的模型调用额度。

搞得这么神秘，最后还是泄露了。

Anthropic 的新模型也已经在路上。

据爆料 Anthropic 已经开始通过红队测试一个新模型，代号 claude-jupiter-v1-p。

去年这个时候，他们用过一次行星代号 Neptune，几周后就发布了 Claude 4 全家桶模型。

Jupiter 大概率就是下一代主力。

顺便一提。5 月 6 日，Anthropic 在旧金山举办「Code with Claude」开发者大会。

4 月 21 日，Sam Altman 参加 Ashlee Vance 的 Core Memory 播客时，疯狂嘲讽。

「这套营销（Mythos）做得很厉害。我们造了颗炸弹，马上要扔到你头上。但我们能卖你一个 1 亿美元的避难所。」

「炸弹」指的是 Mythos 的漏洞挖掘能力，「避难所」指的是 Project Glasswing 的付费合作模式。明显吐槽 Anthropic 先把你唬住，再把解药卖给你。

然而 9 天后，他自己也开始把模型只开放给「关键的网络防御者」。

我是木易，Top2 + 美国 Top10 CS 硕，现在是 AI 产品经理。

光速打脸！刚嘲讽完 Anthropic，Sam Altman 连夜祭出自家「AI 黑客」

热搜

热门跟贴

热搜

热门跟贴

相关推荐

杨立昆开喷 Anthropic CEO：别信那个卖AI的人

外网疯传这段采访，AI圈最不敢公开的真相被捅破了

60 人账号一夜被封，所有使用 AI 的人都该看看这件事

他用AI把开发速度拉满，大脑却开始"生锈"

AI预言正在成为现实：99%人将被淘汰，仅三类人能成功突围

自从有了Ai，小时候的动画片算是白看了

任正非没想到：被华为抛弃者今掌控全球AI命脉

巴西小伙骑摩托有两把刷子，要不知道有Ai，我还就真的信了！

AI再牛逼也白搭，没感情这玩意儿，就是废铁

开盒Claude Code的原来是中国00后！曾怒怼Anthropic窃取用户代码

从高中社团起步，三个00后天才研发网络勒索病毒“疫苗”，帮企业从黑客手中“抢”数据 | 水下项目

6小时，200美元，0人类代码：Anthropic把AI编程推过了临界点

马斯克的Grok 4.3悄悄上线，跑分评测出炉

AI能改10万行代码，却让你走路去洗车！Karpathy戳破「锯齿状智能」

Anthropic惊悚报告：当AI开始破坏实验室代码，人类已无险可守

神经计算机横空出世：AI不再调用软件，而是直接长成一台计算机

黄仁勋的“五层蛋糕”：AI的底层战争，是能源战争（附全文）

图灵奖得主：劝年轻人别学计算机，行业红利正在消失

AI主权的底层战争：全同态加密正在成为新基础设施

MIT校友用AI帮人接电话，竟做成了一家独角兽