几天前,一家网络安全公司的研究员 Roy Paz 像往常一样在网上扫描公开数据时,发现了一个原本不该被看到的东西:Anthropic 的内容管理系统里有一个文件夹被设置成了公开访问,里面有将近 3,000 个尚未发布的文件,其中包括一篇写好的博客草稿,草稿的主角是一个叫做 Claude Mythos 的新模型,以及一个全新的产品层级 Capybara。

产品层级是指 Anthropic 将其 AI 模型按照能力、速度和价格划分的不同版本,目前已有的三个层级:分别是最快最便宜的 Haiku、中等的 Sonnet 和最大最强大的 Opus,而新泄露的 Capybara 将是比 Opus 更高一级的新层级。

(来源:Anthropic)
打开网易新闻 查看精彩图片
(来源:Anthropic)

Capybara 是水豚,国内常常叫做卡皮巴拉,它是世界上最大的啮齿动物,性格较为温吞。Anthropic 给新模型起这个名字,显然不是图它可爱。

图 | 水豚(来源:维基百科)
打开网易新闻 查看精彩图片
图 | 水豚(来源:维基百科)

根据泄露的博客草稿,Capybara 更大、更聪明、也更贵。它在软件编程、学术推理和网络安全相关的测试中,得分大幅超过 Claude Opus 4.6。博客草稿里甚至使用了“这是迄今为止我们开发过的最强大的 AI 模型”这样的措辞。

Anthropic 的发言人随后向财经媒体 Fortune 确认了这件事。他们承认模型确实存在,并表示目前正在训练中,已经开始给一小批早期客户测试。发言人还说,这个模型代表了 AI 性能的一次阶跃式变化,是他们截至目前造出的最强大的产品,泄露的原因被归结为内容管理系统配置时的人为失误。

博客草稿里有这样一段带有提醒意味的话,那就是这个模型“在网络安全能力上远远领先于其他任何 AI 模型”,这种新模型预示着接下来会出现这样一批 AI,这批 AI 在发现和利用安全漏洞上的速度,会比防御方修复漏洞的速度快得多。换句话说,黑客利用这类 AI 来寻找网络漏洞的速度,会远远跑在安全工程师前面。

所以 Anthropic 很担心黑客会利用这个模型发动大规模网络攻击。因此,他们此次采用了这样的发布策略,先开放给组织做早期测试,让防御方提前做好准备,以便应对即将带来的 AI 驱动漏洞共计浪潮。

消息传开之后的周五,网络安全股集体跳水。Cloudflare、CrowdStrike、Palo Alto Networks 等网络安全公司股价纷纷下跌。

人们主要担心的两件事,一是担心 Anthropic 自己下场做安全工具会抢生意,二是这个模型落到黑客手里会酿成灾难。不过,华尔街分析师很快出来灭火,说市场误读了这条新闻,还说如果 AI 真的构成了安全威胁那就更应该买入最强的网络安全公司来挡一挡。

然而,Anthropic 对于安全问题的警惕不是空穴来风。今年早些时候,一个黑客利用 Anthropic 的 AI 模型针对墨西哥政府发起了一系列攻击,窃取了敏感的税务信息和选民信息。Anthropic 后来调查并封掉了相关账号。

上个月,Anthropic 还发布了一个叫做 Claude Code Security 的工具,专门帮助开发者扫描代码库里的安全漏洞。Anthropic 自己的工程师也使用 Opus 4.6 在开源项目里找到了 500 多个高危漏洞,有一次甚至通过分析变更日志里的一条开发者注释,推断出 PDF 工具里藏着一个漏洞。

说回这次博客草稿的泄露,草稿还意外曝光了一场即将在英国举行的 CEO 闭门峰会,这个为期两天的聚会将在英格兰乡村一座 18 世纪庄园改建的酒店里举行,届时将邀请欧洲最有影响力的商界领袖,也会有立法者和政策制定者来讲解企业 AI 使用建议,与会者还能提前体验未发布的 Claude 新能力。Anthropic 确认这个活动确实存在,并表示是他们过去一年的系列活动的延续。

此次博客草稿泄露的几天前,OpenAI 刚被曝完成了一个内部代号为 Spud 的新模型的预训练,预计几周内发布。两家美国头部 AI 公司的新模型几乎同时浮出水面,并且都指向同一个方向:更强的推理能力、更强的代码能力以及更强的网络安全双刃剑属性。

只不过 Anthropic 选择了更谨慎的路线,先给早期客户测试,先让防御方做好准备,这也和 Anthropic 及其创始人达里奥重视安全的作风一脉相承。

不知道 Anthropic 是否有意给新模型起了水豚这样一个的名字,水豚虽然性格平和,天生不具备攻击性,但在某些情况下也会出于自卫而咬人。不过可以肯定的是,Anthropic 也是在提醒大家面对 AI 安全千万不可大意。

参考资料:

https://fortune.com/2026/03/26/anthropic-says-testing-mythos-powerful-new-ai-model-after-data-leak-reveals-its-existence-step-change-in-capabilities/

https://siliconangle.com/2026/03/27/anthropic-launch-new-claude-mythos-model-advanced-reasoning-features/

https://www.marketwatch.com/story/palo-alto-networks-and-other-cybersecurity-stocks-slide-on-fresh-anthropic-fears-investors-may-be-overreacting-e0624b0b

https://www.bloomberg.com/news/articles/2026-03-27/cyber-stocks-sink-on-report-anthropic-model-poses-security-risks

https://www.livemint.com/technology/tech-news/meet-claude-mythos-anthropic-accidentally-leaks-unreleased-ai-model-with-severe-cybersecurity-risks-11774601003808.html

https://zh.wikipedia.org/wiki/%E6%B0%B4%E8%B1%9A#/media/File:Cattle_tyrant_(Machetornis_rixosa)_on_Capybara.jpg

排版:胡巍巍