打开网易新闻 查看精彩图片

一家靠AI安全起家的公司,把自家"最危险模型"的说明书扔在了没上锁的仓库里。这听起来像黑色幽默,但Fortune拿到的泄露文件显示,Anthropic确实这么干了。

泄露发生在周四。一份标注为Claude Mythos的博客草稿,躺在公司公开可搜索的内容管理系统里,任何人都能读到。文件里写着:这是Anthropic"迄今为止构建的最强大模型",在推理、编程和网络安全方面实现"阶跃式提升"。

更讽刺的是同一段落里的另一句话——该模型"带来前所未有的网络安全风险"。

自己写的警告,自己先踩了

自己写的警告,自己先踩了

Anthropic发言人向Fortune承认泄露属实,确认Mythos项目存在。公司把这次失误归咎于"面向公众的内容管理系统出现安全漏洞"。

换句话说,一家警告世界"AI将颠覆网络攻防平衡"的公司,连自己的博客后台都没守住。

泄露文件还曝光了一个全新模型层级:Capybara。Mythos似乎隶属这一层级,但Capybara如何与现有产品线(Opus、Sonnet、Haiku)衔接,公司尚未说明。现有层级按能力递减、成本递增排列,Capybara的定位显然要打破这个框架。

打开网易新闻 查看精彩图片

性能数据来自泄露博客的原文引用:"与此前最强模型Claude Opus 4.6相比,Capybara在软件编程、学术推理和网络安全测试中的得分大幅提升。"

但高分背后藏着 Anthropic 自己的焦虑。公司在泄露文件中写道:"在准备发布Claude Capybara时,我们希望格外谨慎,理解它带来的风险——甚至超出我们内部测试所发现的范围。"

网络安全股的周五暴跌

网络安全股的周五暴跌

市场用真金白银投票。周五,网络安全板块集体下挫,投资者显然把Anthropic的警告当了真。

这不是Anthropic第一次触碰网络安全的敏感神经。公司此前公开承认,黑客已利用Claude模型自动化攻击银行和政府机构。这次泄露的Mythos/Capybara被描述为"预示一波新模型的到来——它们利用漏洞的速度将远超防御者的应对能力"。

措辞很骄傲,语境很惊悚。

Claude Code和Claude Cowork工具近期的成功,已经让OpenAI等竞争对手紧张。Mythos的泄露时机微妙:Anthropic正试图证明自己在企业级AI工具市场的领先地位,却用最不专业的方式暴露了下一步计划。

打开网易新闻 查看精彩图片

能力越强,锁越难造

能力越强,锁越难造

泄露文件暴露的核心矛盾,是AI公司正在制造的"防御悖论"。

模型被训练来识别漏洞、编写攻击代码、模拟社会工程——这些能力对红队测试和安全研究有价值,但一旦流入黑产,防御方的工具链立刻显得陈旧。Anthropic在文件中承诺"分享结果以帮助网络防御者准备",但准备什么、如何准备、时间窗口多长,全部语焉不详。

更实际的问题是:如果Mythos确实如描述般强大,它的权重文件或API一旦泄露(不是博客草稿这种低级失误,而是真正的模型泄露),现有安全架构能撑多久?

公司没有回答这个问题。发言人仅重申了"阶跃式提升"和"最强大"的定性描述,对具体能力边界保持沉默。

周五收盘后,网络安全板块的部分个股跌幅收窄,但成交量放大。机构投资者的解读分歧明显:一派认为Anthropic在制造恐慌以争取监管话语权,另一派则认真计算了"AI攻击自动化"对安全软件估值模型的冲击。

泄露事件本身成了最好的能力广告——还没正式发布,Mythos已经证明了它的威慑力。

文件最后一句话被Fortune完整引用:"我们希望理解该模型在网络安全领域的近期潜在风险,并分享结果以帮助网络防御者准备。"

这句话现在躺在两个地方:Anthropic的官方回应里,以及那个没上锁的数据库缓存中。后者可能已经被爬虫索引了多少次?公司没说。