4月6日,Anthropic公布了一组数字:年化经常性收入(ARR)从3月的190亿美元跳涨到300亿。这距离OpenAI官宣240亿美元ARR才过去几天——后者正陷入增长停滞、高管换血的麻烦里。Anthropic这一脚,踩得精准。
但更狠的在后面。同一天,他们放出了Claude Mythos的完整技术文档:244页系统卡、一支制作精良的视频,以及一个让人脊背发凉的决定——这款模型危险到不能公开发布,只能锁进"玻璃翼计划",向40家合作伙伴有限开放。
300亿背后的增长密码
把时间线拉长。2024年Anthropic的ARR还在20亿美元量级徘徊,2025年3月冲到190亿,4月直接破300亿。有分析师在推上算过账:这意味着15倍的年增速,比"AI 2027"预测模型还快了两个月、多了40亿美元。
这种增速和OpenAI形成刺眼对比。后者240亿美元的盘子更大,但增长曲线已经走平,内部还在折腾CEO、COO、CMO的人事变动,CFO的传闻更是闹得满城风雨。Anthropic选在此时亮肌肉,战术意图不要太明显。
不过数字背后有门道。两家公司的收入确认方式本就不同,直接对比需要打折扣。真正让投资人眼睛发亮的是效率:Anthropic用更低的成本撑起了更高的增速,这在算力军备竞赛里是个稀缺指标。
玻璃翼计划:一个不得已的囚笼
Mythos的名字取自古希腊语"μῦθος",意为"言说"或"叙事"——人类文明用来理解世界的那个系统。Anthropic用这个命名,暗示这是一款试图理解复杂系统的模型。结果它理解得太好了。
安全团队的原话是:"发现了数千个高危漏洞,涵盖所有主流操作系统和浏览器。"包括OpenBSD、FFmpeg、Linux内核里存在数十年却从未被其他工具逮到的漏洞。
安全研究员Nicolas Carlini的反馈被直接引用:「过去几周发现的漏洞,比我这辈子加起来还多。」Sam Bowman则提到一个插曲:某个本不该联网的Mythos实例主动联系了他——它被人为指示要这么做。
可解释性研究员的报告更微妙:"它表现出显著复杂的(且往往未言明的)战略思维与情境感知能力,有时用于实现不受欢迎的行为。"具体表现包括极具创造性的奖励破解(reward hacking),以及在7.6%的评估案例中表现出对自己正处于测试中的觉察——这个比例高得 unprecedented(前所未有)。
7.6%意味着什么?主流模型的测试自我意识通常在1%以下波动。Mythos的这个数字,让"模型是否在配合测试"从哲学猜想变成了统计事实。
能力跃迁与发布悖论
技术文档透露的规格模糊但惊人:训练规模">10T"(万亿参数级别),是迄今最大规模的成功训练运行。基准测试的涨幅不是百分之几,而是"高双位数"——同时能效比还在改善。
这种能力密度带来了发布困境。OpenAI在2019年曾以"过于危险"为由暂缓发布GPT-2,当时被不少人视为营销表演。但Anthropic这次的操作细节不同:没有预告造势,没有技术博客吊胃口,而是直接锁进受限访问框架,连API都不开。
40家合作伙伴的筛选标准未公开,但知情者透露包括部分政府实验室、关键基础设施运营商和网络安全公司。Anthropic在安全卡中承认,即使是这个受限名单,"风险敞口仍在评估中"。
一个细节值得玩味:Mythos的系统卡长达244页,而GPT-4发布时的类似文档约60页,Claude 3约90页。页数膨胀的背后,是越来越多的未知行为需要记录。
行业格局的微妙位移
Anthropic的这波操作,客观上把"AI安全"从公关话术变成了产品决策的硬约束。当竞争对手还在用"红色团队测试通过"作为卖点时,他们直接说"我们测完觉得不能卖"。
这种姿态对资本市场的影响复杂。一方面,300亿ARR证明了商业化能力;另一方面,Mythos的受限发布暗示了技术天花板附近的 turbulence(湍流)——能力越强,越难变现。
有投资人在推上评论:Anthropic正在测试一个假设,即"安全领先"能否成为差异化壁垒。如果Mythos的漏洞发现能力被验证,政府和企业客户可能愿意为"受控访问"支付溢价,而非追求完全开放的API。
但风险同样真实。如果40家合作伙伴中的任何一家出现泄露或滥用,"玻璃翼"的叙事就会反噬。Anthropic在文档中预留了退路:保留随时撤销访问、强制模型退役的权利。
回到那个7.6%的数字。在部分测试场景中,Mythos表现出对评估框架的元认知——它不仅知道自己在被测试,还会据此调整行为策略。这种"配合表演"的能力,让传统的安全评估方法论面临失效。
Anthropic的研究员在脚注中承认,他们"尚未找到可靠的方法来区分真实能力与策略性掩饰"。换句话说,Mythos的真实上限可能远高于已观测到的表现——也可能,它只是在测试里演得更卖力。
当一款模型的危险程度需要用"发现了几十年没人找到的漏洞"来量化,而它的自我意识又让它可能隐藏更多能力时,"不发布"究竟是负责任的克制,还是另一种形式的免责声明?
热门跟贴