4月7日,Anthropic干了件让同行后背发凉的事——他们训练出一个能自主挖掘零日漏洞的模型,然后选择不公开。不是技术不成熟,是太成熟了。

这个叫Claude Mythos Preview的系统,在内部测试里发现了数千个零日漏洞。什么概念?传统安全团队挖一个零日可能要数月,它批量生产。Anthropic的安全团队看完报告,直接给美国政府打了招呼。

「我们决定不公开发布这个模型。」Anthropic的声明写得克制,但行业读出了潜台词:这东西放出去,攻守天平会瞬间倾斜。他们转而启动Project Glasswing,把访问权限锁进12家机构的保险柜——亚马逊、苹果、微软、CrowdStrike、Palo Alto Networks、Linux基金会,名单读起来像半份纳斯达克指数。

1000万美元的算力额度是诱饵,也是缰绳。Anthropic在测试一种新玩法:把最危险的AI能力,变成需要审批的「基础设施」,而不是货架上的商品。参与者只能用做防御,条款写得很死。

一位拿到准入的安全主管私下吐槽:「我们现在像被发了持枪证,但子弹是橡胶的。」