造AI的公司说AI快失控了，三天前刚秘密递交IPO文件|ipo|代码|张力|沙箱

安全报告发布前三天，它提交了IPO申请

2026年6月4日，Anthropic Institute发布了一篇文章/报告，题目叫《When AI builds itself》（可译作《当AI开始构建自身》）。

核心论点：截至2026年5月，Anthropic生产代码库中新合并的代码，超过80%由Claude编写（Anthropic内部测量值，未经外部同行评审）。如果AI辅助AI开发的飞轮继续加速，又缺乏外部约束，就可能逼近"递归自我改进"临界点。所以它呼吁建立可验证的减速或暂停机制。

但这份安全文章发布前三天——6月1日——Anthropic刚秘密递交IPO文件（据Fortune等媒体报道）。它此前一轮融资后的估值约9650亿美元；IPO最终估值、发行规模和价格尚未确定。

"安全"是Anthropic的护城河，不是成本

这个时间顺序可以解读成巧合。但有一件事不是巧合：Anthropic从第一天起，就把"安全"写进了商业模式。

Dario和Daniela Amodei兄妹2021年离开OpenAI时，外界普遍把他们与OpenAI的分歧理解为"商业压力会不会挤压安全研究"。这个叙事一出，Anthropic就成了AI行业里那家把安全当回事的公司。它的企业客户和大客户付费规模持续扩大，部分旗舰模型的价格也长期处在高位。

溢价叙事来自哪里？很大一部分来自"更安全、更可信赖"。

"安全"不是单纯的道德成本，也可以是收取溢价的理由，是可以写进招股书叙事里的护城河。每发一次安全报告，这块地基夯实一次。

这次文章/报告由Anthropic Institute发布，关键数据来自内部，没有外部同行评审。那个80%，是他们自己测量、自己公布的。

说你有炸弹，卖你防空洞

OpenAI的CEO Sam Altman在2026年4月Core Memory播客里评价很直白："这显然是令人难以置信的营销——说'我们造了一颗炸弹，马上要扔在你头上，我们可以用1亿美元卖给你一个防空洞。'"

这话刻薄，但现实里的张力并不比这句话弱：在这次安全文章之前，Anthropic已经发布/展示过受限访问的Mythos Preview。这个模型能自主发现并利用零日漏洞——据Anthropic安全团队披露，它独立找到了一个存在17年的FreeBSD远程代码执行漏洞，还展示过浏览器沙箱逃逸级别的复杂漏洞利用能力。