安全报告发布前三天,它提交了IPO申请
2026年6月4日,Anthropic Institute发布了一篇文章/报告,题目叫《When AI builds itself》(可译作《当AI开始构建自身》)。
核心论点:截至2026年5月,Anthropic生产代码库中新合并的代码,超过80%由Claude编写(Anthropic内部测量值,未经外部同行评审)。如果AI辅助AI开发的飞轮继续加速,又缺乏外部约束,就可能逼近"递归自我改进"临界点。所以它呼吁建立可验证的减速或暂停机制。
但这份安全文章发布前三天——6月1日——Anthropic刚秘密递交IPO文件(据Fortune等媒体报道)。它此前一轮融资后的估值约9650亿美元;IPO最终估值、发行规模和价格尚未确定。
"安全"是Anthropic的护城河,不是成本
这个时间顺序可以解读成巧合。但有一件事不是巧合:Anthropic从第一天起,就把"安全"写进了商业模式。
Dario和Daniela Amodei兄妹2021年离开OpenAI时,外界普遍把他们与OpenAI的分歧理解为"商业压力会不会挤压安全研究"。这个叙事一出,Anthropic就成了AI行业里那家把安全当回事的公司。它的企业客户和大客户付费规模持续扩大,部分旗舰模型的价格也长期处在高位。
溢价叙事来自哪里?很大一部分来自"更安全、更可信赖"。
"安全"不是单纯的道德成本,也可以是收取溢价的理由,是可以写进招股书叙事里的护城河。每发一次安全报告,这块地基夯实一次。
这次文章/报告由Anthropic Institute发布,关键数据来自内部,没有外部同行评审。那个80%,是他们自己测量、自己公布的。
说你有炸弹,卖你防空洞
OpenAI的CEO Sam Altman在2026年4月Core Memory播客里评价很直白:"这显然是令人难以置信的营销——说'我们造了一颗炸弹,马上要扔在你头上,我们可以用1亿美元卖给你一个防空洞。'"
这话刻薄,但现实里的张力并不比这句话弱:在这次安全文章之前,Anthropic已经发布/展示过受限访问的Mythos Preview。这个模型能自主发现并利用零日漏洞——据Anthropic安全团队披露,它独立找到了一个存在17年的FreeBSD远程代码执行漏洞,还展示过浏览器沙箱逃逸级别的复杂漏洞利用能力。
"暂停"声明还没落地,产品能力已经被展示出来了。
这不是简单的虚伪,这在结构上更接近利益耦合——动机和立场方向一致,不一定需要撒谎,只要同时推进两套动作,张力就已经出现了。
这不是阴谋,这是古老的剧本
1954年,美国烟草公司联合发表声明,承诺成立行业委员会"自主调查"健康风险。事后文件证明,这是拖延公共监管的策略,真正的监管二十年后才来。
2009年,华尔街大银行高调支持金融监管改革,部分分析认为Dodd-Frank之后的资本、合规与风控门槛,更有利于已经具备合规能力的大型机构,客观上也给后来者设置了更高门槛(机制推断,学界仍有争议)。
这里的商业逻辑相似:很多时候,最有能力呼吁监管的,恰恰是最先具备合规能力的一方。
如果"AI安全审查"成为行业进入的前提,有安全话语资产的Anthropic更容易通过,后来者的合规门槛会被抬高。它未必需要反对监管;只要能率先影响监管标准,就可能把监管变成门槛。
打安全牌→企业溢价采购→安全叙事进招股书→资本市场给护城河估值→上一轮融资估值逼近万亿美元。
"呼吁暂停"是这条链上的一个节点,不是成本。
真诚地相信,也真诚地获利
我不是在说Anthropic在撒谎。
Dario Amodei可能真的相信AI危险,"真诚相信危险"和"从危险叙事中获利"不互斥——外界很难简单指责一个人说"你不该真诚相信"。这比单纯的虚伪更难被拆穿。
问题从来不是有没有诚意。问题是:谁有权定义危险?谁从定义中获利? 定义权和获利权在同一家公司手里,在我看来,这份报告的价值就不完全是它自称的那个价值。
这个逻辑不会因为你不喜欢就消失。
你信Anthropic这次说的吗——真心警告,还是最贵的一次品牌公关?
泼最后一盆冷水:AI危不危险是真问题。但"谁来定义危险"和"AI是否危险"是两件事——全球监管讨论把这两件事混在一起了。至少目前,最有能力参与定义这个问题的,仍然是砸了最多钱做AI的那几家公司。后一个,还没人能认真回答。
热门跟贴