Anthropic预警AI将开启递归自我迭代，呼吁设全球刹车机制|anthropic|代码|刹车机制|算法

“现在，Claude编写的代码占我们合并进系统的代码总量的80%以上。”6月4日，成名于大模型Claude的Anthropic在官方博客抛出这个数字，几乎等于宣告了一种不可逆的趋势：构建AI的过程里，人类的角色正在不断缩小。在一篇题为《当AI开始自我构建》的文章中，这家前沿公司提出了一个清晰却令人不安的判断——AI系统可能已经逼近“递归自我改进”的临界点，即系统可以开始设计并构建自己的继任者，且仅需极少的人类参与。

Anthropic不会平白无故制造恐慌。它们给出了自己的内部数据作为佐证。在2025年初正式发布Claude Code之前，Claude在代码生成上的辅助作用还停留在个位数百分比的小打小闹阶段。但随着工具向Agent演化，情况突变。根据博文所述，每季度工程师们产出的代码量，已经是几年前的八倍左右。当AI开始大规模接手写代码的任务，下一步用这些代码去迭代和训练下一个版本的模型，逻辑上只有一步之遥。该公司警告，这种速度对社会的“巨大影响”近在眼前。

由此，Anthropic亮出了一个并不常见的立场：主动刹车。“我们认为，让世界拥有减缓或暂时暂停前沿AI发展的选项，是件好事，”该公司在博文中写道，“这样社会结构和对齐研究才能跟上技术前进的步伐。”它们模模糊糊勾勒出了一个“全球协调机制”的设想，核心是所有领先的实验室都必须参与，并且需要一种可信的方式来证明，它们真的慢下来了。至于具体怎么实现，Anthropic参考的只是一个松散的模板——《中程核导弹军控协议》。

这个提议在AI治理领域立即制造了一个尖锐的矛盾。任何降速都需要敌对的AI公司和多个国家的政府同时给自己套上缰绳，但眼下没有条约能约束任何一方，竞争只有不断加剧的迹象。况且，喊出这话的不像是一个旁观者，而更像是一场竞赛里的领跑者之一。这也让这声警告在技术层面无可挑剔，在政治层面布满棘刺。

“我不认为这是一个真诚的减速呼吁，”本特利大学数学系副教授、写过两本关于算法与社会著作的诺亚·詹西拉库萨直言不讳，“我们读过Anthropic首席执行官达里奥·阿莫迪的博客文章。我觉得，他恨不得全速向前冲。”这番质疑触及了一个根本信任问题：当一个前沿玩家大谈踩刹车时，它背后真实的想法是什么？是防备后来者，还是争取时间深化自家的对齐研究？对这块疑问，Anthropic没有回应《科学美国人》的置评请求，也未解释这套刹车机制究竟如何运作，以及如何回应外界对其系统能力言过其实的批评。

Anthropic在博客中的措辞也保留了一丝退路。“我们还没到那一步，递归式自我改进也不是必然发生的，”文章写道，“但它可能比大多数机构准备应对的时间点，来得更早。”这番表态把焦虑和观望缝在了一起。该公司指向自己作为警示信号：既然Claude已经负责写80%的代码，人类的工具型角色在每一层构建里都在收缩。失控的风险，就藏在这种不可察觉的递进中。