“现在,Claude编写的代码占我们合并进系统的代码总量的80%以上。”6月4日,成名于大模型Claude的Anthropic在官方博客抛出这个数字,几乎等于宣告了一种不可逆的趋势:构建AI的过程里,人类的角色正在不断缩小。在一篇题为《当AI开始自我构建》的文章中,这家前沿公司提出了一个清晰却令人不安的判断——AI系统可能已经逼近“递归自我改进”的临界点,即系统可以开始设计并构建自己的继任者,且仅需极少的人类参与。
Anthropic不会平白无故制造恐慌。它们给出了自己的内部数据作为佐证。在2025年初正式发布Claude Code之前,Claude在代码生成上的辅助作用还停留在个位数百分比的小打小闹阶段。但随着工具向Agent演化,情况突变。根据博文所述,每季度工程师们产出的代码量,已经是几年前的八倍左右。当AI开始大规模接手写代码的任务,下一步用这些代码去迭代和训练下一个版本的模型,逻辑上只有一步之遥。该公司警告,这种速度对社会的“巨大影响”近在眼前。
由此,Anthropic亮出了一个并不常见的立场:主动刹车。“我们认为,让世界拥有减缓或暂时暂停前沿AI发展的选项,是件好事,”该公司在博文中写道,“这样社会结构和对齐研究才能跟上技术前进的步伐。”它们模模糊糊勾勒出了一个“全球协调机制”的设想,核心是所有领先的实验室都必须参与,并且需要一种可信的方式来证明,它们真的慢下来了。至于具体怎么实现,Anthropic参考的只是一个松散的模板——《中程核导弹军控协议》。
这个提议在AI治理领域立即制造了一个尖锐的矛盾。任何降速都需要敌对的AI公司和多个国家的政府同时给自己套上缰绳,但眼下没有条约能约束任何一方,竞争只有不断加剧的迹象。况且,喊出这话的不像是一个旁观者,而更像是一场竞赛里的领跑者之一。这也让这声警告在技术层面无可挑剔,在政治层面布满棘刺。
“我不认为这是一个真诚的减速呼吁,”本特利大学数学系副教授、写过两本关于算法与社会著作的诺亚·詹西拉库萨直言不讳,“我们读过Anthropic首席执行官达里奥·阿莫迪的博客文章。我觉得,他恨不得全速向前冲。”这番质疑触及了一个根本信任问题:当一个前沿玩家大谈踩刹车时,它背后真实的想法是什么?是防备后来者,还是争取时间深化自家的对齐研究?对这块疑问,Anthropic没有回应《科学美国人》的置评请求,也未解释这套刹车机制究竟如何运作,以及如何回应外界对其系统能力言过其实的批评。
Anthropic在博客中的措辞也保留了一丝退路。“我们还没到那一步,递归式自我改进也不是必然发生的,”文章写道,“但它可能比大多数机构准备应对的时间点,来得更早。”这番表态把焦虑和观望缝在了一起。该公司指向自己作为警示信号:既然Claude已经负责写80%的代码,人类的工具型角色在每一层构建里都在收缩。失控的风险,就藏在这种不可察觉的递进中。
热门跟贴