6月5日,Anthropic发表了一篇警示文章,《When AI buildes itself》,当 AI 开始建造自己,不禁要思考,我们人类角色将如何改变?

在 AI 发展的历史中,人类长期主导着每一个开发环节。但如今,在 Anthropic,我们正将越来越多的AI开发工作委托给AI系统自身,这极大加速了我们的工作进展。

打开网易新闻 查看精彩图片

图源:Anthropic

汉化:MarsKr

如果这一趋势走得足够远,再配合充足的算力,最终可能诞生一个完全自主设计并开发自身继任者的AI系统,这就是递归自我改进(Recursive Self-Improvement)。

我们尚未完全抵达这一步,且它并非必然发生。但Anthropic Institute的最新报告显示:这一趋势可能比大多数机构预想的来得更早

AI已在显著加速AI自身的开发。一个最直观的例子是:如今Anthropic工程师平均每个季度输出的代码量,是2021-2025年期间的8倍

这些趋势意味着AI能力将在未来几年大幅跃升。它可能带来科学、医疗等领域的巨大福祉,但也可能大幅增加人类失去对AI控制的风险。当系统能自主构建后继者时,安全、监控和行为引导将变得至关重要。

01

—外部世界的证据:AI能力加速提升

AI 模型能可靠独立完成的任务长度,正在每4个月翻一番(此前是每 7 个月)。

2024年3月:Claude Opus 3 可完成人类约 4 分钟的任务;

2025年:Claude Sonnet 3.7 可处理约 1.5 小时的任务;

2026年:Claude Opus 4.6 已能应对 12 小时的任务。

打开网易新闻 查看精彩图片

图源:Anthropic

汉化:MarsKr

若趋势延续,今年内 AI 就可能处理需人类数天完成的任务;2027年,甚至可能达到数周量级。

在基准测试上也呈现饱和趋势:

SWE-bench(真实软件工程):两年内从个位数得分到接近饱和;CORE-Bench(科研复现):15 个月内从 20% 成功率到接近饱和;METR 测试显示,Claude Mythos Preview 已能连续工作至少 16 小时

02

—Anthropic内部证据:AI已深度参与开发

构建前沿模型主要分为工程(写代码、搭建基础设施、训练模型)和研究(设计实验、解读结果、决定下一步)两大类。

在工程领域:Claude能接手不完全明确的问题,自主找出解决方案。人类只需提供目标,无需提供具体方法。

在研究领域:Claude已能在执行明确实验时匹配甚至超越熟练人类,但在大方向判断和目标选择上,仍存在明显差距。这正是当前AI与“自主设计继任者”之间的关键鸿沟。

代码产出爆炸式增长

截至2026年5月,Anthropic合并到主代码库的代码中, 超过80%由Claude撰写(2025年2月Claude Code推出前,这一比例仅为个位数)。

2025年开始,工程师每天合并的代码行数显著上升;2026年,随着模型自主工作时间延长,斜率进一步陡峭。

2026年第二季度,典型工程师的日代码合并量是2024年的 8倍

打开网易新闻 查看精彩图片

图源:Anthropic

汉化:MarsKr

尽管代码行数不是完美指标(更重视质量而非数量),但这清晰反映了生产力加速。员工主观调查也显示:2026年3月,中位员工认为使用Mythos Preview后,产出提升约4倍

Claude不仅写得多,还写得越来越好:

工程师干预、纠正Claude的比例持续下降。

在最开放的任务上,2026年5月成功率达 76%(半年提升50个百分点)。

示例:一次例行升级导致数万训练任务崩溃,Claude仅用约2小时就定位问题并修复(人类通常需2-3天)。

代码质量方面:2025年底Claude代码略逊于人类,如今已接近持平,预计年内将超越。Anthropic现在使用Claude自动审查代码变更,甚至能捕捉到顶尖工程师之前遗漏的部分bug。

研究能力同样突飞猛进

在优化明确实验目标时,Claude从2025年的~3x加速提升到2026年的~52x(人类熟练研究员需4-8小时达4x)。

2026年4月,Claude驱动的代理完成了首个端到端开放研究项目:在AI安全问题上,自主提出假设、测试、迭代,恢复了97%的性能差距(人类两名研究员一周约23%)。

在开放调查任务中,模型判断“下一步最佳行动”的能力也在提升。

一位Anthropic员工感慨:“我大约一年前开始深度依赖Claude,现在已经5个月没亲自写代码了。”

03

—未来工作形态:人类角色正在收窄

证据显示,人类在AI开发各环节中的角色正在缩小:

代码质量持平后,人类可能彻底停止写代码,转向审查。但审查速度若跟不上生成速度,将成为新瓶颈。

实验执行自动化后,瓶颈转向“哪些实验值得做”。

人类当前的比较优势在于研究品位与判断力:选择重要问题、判断结果可信度、识别死胡同等。

但即使人类仅负责“方向设定”,AI也能让每个人“驾驭”远超以往的工作量,从而实现复合加速。

04

—三种可能的未来

趋势放缓,但当前能力广泛扩散

指数曲线可能转为S曲线,规模收益递减。新架构或供应链(能源、芯片)成为限制。即使能力冻结在当前水平,世界也会巨变:100人公司可做1000人公司的事,网络安全等领域的瓶颈已从“发现漏洞”转向“快速修复”。

持续复合效率提升

AI开发高度自动化,人类负责方向与判断。组织生产力大幅跃升,知识工作和政府服务将被重塑。但同时可能被用于监控、操纵等有害用途。瓶颈会转移(Amdahl定律),如何快速识别并解决新瓶颈将成为关键能力。

完全递归自我改进

AI自主设计继任者,进步速度由算力决定。人类转向监督与验证,“虚拟实验室”主导研发。这一能力将快速转移到其他科学领域。经济和社会形态可能剧变,但许多现实瓶颈(如临床试验、治理节奏)仍由人类世界决定。

05

—我们该怎么办?

如果能有效放缓前沿AI开发,为社会适应和对齐研究赢得时间,将是好事。但单方面放缓可能让最不谨慎的行动者领先。

Anthropic认为,建立可验证的全球协调机制至关重要。我们将开展研究并推动构建相关系统,以便在多国前沿实验室达成一致时,能可靠验证各方确实暂停或放缓开发。

打开网易新闻 查看精彩图片

图源:Anthropic

汉化:MarsKr

未来几个月,我们将组织政策制定者、研究者、公民社会和AI公司的对话,共同探讨递归自我改进的含义及协调方案。欢迎更多外部声音参与这场至关重要的审议。

AI的未来,不仅取决于技术,更取决于我们今天的选择。

参考

https://www.anthropic.com/institute/recursive-self-improvement