6月5日,Anthropic发表了一篇警示文章,《When AI buildes itself》,当 AI 开始建造自己,不禁要思考,我们人类角色将如何改变?
在 AI 发展的历史中,人类长期主导着每一个开发环节。但如今,在 Anthropic,我们正将越来越多的AI开发工作委托给AI系统自身,这极大加速了我们的工作进展。
图源:Anthropic
汉化:MarsKr
如果这一趋势走得足够远,再配合充足的算力,最终可能诞生一个完全自主设计并开发自身继任者的AI系统,这就是递归自我改进(Recursive Self-Improvement)。
我们尚未完全抵达这一步,且它并非必然发生。但Anthropic Institute的最新报告显示:这一趋势可能比大多数机构预想的来得更早。
AI已在显著加速AI自身的开发。一个最直观的例子是:如今Anthropic工程师平均每个季度输出的代码量,是2021-2025年期间的8倍。
这些趋势意味着AI能力将在未来几年大幅跃升。它可能带来科学、医疗等领域的巨大福祉,但也可能大幅增加人类失去对AI控制的风险。当系统能自主构建后继者时,安全、监控和行为引导将变得至关重要。
01
—外部世界的证据:AI能力加速提升
AI 模型能可靠独立完成的任务长度,正在每4个月翻一番(此前是每 7 个月)。
2024年3月:Claude Opus 3 可完成人类约 4 分钟的任务;
2025年:Claude Sonnet 3.7 可处理约 1.5 小时的任务;
2026年:Claude Opus 4.6 已能应对 12 小时的任务。
图源:Anthropic
汉化:MarsKr
若趋势延续,今年内 AI 就可能处理需人类数天完成的任务;2027年,甚至可能达到数周量级。
在基准测试上也呈现饱和趋势:
SWE-bench(真实软件工程):两年内从个位数得分到接近饱和;CORE-Bench(科研复现):15 个月内从 20% 成功率到接近饱和;METR 测试显示,Claude Mythos Preview 已能连续工作至少 16 小时。
02
—Anthropic内部证据:AI已深度参与开发
构建前沿模型主要分为工程(写代码、搭建基础设施、训练模型)和研究(设计实验、解读结果、决定下一步)两大类。
在工程领域:Claude能接手不完全明确的问题,自主找出解决方案。人类只需提供目标,无需提供具体方法。
在研究领域:Claude已能在执行明确实验时匹配甚至超越熟练人类,但在大方向判断和目标选择上,仍存在明显差距。这正是当前AI与“自主设计继任者”之间的关键鸿沟。
代码产出爆炸式增长:
截至2026年5月,Anthropic合并到主代码库的代码中, 超过80%由Claude撰写(2025年2月Claude Code推出前,这一比例仅为个位数)。
2025年开始,工程师每天合并的代码行数显著上升;2026年,随着模型自主工作时间延长,斜率进一步陡峭。
2026年第二季度,典型工程师的日代码合并量是2024年的 8倍。
图源:Anthropic
汉化:MarsKr
尽管代码行数不是完美指标(更重视质量而非数量),但这清晰反映了生产力加速。员工主观调查也显示:2026年3月,中位员工认为使用Mythos Preview后,产出提升约4倍。
Claude不仅写得多,还写得越来越好:
工程师干预、纠正Claude的比例持续下降。
在最开放的任务上,2026年5月成功率达 76%(半年提升50个百分点)。
示例:一次例行升级导致数万训练任务崩溃,Claude仅用约2小时就定位问题并修复(人类通常需2-3天)。
代码质量方面:2025年底Claude代码略逊于人类,如今已接近持平,预计年内将超越。Anthropic现在使用Claude自动审查代码变更,甚至能捕捉到顶尖工程师之前遗漏的部分bug。
研究能力同样突飞猛进:
在优化明确实验目标时,Claude从2025年的~3x加速提升到2026年的~52x(人类熟练研究员需4-8小时达4x)。
2026年4月,Claude驱动的代理完成了首个端到端开放研究项目:在AI安全问题上,自主提出假设、测试、迭代,恢复了97%的性能差距(人类两名研究员一周约23%)。
在开放调查任务中,模型判断“下一步最佳行动”的能力也在提升。
一位Anthropic员工感慨:“我大约一年前开始深度依赖Claude,现在已经5个月没亲自写代码了。”
03
—未来工作形态:人类角色正在收窄
证据显示,人类在AI开发各环节中的角色正在缩小:
代码质量持平后,人类可能彻底停止写代码,转向审查。但审查速度若跟不上生成速度,将成为新瓶颈。
实验执行自动化后,瓶颈转向“哪些实验值得做”。
人类当前的比较优势在于研究品位与判断力:选择重要问题、判断结果可信度、识别死胡同等。
但即使人类仅负责“方向设定”,AI也能让每个人“驾驭”远超以往的工作量,从而实现复合加速。
04
—三种可能的未来
趋势放缓,但当前能力广泛扩散
指数曲线可能转为S曲线,规模收益递减。新架构或供应链(能源、芯片)成为限制。即使能力冻结在当前水平,世界也会巨变:100人公司可做1000人公司的事,网络安全等领域的瓶颈已从“发现漏洞”转向“快速修复”。
持续复合效率提升
AI开发高度自动化,人类负责方向与判断。组织生产力大幅跃升,知识工作和政府服务将被重塑。但同时可能被用于监控、操纵等有害用途。瓶颈会转移(Amdahl定律),如何快速识别并解决新瓶颈将成为关键能力。
完全递归自我改进
AI自主设计继任者,进步速度由算力决定。人类转向监督与验证,“虚拟实验室”主导研发。这一能力将快速转移到其他科学领域。经济和社会形态可能剧变,但许多现实瓶颈(如临床试验、治理节奏)仍由人类世界决定。
05
—我们该怎么办?
如果能有效放缓前沿AI开发,为社会适应和对齐研究赢得时间,将是好事。但单方面放缓可能让最不谨慎的行动者领先。
Anthropic认为,建立可验证的全球协调机制至关重要。我们将开展研究并推动构建相关系统,以便在多国前沿实验室达成一致时,能可靠验证各方确实暂停或放缓开发。
图源:Anthropic
汉化:MarsKr
未来几个月,我们将组织政策制定者、研究者、公民社会和AI公司的对话,共同探讨递归自我改进的含义及协调方案。欢迎更多外部声音参与这场至关重要的审议。
AI的未来,不仅取决于技术,更取决于我们今天的选择。
参考
https://www.anthropic.com/institute/recursive-self-improvement
热门跟贴