AI正在加速自我进化，留给人类的时间不多了

NASA爱好者

2026-06-06 03:30 ·北京 ·科普博主

6月5日，Anthropic发表了一篇警示文章，《When AI buildes itself》，当 AI 开始建造自己，不禁要思考，我们人类角色将如何改变？

在 AI 发展的历史中，人类长期主导着每一个开发环节。但如今，在 Anthropic，我们正将越来越多的AI开发工作委托给AI系统自身，这极大加速了我们的工作进展。

图源：Anthropic

汉化：MarsKr

如果这一趋势走得足够远，再配合充足的算力，最终可能诞生一个完全自主设计并开发自身继任者的AI系统，这就是递归自我改进（Recursive Self-Improvement）。

我们尚未完全抵达这一步，且它并非必然发生。但Anthropic Institute的最新报告显示：这一趋势可能比大多数机构预想的来得更早。

AI已在显著加速AI自身的开发。一个最直观的例子是：如今Anthropic工程师平均每个季度输出的代码量，是2021-2025年期间的8倍。

这些趋势意味着AI能力将在未来几年大幅跃升。它可能带来科学、医疗等领域的巨大福祉，但也可能大幅增加人类失去对AI控制的风险。当系统能自主构建后继者时，安全、监控和行为引导将变得至关重要。

01

—外部世界的证据：AI能力加速提升

AI 模型能可靠独立完成的任务长度，正在每4个月翻一番（此前是每 7 个月）。

2024年3月：Claude Opus 3 可完成人类约 4 分钟的任务；

2025年：Claude Sonnet 3.7 可处理约 1.5 小时的任务；

2026年：Claude Opus 4.6 已能应对 12 小时的任务。

图源：Anthropic

汉化：MarsKr

若趋势延续，今年内 AI 就可能处理需人类数天完成的任务；2027年，甚至可能达到数周量级。

在基准测试上也呈现饱和趋势：

SWE-bench（真实软件工程）：两年内从个位数得分到接近饱和；CORE-Bench（科研复现）：15 个月内从 20% 成功率到接近饱和；METR 测试显示，Claude Mythos Preview 已能连续工作至少 16 小时。

02

—Anthropic内部证据：AI已深度参与开发

构建前沿模型主要分为工程（写代码、搭建基础设施、训练模型）和研究（设计实验、解读结果、决定下一步）两大类。

在工程领域：Claude能接手不完全明确的问题，自主找出解决方案。人类只需提供目标，无需提供具体方法。

在研究领域：Claude已能在执行明确实验时匹配甚至超越熟练人类，但在大方向判断和目标选择上，仍存在明显差距。这正是当前AI与“自主设计继任者”之间的关键鸿沟。

代码产出爆炸式增长：

截至2026年5月，Anthropic合并到主代码库的代码中， 超过80%由Claude撰写（2025年2月Claude Code推出前，这一比例仅为个位数）。

2025年开始，工程师每天合并的代码行数显著上升；2026年，随着模型自主工作时间延长，斜率进一步陡峭。

2026年第二季度，典型工程师的日代码合并量是2024年的 8倍。

图源：Anthropic

汉化：MarsKr

尽管代码行数不是完美指标（更重视质量而非数量），但这清晰反映了生产力加速。员工主观调查也显示：2026年3月，中位员工认为使用Mythos Preview后，产出提升约4倍。

Claude不仅写得多，还写得越来越好：

工程师干预、纠正Claude的比例持续下降。

在最开放的任务上，2026年5月成功率达 76%（半年提升50个百分点）。

示例：一次例行升级导致数万训练任务崩溃，Claude仅用约2小时就定位问题并修复（人类通常需2-3天）。

代码质量方面：2025年底Claude代码略逊于人类，如今已接近持平，预计年内将超越。Anthropic现在使用Claude自动审查代码变更，甚至能捕捉到顶尖工程师之前遗漏的部分bug。

研究能力同样突飞猛进：

在优化明确实验目标时，Claude从2025年的~3x加速提升到2026年的~52x（人类熟练研究员需4-8小时达4x）。

2026年4月，Claude驱动的代理完成了首个端到端开放研究项目：在AI安全问题上，自主提出假设、测试、迭代，恢复了97%的性能差距（人类两名研究员一周约23%）。

在开放调查任务中，模型判断“下一步最佳行动”的能力也在提升。

一位Anthropic员工感慨：“我大约一年前开始深度依赖Claude，现在已经5个月没亲自写代码了。”

03

—未来工作形态：人类角色正在收窄

证据显示，人类在AI开发各环节中的角色正在缩小：

代码质量持平后，人类可能彻底停止写代码，转向审查。但审查速度若跟不上生成速度，将成为新瓶颈。

实验执行自动化后，瓶颈转向“哪些实验值得做”。

人类当前的比较优势在于研究品位与判断力：选择重要问题、判断结果可信度、识别死胡同等。

但即使人类仅负责“方向设定”，AI也能让每个人“驾驭”远超以往的工作量，从而实现复合加速。

04

—三种可能的未来

趋势放缓，但当前能力广泛扩散

指数曲线可能转为S曲线，规模收益递减。新架构或供应链（能源、芯片）成为限制。即使能力冻结在当前水平，世界也会巨变：100人公司可做1000人公司的事，网络安全等领域的瓶颈已从“发现漏洞”转向“快速修复”。

持续复合效率提升

AI开发高度自动化，人类负责方向与判断。组织生产力大幅跃升，知识工作和政府服务将被重塑。但同时可能被用于监控、操纵等有害用途。瓶颈会转移（Amdahl定律），如何快速识别并解决新瓶颈将成为关键能力。

完全递归自我改进

AI自主设计继任者，进步速度由算力决定。人类转向监督与验证，“虚拟实验室”主导研发。这一能力将快速转移到其他科学领域。经济和社会形态可能剧变，但许多现实瓶颈（如临床试验、治理节奏）仍由人类世界决定。

05

—我们该怎么办？

如果能有效放缓前沿AI开发，为社会适应和对齐研究赢得时间，将是好事。但单方面放缓可能让最不谨慎的行动者领先。

Anthropic认为，建立可验证的全球协调机制至关重要。我们将开展研究并推动构建相关系统，以便在多国前沿实验室达成一致时，能可靠验证各方确实暂停或放缓开发。

图源：Anthropic

汉化：MarsKr

未来几个月，我们将组织政策制定者、研究者、公民社会和AI公司的对话，共同探讨递归自我改进的含义及协调方案。欢迎更多外部声音参与这场至关重要的审议。

AI的未来，不仅取决于技术，更取决于我们今天的选择。

参考

https://www.anthropic.com/institute/recursive-self-improvement

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴