跑得最快的Anthropic，突然发文劝同行一起刹车：这是演给谁看？|anthropic|代码|新论文|智能体|机器人|疯狂

这个世界，终于魔幻到我看不懂的程度了。

故事是这样的。北京时间6月5日凌晨，Anthropic发了一篇长文，呼吁全球前沿AI实验室一起放慢研发速度，给社会治理和安全研究留出时间。

听起来很负责任对吧？

但说这话的不是旁观者，也不是监管机构，而是一家年化收入冲向500亿美元、估值逼近1万亿美元、刚完成650亿美元融资、IPO文件已经递交的AI巨头。

更讽刺的是，Anthropic喊刹车的时候，自己脚下还在加速。Claude已经在写公司生产代码库中超过80%的代码，融资、上市、模型发布、企业扩张全都在加速。

当一个领先者开始呼吁"大家一起刹车"，最该追问的不是它有没有担心未来，而是：它到底是在担心AI太快，还是担心别人追得太快？

想刹车，但不想一个人刹

Anthropic说得很漂亮："世界如果能拥有选择减缓或暂时暂停前沿AI开发的选项，那将是件好事。"

但紧接着，他们论证了单方面放缓为什么行不通。训练运行比导弹发射井更容易隐藏，计算硬件可以转移用途，而叛离的动机巨大。

"谁在别人暂停时继续，谁就可能继承领先地位。"

这是Anthropic给出的框架：问题真实，方案有前提，而前提几乎不可能满足。

要理解这个立场到底有没有道理，先得看看他们展示了什么样的技术现实。

Claude编写80%代码，工程师5个月没写一行代码

Anthropic联合创始人达里奥·阿莫代伊预言这一天已经很久了。但当内部数据摆到桌面上，冲击力仍然超出了多数人的预期。

截至2026年5月，合并到Anthropic生产代码库中的代码，超过80%是由Claude编写的。在2025年2月之前，这个数字还停留在个位数。

这不是渐进式的增长，而是一次陡峭的攀升。

在2026年第二季度，典型工程师每天合并的代码量达到2024年水平的8倍。

Anthropic坦承，代码行数不是一个完美的衡量标准，8倍的数字"几乎肯定高估了真实的生产力提升"。但方向骗不了人。在内部调查中，受访者中位数估计，使用新模型后，在同类项目上产生的产出大约是完全没有AI辅助时的4倍。

写那些代码的人，是世界上最擅长构建这类系统的工程师。而现在，Claude正在捕捉他们遗漏的bug。

宾夕法尼亚大学沃顿商学院教授伊桑·莫利克评论说，这些指标与独立衡量的结果相符，而且"实在没有迹象表明这种势头正在放缓"。他补充了一个容易被忽视的观察：当前模型在单个任务上的表现实在太好了，好到人们很难感知到新旧模型之间的能力鸿沟正在拉大。

氛围上看起来差不多，数据上却完全不是一回事。

四年工作量，AI用几天就搞定了

快是一回事。快且能用，则是另一回事。

2026年4月，一位工程师把Claude部署去处理一类反复出现的API错误。Claude自主运行，交付了800多项修复，将错误率直接压低了1000倍。

监督这项工作的工程师估算，换作人类来做，需要整整四年时间才能完成同样的工作量。不是因为人的能力不够，而是这类任务涉及大量不熟悉的代码上下文，认知负荷太高，人脑处理不过来。

在更复杂的开放式任务上，进步同样显著。一次常规升级导致数万个训练任务同时崩溃。一位工程师向Claude指出了这个实时问题，只给了少量文本信息和集群访问权限。Claude自己处理运行中的任务，逐一测试环境设置，最终隔离出一个触发崩溃的晦涩调试标志，复现问题，确认修复。

全程大约两个小时。这通常需要人类工程师花两到三天。

数据也验证了这个趋势。在最初缺乏明确规范的高度复杂开放式工程问题上，Claude的成功率在2026年5月达到了76%，六个月内拉升了50个百分点。

相比外部评价，来自Anthropic员工的自述更能说明问题。

一位员工说："我大约一年前开始全力拥抱'Claude化'。那是一段疯狂的冒险，到现在我已经大约5个月没有亲自写过一行代码了。"

另一位则描述了这种状态带来的心理代价："在一切顺利的日子里，我忍不住觉得我做的任何事情都不重要，一切都是自动化的，比我做得更好更快。但到了那些一切都崩溃、我不明白为什么会崩溃的日子里，我意识到我已经完全不清楚自己到底在干什么了。"

这两段话被写进官方博客本身，就说明了很多问题。焦虑不再藏在茶水间的闲谈里，而是被摆上了台面。

当AI开始跑实验，人类研究员被甩在后面

写代码只是手段，加速AI研发才是更深的底层变化。

Anthropic每次发布新模型，都会进行同一个测试：给Claude一些训练小型AI模型的代码，要求它让代码尽可能快，同时保证通过相同的正确性检查。

2025年5月，Claude Opus 4平均比初始代码快3倍。2026年4月，Claude Mythos Preview实现了约52倍的加速。

作为参照系，一个熟练的人类研究员花四到八个小时手动重构，在相同代码库上通常能达到4倍左右的加速。

从3倍到52倍，从逊于人类到碾压人类，不到一年。

真正跨越性的时刻出现在2026年4月。Anthropic首次让Claude端到端运行一个开放式研究项目。任务来自AI安全领域：一个较弱的模型能否可靠地监督一个更强的模型？

两位人类研究员花了一周时间弥合了约23%的差距。Claude智能体在累计800小时的计算时间内弥合了97%的差距，花费约18000美元。

人类在这个任务中扮演的唯一有意义的角色，是选择了问题并创建了评分标准。实验设计本身，全部由AI自行完成。

一位Anthropic研究人员评价道："Claude在1-2天的时间里，以极少来自我的帮助完成了所有这些工作。我觉得如果一位初级同事在同样短的时间内给我带来这样的结果，我会感到有点印象。未来已来。"

"递归自我提升"：从理论推演到内部现实

这些变化指向了同一个方向：递归自我提升。用Anthropic的话说，就是AI系统无需人类干预即可自行改进。

博客文章明确指出，完全的递归自我提升"尚未发生，也并非必然"，但它"可能来得比大多数机构准备就绪的时间更早"。

文章勾勒了AI在Anthropic研发中扮演角色的四个阶段。2021至2023年，手动编写。2023至2025年，聊天机器人辅助。2025至2026年，编码智能体阶段。今天，自主智能体阶段，智能体独立执行代码，调试实时环境。

而那个尚在视野边缘的下一阶段，被标注为"闭环未来"：智能体能力强大到足以自行构建和训练模型，未来的Claude版本可能由Claude自身不断改进。

能力翻倍的速度也在加快。AI系统能够自主可靠完成任务的时间长度，大约每四个月翻一番，而此前趋势是每七个月翻一番。2024年3月，Claude Opus 3能处理约四分钟的人类任务。一年后，Claude Sonnet 3.7能处理约一个半小时。又过了一年，Claude Opus 4.6能处理12小时。

如果这个趋势持续，今年就可能进入熟练人员需要数天才能完成的任务区间。到2027年，可能达到数周。

外界怎么看：精明算计，还是真诚焦虑？

看完这些技术数据，再回到Anthropic那句"我们是不是应该一起慢一点"，就能理解为什么外界的反应如此撕裂。

风险投资家大卫·萨克斯指责Anthropic领导层推行"监管俘获议程"，认为这种做法可能导致开源模型被禁，而开源模型恰恰是小型组织负担得起AI开发和使用的关键路径。

X上的评论更加直白。前沿AI评论员马修·伯曼一句话点破："递归自我改进就在眼前。Anthropic愿意放慢脚步，但前提是其他所有人都放慢脚步。当你处于领先地位时，这是个不错的处境。"

另一位网友更直接："他们要完蛋的声音。竞争让每个人都处于一种境地，必须花费如此多的金钱和资源才能勉强保持相关性。除非他们觉得自己身处泡沫之中，并且IPO之后可能会崩盘，否则没人会真正建议这样做。"

还有一种声音认为，大多数公众仍然低估了正在发生的转折。一位X用户写道："我相信大多数人仍然没有理解人类正面临的那道重大门槛。Anthropic本身明确表示，即使开发完全停止，他们仍然会见证巨大的社会变革。但根本不存在停滞的问题。开发速度已经超过了他们自己的内部假设。"

看完这些数据，我突然想起一个比喻。

Anthropic就像一个已经爬到山顶的人，站在那里对还在山腰的人喊："大家别爬了，太危险了，我们等等吧。"

这话听起来很有道理。但问题是，他们已经站在山顶了。

而且，他们脚下的山，还在继续长高。

Anthropic联合创始人克拉克说："这类技术以前从未存在过，但我相信这可能在两年内发生，甚至更早。"在缺乏全球协调性放缓的情况下，"商业和地缘政治的敌对正在淹没所构建技术对物种生存的更宏大影响。"