奥创纪元：Anthropic 警告 AI 系统或将很快能构建自己的继任者|anthropic|claude|人工智能模型|代码|基准|奥创纪元|软件工程

Anthropic 表示，AI 行业正迈向能够自主构建未来几代前沿模型的系统。

几十年来，我们一直在电影和流行文化中看到这样的情景；如今看来，科幻已不再是虚构。根据 Anthropic 发布的新研究，人工智能系统正开始帮助构建下一代 AI 模型。该公司表示，这一趋势最终可能导致 AI 系统在极少人类干预的情况下自行设计和改进自己。

Anthropic 在其研究机构 Anthropic Institute 发布的一篇新博文中概述了这一警告。该公司称，行业迈向“递归式自我改进”的速度可能比许多政府和机构预期的更快。

这一概念描述的是一种未来图景：一个 AI 模型开发出自身的下一个版本。目前，研究人员仍在指导这一过程。但 Anthropic 表示，在公司内部，AI 已经在编程、调试和技术研究方面承担了越来越大的份额。

AI 开发加速

Anthropic 援引内部数据，展示了 AI 工具如今对软件工程工作的贡献速度有多快。该公司称，截至 2026 年 5 月，Claude 生成的代码已占合并到 Anthropic 系统中代码的 80% 以上。而在 2025 年初 Claude Code 推出之前，这个数字还停留在低个位数。

我们的内部数据显示，Claude 正在加速 AI 开发——这可能是一条通往递归式自我改进，即 AI 自主构建更强大继任者的路径。
它的发展速度比我们想象的还要快，其影响值得更多关注。
— Anthropic (@AnthropicAI) 2026 年 6 月 4 日

该公司还表示，随着这些变化，工程生产力也大幅提升。Anthropic 工程师现在每天合并的代码量大约是 2024 年的八倍。

Anthropic 联合创始人兼政策主管 Jack Clark 表示，公司希望立法者和机构了解接下来可能发生的情况。“我们一直发现，最好的做法就是让这个概念社会化，让大家对即将到来的事情有所认识，”Clark 在一份新闻稿中说道。

Clark 补充说，AI 的进步似乎正在加速，而非放缓。他称，这一转变可能推动医学、科学和其他技术领域取得重大进展。

基准测试快速进步

Anthropic 还重点介绍了跟踪 AI 在软件工程和科研任务中表现的公开基准测试。

该公司表示，AI 系统现在能在更长时间内、无需人工干预的情况下完成日益复杂的任务。Anthropic 声称，模型能够可靠处理的任务时长大约每四个月翻一番。

据该公司称，2024 年初，Claude Opus 3 完成的任务仅持续几分钟。一年后，Claude Sonnet 3.7 已能处理约需 90 分钟的工作。Anthropic 表示，后来的 Claude Opus 4.6 已能处理长达 12 小时的任务。

该公司还引用了 SWE-bench 基准，这是一项测试 AI 能否修复开源项目中真实代码问题的软件工程基准。Anthropic 称，前沿模型在该基准上的得分在两年内从较低水平提升到了接近饱和。

另一项基准 CORE-Bench，衡量 AI 能否复现已发表的科学研究成果。Anthropic 称，AI 系统从 2024 年大约 20% 的复现成功率，提高到约 15 个月后近乎完美的表现。

风险与监督

Anthropic 强调，当前系统与完全自主的 AI 开发之间仍存在巨大差距。该公司表示，人类仍继续定义目标、评判结果，并决定哪些研究方向最为重要。

尽管如此，该公司警告称，如果监督工具无法跟上步伐，更强大的自主系统可能带来新的风险。

“作为组织，并最终可能作为整个社会，我们需要找到验证和核实”AI 生成工作的工具，Clark 说。他补充说，未来的系统必须始终与人类目标和公共利益保持一致。

Anthropic 计划在未来几个月与美国立法者讨论这一问题。该公司表示，政府应做好准备，应对 AI 系统最终可能在几乎没有人类直接参与的情况下，帮助创造出更强大继任者的可能性。

如果朋友们喜欢，敬请关注“知新了了”！

奥创纪元：Anthropic 警告 AI 系统或将很快能构建自己的继任者

热搜

热门跟贴

热搜

热门跟贴

相关推荐

重塑软件工程：从Vibe Coding走向Spec Coding

程序员的下一代，谁来培养？

OpenAI曝作弊门！GPT-5.6创史上最高作弊率

刚刚，Claude 5局部解禁！

OpenAI最新报告：Codex取代ChatGPT，大神让“Agent团队”干活

Anthropic最新报告摸透全球打工人：凌晨5点求睡眠，晚6点问菜谱

1美元Token撬动4800美元收益!百万美元级基准,最赚钱Agent出现了

大神程序员蒸馏自己，用16个skill给AI注入软件工程之魂

四大顶级AI对决《文明VI》！Claude「核平」法国，结果还是输了

人工智能与人脑

陈天奇新书上线：面向ML系统的现代GPU编程

“AI领域最被滥用的术语”李飞飞终于把世界模型讲明白了

Anthropic的AI读心术，让人类读懂大模型在想啥

00后小哥复刻Claude最强神话模型OpenMythos

Rokid发布智能眼镜AIOS YodaOS，称行业尚处“BlackBerry时代”

小竹无人车“凶猛”，佑驾创新开启Robovan“四国杀”

招软件工程师训练AI模型，不要AI背景，你敢投吗？

外媒关注中国重型预警机试飞：中美预警机的技术代差有多大？

兄弟俩开货车跑货运，在高速上偶遇许久未见同为货车司机的老爸。 网友：希望天下所有的爸爸都平平安安！

监控下的一幕，电瓶车大军气势浩荡，太考验驾驶技术

兄弟俩开货车跑货运，在高速上偶遇许久未见同为货车司机的老爸。网友：希望天下所有的爸爸都平平安安！