Anthropic 表示,AI 行业正迈向能够自主构建未来几代前沿模型的系统。
几十年来,我们一直在电影和流行文化中看到这样的情景;如今看来,科幻已不再是虚构。根据 Anthropic 发布的新研究,人工智能系统正开始帮助构建下一代 AI 模型。该公司表示,这一趋势最终可能导致 AI 系统在极少人类干预的情况下自行设计和改进自己。
Anthropic 在其研究机构 Anthropic Institute 发布的一篇新博文中概述了这一警告。该公司称,行业迈向“递归式自我改进”的速度可能比许多政府和机构预期的更快。
这一概念描述的是一种未来图景:一个 AI 模型开发出自身的下一个版本。目前,研究人员仍在指导这一过程。但 Anthropic 表示,在公司内部,AI 已经在编程、调试和技术研究方面承担了越来越大的份额。
AI 开发加速
Anthropic 援引内部数据,展示了 AI 工具如今对软件工程工作的贡献速度有多快。该公司称,截至 2026 年 5 月,Claude 生成的代码已占合并到 Anthropic 系统中代码的 80% 以上。而在 2025 年初 Claude Code 推出之前,这个数字还停留在低个位数。
我们的内部数据显示,Claude 正在加速 AI 开发——这可能是一条通往递归式自我改进,即 AI 自主构建更强大继任者的路径。
它的发展速度比我们想象的还要快,其影响值得更多关注。
— Anthropic (@AnthropicAI) 2026 年 6 月 4 日
该公司还表示,随着这些变化,工程生产力也大幅提升。Anthropic 工程师现在每天合并的代码量大约是 2024 年的八倍。
Anthropic 联合创始人兼政策主管 Jack Clark 表示,公司希望立法者和机构了解接下来可能发生的情况。“我们一直发现,最好的做法就是让这个概念社会化,让大家对即将到来的事情有所认识,”Clark 在一份新闻稿中说道。
Clark 补充说,AI 的进步似乎正在加速,而非放缓。他称,这一转变可能推动医学、科学和其他技术领域取得重大进展。
基准测试快速进步
Anthropic 还重点介绍了跟踪 AI 在软件工程和科研任务中表现的公开基准测试。
该公司表示,AI 系统现在能在更长时间内、无需人工干预的情况下完成日益复杂的任务。Anthropic 声称,模型能够可靠处理的任务时长大约每四个月翻一番。
据该公司称,2024 年初,Claude Opus 3 完成的任务仅持续几分钟。一年后,Claude Sonnet 3.7 已能处理约需 90 分钟的工作。Anthropic 表示,后来的 Claude Opus 4.6 已能处理长达 12 小时的任务。
该公司还引用了 SWE-bench 基准,这是一项测试 AI 能否修复开源项目中真实代码问题的软件工程基准。Anthropic 称,前沿模型在该基准上的得分在两年内从较低水平提升到了接近饱和。
另一项基准 CORE-Bench,衡量 AI 能否复现已发表的科学研究成果。Anthropic 称,AI 系统从 2024 年大约 20% 的复现成功率,提高到约 15 个月后近乎完美的表现。
风险与监督
Anthropic 强调,当前系统与完全自主的 AI 开发之间仍存在巨大差距。该公司表示,人类仍继续定义目标、评判结果,并决定哪些研究方向最为重要。
尽管如此,该公司警告称,如果监督工具无法跟上步伐,更强大的自主系统可能带来新的风险。
“作为组织,并最终可能作为整个社会,我们需要找到验证和核实”AI 生成工作的工具,Clark 说。他补充说,未来的系统必须始终与人类目标和公共利益保持一致。
Anthropic 计划在未来几个月与美国立法者讨论这一问题。该公司表示,政府应做好准备,应对 AI 系统最终可能在几乎没有人类直接参与的情况下,帮助创造出更强大继任者的可能性。
如果朋友们喜欢,敬请关注“知新了了”!
热门跟贴