(来源:麻省理工科技评论)
打开网易新闻 查看精彩图片
(来源:麻省理工科技评论)

Anthropic 的开发者活动 Code with Claude 于 5 月 19 日在伦敦开幕,为期两天,和 Google 在帕洛阿尔托举办的 I/O 大会撞在了同一天。

“在座有多少人上周提交过一个完全由 Claude 写的 pull request?”Anthropic 工程师杰里米·哈德菲尔德(Jeremy Hadfield)在主舞台上问。很多人膝盖上放着笔记本电脑,一边听演讲一边写代码或跟 AI 对话;满满一屋子的人,将近一半举起了手。

Pull request 是对现有软件提交的修复或更新,提交后需要经过审核才能上线。这是软件开发的日常,是大多数专业程序员一辈子都在写的东西——至少以前是。

“有多少人提交过完全由 Claude 写的 pull request,而且自己根本没看过里面的代码?”哈德菲尔德接着问。现场传来紧张的笑声,大部分手没有放下来。

LLM 驱动的工具——比如 Anthropic 的 Claude Code 和 OpenAI 的 Codex——已经颠覆了软件开发的方式,这不是新闻了。头部科技公司现在喜欢比谁的开发者手写代码更少。“Anthropic 的大部分软件现在都由 Claude 编写,”哈德菲尔德说,“Claude Code 里的大部分代码也是 Claude 自己写的。”OpenAI、Google 和微软也有类似的说法。

即便如此,这种新范式已经被视为理所当然的速度还是令人吃惊。这是 Anthropic 第二年举办开发者活动,活动也在旧金山和东京举行。去年这个时候公司刚发布 Claude 4,那时候它勉强能写代码。但经过最近一连串更新——尤其是今年 2 月发布的 Claude 4.6 和 4 月发布的 4.7——Claude Code 已经成为越来越多开发者乐意把活交出去的工具。

Anthropic 说他们的目标是把自动化推到极致。不是让 AI 生成代码、再由人类来清理和修复错误,而是让 Claude 自己检查和修正自己的工作。“默认做法不再是‘我来给 Claude 写提示词’,而是‘让 Claude 自己给自己写提示词’。”Claude Code 负责人鲍里斯·切尔尼(Boris Cherny)在开场演讲中说。

如果一切顺利,出了错人类开发者甚至不需要看到报错信息。那些都由 Claude 来处理——测试、调整、再测试、再调整,直到一切正常运行。Anthropic 工程师拉维·特里维迪(Ravi Trivedi)在另一场演讲中说:“核心原则就是别挡 Claude 的路。我们喜欢说的一句话是:‘让它自己搞。’”

特里维迪介绍了 Claude Code 两周前宣布的一个新功能,Anthropic 称之为“做梦”(dreaming)。Claude Code 智能体会给自己写笔记,记录和保存关于特定任务的有用信息。之后另一个编程智能体接手同一段代码时,可以读这些笔记来更快上手,并从前一个智能体犯过的错误中学习。

“做梦”是 Claude Code 用来通读所有这些笔记并整合信息的机制,它能发现不同任务之间的共同模式和常见问题。理论上,这应该让 Claude Code 越来越熟悉某个特定的代码库,在上面工作得越来越好。

Code with Claude 是一场面向开发者的活动。除了 Anthropic 自己的产品展示和实操工作坊,还有一批企业分享了它们如何围绕 Claude Code 重组软件开发团队的经验,包括 Spotify 和 Delivery Hero,以及 Lovable、Base44 和 Monday.com——后面三家是帮人用 AI 写代码来做 App 的初创公司(没错,用 AI 写代码的工具本身也是用 AI 写代码做出来的)。

Code with Claude 现场看不到任何不安的迹象,我遇到的每个人都想拥抱这个趋势。

但在会场之外,已经有不少报道说很多程序员开始质疑这个光明新未来。有人在 Reddit 和 Hacker News 等论坛上抱怨:AI 编程工具是被追求生产力提升的管理层强推的,实际用起来反而让软件开发变得更难了,因为现在开发者要额外审查大量 AI 生成的代码。“我听到的所有说‘AI 生成的代码没问题’的人,都是那些不读代码的人,”一个叫 pron 的用户上周在 Hacker News 上写道。

还有人说随着越来越多的任务交给 AI,自己的编程能力正在退化。研究人员也警告说,AI 工具可能生成不安全的代码,让软件更容易被攻击。

我跟 Claude 的工程负责人凯特琳·莱瑟(Katelyn Lesse)和产品负责人安吉拉·姜(Angela Jiang)坐下来聊了聊。我问她们怎么看这种担忧:大量 AI 生成的代码在没有充分人工审查的情况下就被提交上线,会不会把严重的安全和维护问题留给未来?

“所有过去的软件开发最佳实践仍然适用,一直都适用,”莱瑟说,“我觉得有很多人和团队在这股浪潮中把这些给忘了。”

但随着 Anthropic 等公司推动更深入的自动化、Claude Code 等工具越来越强,把更多任务甚至包括审查环节都交出去的诱惑也在增大。莱瑟告诉我,Anthropic 内部一些技术主管已经被团队现在产出的海量代码搞得精疲力竭。“事情发生得快了这么多,光是管理时间就是一个挑战。”她说。

“我觉得目前 Claude 写代码的水平大概相当于一个中级工程师。”她补充道。你仍然需要资深工程师来设计系统架构、解决更难的问题,“但随着时间推移,我们希望 Claude 在各种工程任务上都越来越强。”

姜表示同意:“我觉得我们追求的终极状态,是 Claude 基本上能够自己造自己。”

https://www.technologyreview.com/2024/10/28/1106251/this-ai-system-makes-human-tutors-better-at-teaching-children-math/