Andrej Karpathy在周二的一条推文里写得很简短:"个人更新:我已加入Anthropic。"这条帖子一小时内获得近300万浏览量。这位OpenAI创始成员、特斯拉前AI负责人、去年刚创办教育公司Eureka Labs的工程师,本周正式入职Anthropic的预训练团队。

这是Karpathy第四次职业转向。2015年作为创始成员加入OpenAI,后离开去特斯拉执掌AI团队,2023年回归OpenAI,一年后再次离开创业。现在他选择站队OpenAI最强劲的竞争对手。他在帖文中解释,未来几年的大语言模型前沿将"尤其具有 formative(塑造性)意义",他渴望回归研究。

打开网易新闻 查看精彩图片

Karpathy在AI圈成名已逾十年,但真正让他进入大众视野的是去年2月的一条推文。他提出一种"新型编程方式"——vibe coding(氛围编程):用自然语言描述需求,让模型完成具体实现。这个词迅速破圈,从科技行业蔓延至商业世界。企业纷纷放弃采购SaaS软件,转向自主开发定制Agent,引发所谓"SaaS大灭绝"讨论。Collins Dictionary将其评为年度词汇。值得注意的是,Karpathy在那条原始推文中引用的模型正是Anthropic的Claude。

今年3月,Karpathy发布了另一条病毒式传播的技术实验。他将一个AI编程Agent接入小型语言模型,不设监督地运行两天,让Agent自主测试和调整训练代码。700次实验、20项自主发现的优化后,他将相同调整应用于更大模型,训练时间缩短11%。他称之为autoresearch(自主研究),并半开玩笑地描述为"部分代码、部分科幻、一丝疯狂"。这种方法后来被社区命名为"Karpathy Loop"。

据Anthropic官方说明,Karpathy的新职位正是延续这一方向:组建团队,利用Claude加速预训练研究——即大规模训练运行,为Claude构建核心知识与能力。他隶属于Nick Joseph领导的团队。

在这一切之前,Karpathy的成名起点与AI无关。他运营YouTube频道"badmephisto",向一代竞速魔方爱好者传授"速拧"技巧:将魔方视为26个独立" cubies(小方块)"而非54个色块。通过聚焦微观结构来驾驭整体,他能在约17秒内还原魔方。这种思维方式——从底层单元重构复杂系统——似乎贯穿了他后来的技术生涯。

Anthropic近来的势头确实难以阻挡。连续发布重磅模型、 reportedly 洽谈新一轮融资估值逼近1万亿美元、年化收入曲线近乎抛物线增长——如今又揽入OpenAI最具知名度的校友之一。Karpathy的200万X粉丝将密切关注他的下一步动作。