昨晚睡前你写了一段文字,描述想要什么、怎么算达成。今早醒来,AI已经完成了100轮实验——尝试方案、测量结果、淘汰失败、继续迭代。你没有执行任何一步研究,只是设计了一个目标。
这不是假设。这是Andrej Karpathy本周发布的"autoresearch"项目。
技术细节对工程师有吸引力,战略意义对所有人更重要。前者我们花一段,后者花全文。
Karpathy搭建了一个围绕AI训练任务的自主研究循环:给智能体一个目标、可修改的代码库、单一优化指标。智能体提出改动、运行短实验、评估指标是否提升、保留胜者、淘汰其余、重复。约100个循环在一夜之间完成,任何带GPU的现代Mac都能跑。人类唯一的贡献是一份描述研究方向的文档——优化什么、约束条件、什么算进步。
创业者Garry Tan的概括更精炼:"设计竞技场,让AI迭代。"
这句话抓住了核心。但多数讨论忽略了一点:Karpathy的竞技场是针对模型训练,但这个策略适用于任何能精确定义"更好"的领域。这不是小众场景,这是大部分知识工作。
自主AI循环并非新事物。2025年Geoffrey Huntley推广的"Ralph Wiggum"模式结构类似:简单循环,给AI智能体一个提示,每轮后检查完成条件,直到任务结束。测试通过、构建成功、清单项清零。Ralph Wiggum是AI智能体的while (not done)循环——广泛使用,对任务完成确实有效。
Autoresearch增加了一个升级要素:不是"继续尝试,这是判断完成的方式",而是"这是要优化的指标……持续调整,保留让指标比以前更好的方案"。可称之为Ralph Wiggum Plus。
Ralph Wiggum问"完成了吗?",答案是就停。Ralph Wiggum Plus问"比以前更好吗?",只要还能改进就继续搜索。区别听起来微妙,实则不然。二元检查在有明确终点线时完美工作——很多任务确实有明确终点。连续指标适用于优化目标——没有终点线,只有不断刷新的分数。
这是知识工作策略的进化:从Human-In-the-Loop(人在回路中,每一步参与)到Human-Before-the-Loop(人在回路前,只设计竞技场)。人负责定义"更好"的标准,机器负责寻找更好的路径。
这个转变的边界值得警惕。指标必须真正反映价值,而非-proxy(代理指标)。否则AI会优雅地优化错误的东西——这是Goodhart定律的老问题,只是现在循环速度是100轮/夜。定义竞技场的人,责任比执行的人更重。
Karpathy的项目是技术演示,也是工作方式的预告。当优化类任务可以交给机器通宵迭代,人类的核心技能变成:提出正确的问题、设计有效的测量、判断何时停止。这些都不是新能力,但它们的权重正在急剧上升。
竞技场设计者的时代开始了。
热门跟贴