打开网易新闻 查看精彩图片

【导读】AI教父Karpathy发布了一个让整个AI圈震动的项目——autoresearch。简单说就是:让AI当科学家,让它自己设计、训练、优化AI模型。你睡觉的时候,它在进化。你醒来的时候,它已经比你更懂怎么训练AI了。上线一周狂揽46.7k Star,成为GitHub历史上增长最快的项目之一。

突发!AI不需要人类了?

昨晚,AI圈又被一枚核弹炸了。

OpenAI前研究总监、特斯拉前AI总监、AI教父级别的人物 Andrej Karpathy,在Twitter上官宣发布了一个开源项目:autoresearch

GitHub:github.com/karpathy/autoresearch

这个项目干的事情就一件:让AI自己研究怎么训练AI。

不是人类调参,不是人类炼丹,是AI自己当科学家,自己设计模型架构,自己改优化器,自己跑实验,自己看结果,自己决定下一步怎么改。

然后你睡一觉醒来,发现AI已经跑了近百次实验,模型性能蹭蹭往上涨。

炸裂数据:7.5小时89次实验,0崩溃

Karpathy本人实测:

  • 7.5小时完成 89次实验

  • 保留 15项 有效改进

  • 丢弃 74项 无效改动

  • 0次崩溃
  • 全程零人类干预

48小时内完成约 700次实验,筛选出约 20项 累加改进

上线一周狂揽 46.7k Star,成为GitHub历史上增长最快的开源项目之一

这玩意儿到底怎么玩的?

Karpathy设计了一套极其优雅的框架,核心三文件(总共约630行代码):

1. prepare.py —— 数据准备(固定不动)
下载训练数据、训练BPE分词器、数据加载器和评估工具

2. train.py —— 模型和训练循环(AI修改这个)
完整的GPT模型、优化器(Muon + AdamW)、训练循环。所有东西都可以改:架构、超参、批量大小、优化器...

3. program.md —— 给AI agent的指令(人类修改这个)
AI agent的prompt,研究目标、决策规则

工作流程:

你睡觉 → AI agent读取program.md → AI agent修改train.py → 跑5分钟训练实验 → 检查val_bpb → 保留或丢弃结果 → 继续下一个实验 → 你醒来 → 看到一晚上跑了100+实验报告

⏱️ 一小时12次实验,一晚上100次

Karpathy设计了一个极其聪明的时间预算机制:不管你什么硬件,每次实验固定5分钟。

  • 一小时 ≈ 12次实验

  • 一晚上(约8小时)≈ 100次实验

  • 你睡觉 = AI在进化

核心指标:val_bpb

autoresearch用val_bpb(validation bits per byte)作为唯一标准。越低越好。

它是词表无关的,不管你怎么改模型架构,都可以公平比较。

怎么用?

安装就三步:

curl -LsSf https://astral.sh/uv/install.sh | sh
uv sync
uv run prepare.py
uv run train.py

人类负责啥?

改program.md。

对,你没看错。AI agent只动train.py,而人类只改program.md——也就是AI agent的指令文件。

相当于:你在编程一个"AI研究员",而不是在写AI代码

细思极恐

想象一下:你现在有一群AI agent,每个都在跑autoresearch,它们自己设计新的模型架构、自己发现新的优化技巧、7x24小时不停进化。然后它们产出的"更好的模型",又被用来训练下一代autoresearch agent。

这是一个自我进化的闭环。

Karpathy说:Research is now entirely the domain of autonomous swarms of AI agents running across compute cluster megastructures in the skies.

总结

autoresearch = AI研究员 + 快速实验闭环 + 人类战略指导

它代表的不是某个具体的技术突破,而是一种范式转变:从"人类设计AI"到"人类指导AI设计AI"。

下次你看到AI又有重大突破的时候,想一想:说不定那个突破,不是人类想出来的。

【互动话题】

你觉得AI自主研究会在多久取代人类研究员?

• 5年内
• 10年内
• 20年内
• 不可能

评论区聊聊!