机器之心编辑部

自从 xAI 解散、大批创始成员离职之后,大家都在关心一个问题:Grok 是不是要凉了?

事实证明,并没有。就在昨天,马斯克对外透露了 Grok 最新模型的进展。据他介绍,参数量达 1.5T 的 Grok 基础模型 V9-Medium 已经完成训练,评估结果不错。

打开网易新闻 查看精彩图片

目前,模型正在进行微调,几天后将启动强化学习阶段。按照计划,Grok V9-Medium 预计会在两到三周内公开发布。

马斯克表示,这将是一次重大升级。他此前承认,现在承载所有 Grok 生产流量的、参数量仅 0.5T 的 v8-small(外部测试版本 Grok 4.2)在训练数据的质量、全面性和比例上存在严重缺陷。新的 Grok V9-Medium 不仅将参数规模扩大到前代的 3 倍,还针对 Blackwell 架构 GPU 进行了专门优化。在各项能力上,新模型都会有显著提升,尤其是在处理复杂编程任务方面。

他还表示,现有的 0.5T 模型计划在本年底前开源,适合开发者本地运行、微调或构建应用。

打开网易新闻 查看精彩图片

值得一提的是,在后续的补充训练中,团队加入了大量来自 Cursor 的数据,并且这一数据源还会继续扩充。

这得益于马斯克豪掷千金的一场收购。今年 4 月份,SpaceX 官方宣布,已获得在今年晚些时候以 600 亿美元收购 Cursor 的权利。当时,这一举动还让外界有点困惑,质疑 Cursor 是否真的值那么多钱。

但是,也有人认为,Cursor 是开发者实际使用的 AI 代码编辑器,数据包含真实的工作流(写代码、调试、迭代、修复 bug 等),是「人类开发者如何思考」的映射,其价值非常独特。如果 Grok 新模型能够有效利用这些数据,那么它将更懂真实开发者的工作方式,而非只是 GitHub 上的公开代码。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

除了新模型,马斯克近期推出的首款编码智能体 Grok Build 也是备受关注。你可以把它理解成马斯克版「Claude Code」—— 一个直接跑在你命令行里的 AI 程序员,能读代码、做计划、改文件、跑测试。

打开网易新闻 查看精彩图片

它比较明显的差异化设计是 Plan Mode(计划模式)。你描述需求后,它不会直接乱改你的代码,而是先输出一份结构化的执行计划,列明每一步要做什么。你可以审阅、修改甚至重写整个计划,批准之后它才开始动手,所有改动以 diff 形式呈现。

打开网易新闻 查看精彩图片

其他关键功能还包括:并行子智能体(最多支持 8 个子智能体同时工作)、Arena Mode(让多个候选方案内部「打擂台」)、原生支持 MCP 和 ACP、 支持无界面运行等。

目前,Grok Build 在开发者群体中已经收获了一些好评。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

在 Grok Build 之前,终端原生编程智能体这个赛道已经有三个主要玩家:Anthropic 的 Claude Code、OpenAI 的 Codex CLI、Google 的 Gemini-powered Antigravity。Grok Build 的加入,把这场竞赛从三强变成了四强。

有意思的是,马斯克此前公开承认过 xAI 在编程能力上落后,所以 Grok Build 的发布更像是一次「补课式入场」—— 功能架构上快速追平对手,再用 Arena Mode 这种差异化机制试图弯道超车。

不过目前的 Grok Build,底层跑的还是 grok-code-fast-1,具有 256K-token 的上下文窗口,在竞争对手面前显然不够看的。对于大型单一代码库和长时间运行的 Agent 会话,这样的上下文长度显然会成为瓶颈。

Grok V9-Medium 的 1.5T 参数和 Cursor 真实工作流数据的注入,有望让整个工具拥有更强大的底层模型。

在未来的 Agent 战局中,马斯克的团队能否占据一席之地?我们拭目以待。