来源:蓝字计划
作者|一个基哥
没有Coding Agent的大模型,将被踢出第一梯队。
最近,DeepSeek一口气放出17个招聘岗位。这本身不算新闻,大模型公司扩招在任何时候都不是。
但仔细看招聘要求:最核心的研发岗清一色聚焦Agent,从算法研究、数据评测到基础设施,覆盖全链条。
多个岗位在“加分项”里明确写着“重度使用Claude Code、Cursor、Copilot等AI编程工具的优先”,模型策略产品经理岗位甚至单独设立了Agent方向,要求候选人“熟悉并深度使用过Claude Code、Manus等知名agent产品”,职责是“主导Agent评测体系及训练数据方案设计”。
过去三年里克制到极致、长期把coding和Agent只当作“研究试验场”的DeepSeek,终于要从“做模型”转向“做产品”了。
而且不是随便做一个产品,是要做自己的原生Coding Agent。
非常巧合的是,马斯克在上个月底,也开始把“开发自己的编码产品”,当做战略级别的人物。
SpaceX与Cursor宣布战略合作,并获得以600亿美元收购Cursor的权利,或向其支付100亿美元合作费。
600亿美元买个coding agent。
这世界疯了吗?没疯。
Cursor的早期投资人、著名大喷子Theo Browne:“哪怕只是交换到Cursor的用户数据,这100亿也值回票价了。”
他解释,这正是当下大模型战争中最隐秘的弹药:Agentic Loop数据。
我们跟AI对话是一来一回,coding agent也一样,只不过它返回的是代码。一次完整的Agentic Loop,包含用户提示、模型思考、agent规划、输出代码、执行验证,所有这些步骤合在一起,就成了高价值训练数据。
用这些数据去做强化学习,模型在真实场景中的表现会再上一个台阶。而这些数据的唯一源头,只能是你自己的coding agent产品。
Anthropic有Claude Code,OpenAI有Codex,月之暗面有Kimi Code。
大模型厂商想做出一流的编程模型,自建coding agent产品是唯一的路径。没有这个东西,就是在等死。
回到前面,DeepSeek似乎也发现了,自己落后了。其中一个原因是:没有coding agent,就训练不出更好的模型。
DeepSeek在Benchmark表现分化,拿到70%的分数,排名第九。
到了更接近真实工程的SWE-bench Pro,直接掉到15%左右。
用合成数据和公开仓库能带DeepSeek走到这里,剩下的路:真实用户在真实环境中的真实成败。
现在估值超9000亿美元的Claude,token消费超过80%用于编程和技术任务,而DeepSeek的token主要消耗在闲聊上。
没有自己的Coding Agent产品,就永远拿不到那批最关键的过程监督信号;拿不到数据,模型在真实工程场景下的进化就走到了天花板。
这个道理,巨头们显然都已经想明白了。国内外的主流模型厂商,几乎全部在coding agent产品上疯狂布局。
美国阵营:
Cursor不用多说,Tab + Composer 2的实时RL飞轮,已经让它站在了数据飞轮的最顶端。
Anthropic有Claude Code桌面端,明确把员工的编程交互数据用于模型训练。
OpenAI推出Codex,配合GPT底座,开始构建自己的产品闭环。
国内阵营:
字节跳动很早布局了TRAE,走原生AI IDE路线。
阿里巴巴5月15日刚刚发布Qoder 1.0,从IDE插件正式升级为完整的智能体自主开发工作台。
腾讯的CodeBuddy、百度的文心快码Comate,都以IDE插件形态切入。
月之暗面是国内最早做独立coding agent的公司之一,主打CLI界面的Kimi Code,并且透露CLI不是终局。
MiniMax近期在桌面客户端发布了Mavis,多agent编排架构,大幅增强coding支持。
DeepSeek近期又发布Agent产品经理、Harness产品经理招聘。
国内厂商目前多以CLI、桌面端或IDE插件切入,但能像Cursor那样深度集成、获取完整交互轨迹的原生coding agent产品,几乎还是一片空白。
这也是为什么马斯克那600亿美元的合作,被业内视为一次战略性的数据圈地。
“模型公司”和“产品公司”之间的边界,正在消融。
对大模型公司来说,不做coding agent,就是等死。
热门跟贴