xAI被曝用Claude训练编码模型，权限撤了还在用个人账户偷跑

野生运营

2026-06-07 01:15 ·北京

马斯克一边公开承认混用OpenAI模型是“业内标配”，一边被曝出用对手Anthropic的Claude输出来训练自家的编码模型。两份不同的“坦白”，恰好指向同一个逻辑：在大模型训练这场竞赛里，训练数据的来源远比外界想象的更混杂。

据The Information报道，xAI团队花了数月时间“蒸馏”Anthropic的Claude模型，直接拿Claude的输出当作训练数据来培养自己的编码模型。这种做法的效率不难理解——与其从头标注海量代码数据，不如让一个已经训练有素的模型替你生成高质量样本。问题在于，未经授权使用竞争对手的API输出来训练模型，踩在了商业条款的灰色地带。

今年1月，Anthropic正式撤销了xAI的官方访问权限。但报道指出，xAI的工程师们并没有就此停手。他们转而通过个人账户和中间服务商Blackbox AI继续获取Claude的输出。这一细节把整件事从“可能违规”推向了更明确的“绕道继续干”的地带。

马斯克本人此前在法庭上承认，xAI“部分”使用了OpenAI的模型来训练Grok，并称这在业内是“标准做法”。这话大概是整场争议中最坦率的一句——行业内用竞品模型输出做训练数据的操作确实存在，只是大多数人不会公开承认。

把对手的模型输出当成训练数据，逻辑上是一个闭环：你的模型生成的代码质量越高，就越适合用来训练我的模型。但同时，这也意味着你的模型的缺陷和偏见可能一并被蒸馏过来。短期来看是加速追赶的捷径，长期来看却是技术同质化的推手。

与外部的灰色操作形成对照的，是xAI内部持续动荡的信号。据The Information报道，xAI的预训练团队已缩减至不足五人。四名Grok代码负责人在短短数月内相继离职，一同离开的还有多位联合创始人。更令人意外的是，一名员工意外删除了关键训练数据，直接造成两到三周的工作损失。

这一事故在小团队中尤其致命。大型AI实验室通常有冗余备份和权限管控机制，能最大限度降低误操作的影响。而从报道披露的信息来看，xAI在数据管理的流程上似乎还处于相对早期的状态。

另一个值得玩味的动作是，马斯克此前大肆采购的算力资源，如今并没有全部用在xAI自己的模型训练上。据称，这部分算力正通过SpaceX出租给Anthropic，同时也租给了Google。官方说辞是“临时过渡措施”，但结合团队缩减和训练事故来看，这种“过渡”更像是无奈之下的资源配置调整。

从外部“借”训练数据，到内部人员流失和数据事故，再到算力出租给竞争对手，这三个信号叠加在一起，呈现出的并不是一个平稳追赶的AI参赛者。更像是一个在资源、人才和合规层面同时承压的团队，试图用各种手段缩短与领先者的距离。

这种策略的风险在于：当你的训练数据来自对手，你的算力租给对手，你的团队核心成员也在流向对手时，差异化从哪里来？马斯克在法庭上说的“业内标准”，或许描述了现状，但并没有回答这个问题。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴