马斯克一边公开承认混用OpenAI模型是“业内标配”,一边被曝出用对手Anthropic的Claude输出来训练自家的编码模型。两份不同的“坦白”,恰好指向同一个逻辑:在大模型训练这场竞赛里,训练数据的来源远比外界想象的更混杂。
据The Information报道,xAI团队花了数月时间“蒸馏”Anthropic的Claude模型,直接拿Claude的输出当作训练数据来培养自己的编码模型。这种做法的效率不难理解——与其从头标注海量代码数据,不如让一个已经训练有素的模型替你生成高质量样本。问题在于,未经授权使用竞争对手的API输出来训练模型,踩在了商业条款的灰色地带。
今年1月,Anthropic正式撤销了xAI的官方访问权限。但报道指出,xAI的工程师们并没有就此停手。他们转而通过个人账户和中间服务商Blackbox AI继续获取Claude的输出。这一细节把整件事从“可能违规”推向了更明确的“绕道继续干”的地带。
马斯克本人此前在法庭上承认,xAI“部分”使用了OpenAI的模型来训练Grok,并称这在业内是“标准做法”。这话大概是整场争议中最坦率的一句——行业内用竞品模型输出做训练数据的操作确实存在,只是大多数人不会公开承认。
把对手的模型输出当成训练数据,逻辑上是一个闭环:你的模型生成的代码质量越高,就越适合用来训练我的模型。但同时,这也意味着你的模型的缺陷和偏见可能一并被蒸馏过来。短期来看是加速追赶的捷径,长期来看却是技术同质化的推手。
与外部的灰色操作形成对照的,是xAI内部持续动荡的信号。据The Information报道,xAI的预训练团队已缩减至不足五人。四名Grok代码负责人在短短数月内相继离职,一同离开的还有多位联合创始人。更令人意外的是,一名员工意外删除了关键训练数据,直接造成两到三周的工作损失。
这一事故在小团队中尤其致命。大型AI实验室通常有冗余备份和权限管控机制,能最大限度降低误操作的影响。而从报道披露的信息来看,xAI在数据管理的流程上似乎还处于相对早期的状态。
另一个值得玩味的动作是,马斯克此前大肆采购的算力资源,如今并没有全部用在xAI自己的模型训练上。据称,这部分算力正通过SpaceX出租给Anthropic,同时也租给了Google。官方说辞是“临时过渡措施”,但结合团队缩减和训练事故来看,这种“过渡”更像是无奈之下的资源配置调整。
从外部“借”训练数据,到内部人员流失和数据事故,再到算力出租给竞争对手,这三个信号叠加在一起,呈现出的并不是一个平稳追赶的AI参赛者。更像是一个在资源、人才和合规层面同时承压的团队,试图用各种手段缩短与领先者的距离。
这种策略的风险在于:当你的训练数据来自对手,你的算力租给对手,你的团队核心成员也在流向对手时,差异化从哪里来?马斯克在法庭上说的“业内标准”,或许描述了现状,但并没有回答这个问题。
热门跟贴