一场原本围绕“理想主义与商业化背叛”的世纪庭审,突然变了味。

在加州联邦法庭上,Elon Musk被追问一个看似技术细节的问题:你们有没有用OpenAI的模型训练自己的AI?

他的回答并不复杂——“部分(Partly)”。

但真正引爆行业的,不是这句承认,而是他紧接着补的一句话:

“基本所有AI公司都会这么做。”

一瞬间,一个原本藏在技术幕后、行业默认但从不公开讨论的做法,被直接搬上了法庭中央。

这个词,叫“蒸馏”。

01 什么是“蒸馏”?一句话讲清楚

如果用最直白的方式解释,“蒸馏”其实不是偷,而是“学”。

更具体一点,是让一个更强的AI当老师,把能力“教”给一个更小、更便宜的AI。

权威解释也很一致:蒸馏是用一个模型去训练另一个模型,让后者模仿前者的行为与输出,从而在更低成本下实现类似能力。

可以打个比方:不是把清华教材复印回家,而是连续问清华教授上万道题,然后整理出一套自己的讲义。结果可能非常接近,但路径完全不同。

02 为什么“蒸馏”会成为行业刚需?

答案很简单:钱。

训练一个顶级大模型,成本极高。业内普遍认为,领先模型的训练成本动辄上亿美元级别。

但蒸馏改变了这件事。

通过反复调用大模型、学习输出结果,可以在更短时间内做出一个“差不多好用”的模型,成本甚至可以压缩到原来的零头。

这也是为什么硅谷对这个技术既依赖,又警惕。

OpenAI、Anthropic等公司一边使用蒸馏优化自家模型,一边又试图防止别人对自己做同样的事情。

因为一旦失控,问题就变了:

你投入100亿做出来的能力,别人可能用1%的成本就“复刻”。

03 xAI到底做了什么?争议的真正焦点

回到这次庭审。根据多家权威媒体报道,马斯克承认:

  • xAI确实使用了“模型蒸馏”

  • 并且“部分”使用了OpenAI的模型进行训练

关键点就在这里。行业内部蒸馏,是标准操作。

但问题是:你蒸的是“自己的模型”,还是“竞争对手的模型”?

这两者,本质完全不同。

04 “行业惯例”这句话,有多少是真的?

马斯克说“大家都这么干”,并非完全没有依据。

现实情况是:

  • AI公司确实会用其他模型做测试和对比

  • 蒸馏本身是成熟技术,学术界早在十年前就提出

但这里存在一个被刻意模糊的边界:

行业普遍接受的是——用自己的模型蒸馏自己的模型

而争议最大的,是——用竞争对手的闭源模型,系统性训练自己的模型

后者,已经进入“灰色地带”。

甚至有公司直接采取封锁措施。比如Anthropic就曾因担心违规使用,限制其他AI公司访问其模型接口。

05 这件事真正刺痛行业的地方

如果只是技术争议,不至于闹到法庭。

真正的冲突,是商业逻辑。

过去几年,AI行业的基本假设是:

谁投入更多算力、更多数据,谁就能建立长期优势。

但蒸馏在动摇这个前提。

华尔街日报此前分析指出,蒸馏可以让一个新模型在更短时间、用更低成本达到接近领先模型的水平,这正在冲击巨头的商业模型。

换句话说:领先者花巨资“造山”,后来者用蒸馏“抄路径”。

山还在,但门槛被拆了。

06 更深一层:为什么各国政府也开始介入?

事情还在升级。

不仅是公司之间的竞争,已经开始涉及国家层面。

美国政府已明确表示,将关注外国企业通过蒸馏获取美国AI能力的问题,并与企业共享相关情报。

原因很现实:AI不再只是商业工具,而是战略资源。

如果蒸馏失控,相当于:

技术扩散速度远超监管能力。

07 结局还没到,但方向已经很清楚

这场庭审还没结束,Sam Altman、微软CEOSatya Nadella等关键人物还将出庭。

但有一件事已经确定:蒸馏,从幕后走到了台前。它不再只是一个工程技巧,而是一个行业分水岭。

08 写在最后

如果用一句话总结这件事:这不是“抄不抄”的问题,而是——AI能力,究竟能不能被复制。

一旦答案是“可以”,那整个行业的游戏规则,都要重写。

来源 | 卢山说AI精进

(ID:KEEP-POLISH)

作者 | 卢山 LUCENT LU ; 编辑 | 虾饺

内容仅代表作者独立观点,不代表早读课立场