节后复建这两天,瓜真是多的吃不完。

就在昨天晚上,美国知名AI Cluade的母公司Anthropic发布了一则名为《检测和防止蒸馏攻击》的报告。

打开网易新闻 查看精彩图片

内容大概就是说,中国有三家AI公司,正在对Claude进行大规模的“蒸馏攻击”——

这三家公司分别叫做DeepSeek、MoonShot(月之暗面)和MiniMax。

好家伙,这基本上把国产头部的AI独角兽给包圆了。

可能有朋友要问,什么是“蒸馏”?

黑马简单科普一下:

蒸馏这个词语是AI行业的一个通用术语,简单来说就是用一个大模型去训练另一个小模型。

打开网易新闻 查看精彩图片

图源:特大号

通常操作就是用小模型和大模型进行对话,让小模型去学习大模型某一部分的技能和知识,这样训练出来的小模型往往更精通某一个领域,但优势是体积更精炼,运行速度更快,成本也更低。

至于这个行为是否合理……

这么说吧,目前蒸馏可以说基本就是AI圈的基操,谁家要是发布了一个领先的模型,第二天就可能就会有其他模型过来蒸馏,所谓是共同进步。

包括Anthropic自己,早年也从ChatGPT蒸馏的Cluade。

打开网易新闻 查看精彩图片

还有老哥的截图作证,Claude sonnet 4.6也没少朝DeepSeek V3下手。

打开网易新闻 查看精彩图片

那问题来了,这事儿都快成行业潜规则了,并且您自己也是参与者之一,这次咋就零帧起手开团了呢?

然后我继续看,发现Anthropic确实也承认蒸馏是一种广泛使用且合法的训练方法。

但是又拧巴的强调,蒸馏同样会被用于非法目的:竞争对手可以利用它,以极低的成本和极短的时间,从其他实验室获取强大的功能。

而在指控中,黑马发现Anthropic一直在强调所谓的“蒸馏攻击”

打开网易新闻 查看精彩图片

没听过没关系,这之前我也没听说过,用Anthropic的解释就是:

这不是寻常的蒸馏,而是友商通过科技的手段,在同一时间用大规模的账户,重复性的、有逻辑的访问Claude进行对话。

再加上这之前Cluade明令禁止了向中国大陆地区停止支持,之后又进一步扩大为中资关联方,反正中国的AI用了Cluade就违反了他们的区域访问限制。

Anthropic认为,这种行为简直就是可以和“国家安全”、“生物武器”、“出口管制”放在一个层面上的威胁国家安全的事件。

打开网易新闻 查看精彩图片

Anthropic给出的数据是,DeepSeek进行了约15万次的交互规模,主要针对的Cluade多任务推理能力、以及如何生成规避审查的答案等;月之暗面进行了超过340万次的交互,试图提取和重建Claude的推理链;而MiniMax的交互规模则高达1300万次,并且在Anthropic发布新模型后迅速调整了策略转向了新系统。

针对以上指控内容,DeepSeek、月之暗面和MiniMax目前都没有公开回应。

相比之下,外网网友的反应都比当事人大得多。

打开网易新闻 查看精彩图片

可能不少朋友吃过这瓜了,作为“苦主”Anthropic不仅没有得到外界的同情,反而成了大家群嘲的对象。

以马斯克为首的乐子人网友表示:哥们儿,当年你用盗版书训练模型最后赔了15亿美元的时候,你可不是这么说的。

打开网易新闻 查看精彩图片

而且这事儿不才过没多久吗,去年9月Anthropic刚付的钱,这会儿就不记得了?

再说了,你Anthropic搞闭源拒绝开源模型分享,却没少用人家Qwen和Llama的开源模型做研究,现在你模型就在那放着,那别人通过指令扒一下你底裤咋了……

打开网易新闻 查看精彩图片

实在不行再退一万步说,即便Anthropic一再强调有24000个账户与Claude进行了超过1600万次交互,也不能直接证明DeepSeek、Moonshot利用上述交互获取的知识,实质上用于了大模型训练。

虽然你Anthropic声称通过IP、元数据溯源,但没有公开任何具体实证,指控月之暗面的理由也仅为“请求元数据与该公司高级员工公开资料匹配”……

没说服力啊哥们。

打开网易新闻 查看精彩图片

我反正觉得,目前蒸馏这事儿就属于一个“灰色地带”,作为后来者的时候,大家都各凭本事你争我抢,但一旦成了领跑的那位,就又会立马换一副嘴脸站在道德制高点指指点点……

而且黑马寻思,美国AI企业频繁对中国AI企业的指控,很难说没有一种焦虑在里面。

不知道大家有没有关注过,目前中国的开源模型应该是全球最多的。

昨天全球最大 AI 开源社区 Hugging Face公布新一期开源大模型榜单,榜单显示,阿里最新开源的原生多模态模型千问3.5登顶全球榜首;

此外在排名前十的大模型中,有8款来自中国团队包括阿里千问、智谱、MiniMax、月之暗面等。

打开网易新闻 查看精彩图片

相比之下,美国除了Meta等少数公司,头部玩家例如OpenAI、Google、Anthropic等的核心模型普遍都选择闭源。

一个很大的原因,就是因为美国的前沿模型目前处于领跑者的位置,对于领先者而言,闭源是最有效的维持技术优势和商业回报的选择。

而对于国内的AI企业来说,后发先至的一个重要手段就是开源,毕竟在程序员社区中,开源已经成为政治正确,吸引了不少人才共同建立开发生态……

如今,眼看着中国就要弯道超车了,从这个角度来看,美国疯狂针对中国AI就说的通了。

另外,还有一个有意思的事是,NBC曾报道,Anthropic因为质疑美军突袭马杜罗行动时使用Cluade的方式,被五角大楼警告。

打开网易新闻 查看精彩图片

2月23日,Axios报道国防部长Hegseth将于次日召见Dario Amodei,敲打一下这位Anthropic首席执行官的意识形态立场。

结果当天,Anthropic就发布了这篇蒸馏博文。

最后还强cue了一手美国的芯片出口管制,说这些蒸馏攻击破坏了美国的出口管制政策,证明了美国限制芯片出口的重要性。

啧。

不是,哥们这也能扯?

只能说,事情发展到这,DeepSeek、月之暗面和MiniMax是否蒸馏攻击了Cluade已经不再重要了……

Anthropic突然发难的原因,真是好难猜啊。

撰文:柯然

编辑:Lena