北京时间2月24日,Anthropic 在官网甩出了一篇文章,叫《检测和防止蒸馏攻击》。
文章一发,科技圈直接炸锅。
因为这次 Anthropic 彻底不装了,直接指名道姓,把国内大模型圈的三大顶流,DeepSeek、月之暗面(Kimi)和 MiniMax 全挂在了墙上。
控诉的罪名听起来极其硬核:工业级蒸馏攻击。
啥意思呢?
指控这三家用一套叫「九头蛇」的复杂代理网络,换着马甲疯狂给 Claude 提问,然后,把 Claude 辛辛苦苦算出来的优质答案和推理过程(思维链)全扒走,拿回去喂自己的模型。
01
为了把事儿闹大,Anthropic 把这事儿跟「国家安全」、「规避护栏制造生物武器」绑在了一起。
硅谷顶流深夜破防,痛斥别人偷窃自己的智力成果,这戏码乍一看挺让人同情,不过,只要你稍微了解一点大模型的发家史,大概率第一反应会觉得滑稽。
为啥呢?因为所有闭源大模型巨头,包括 Anthropic、OpenAI,他们的第一桶金,本来就是「抢」来的。
咱们把时间倒回几年前,ChatGPT 刚出来时惊艳全场,大家都在惊呼人工智能迎来了奇点;但你想过没有,这些庞然大物怎么突然变得这么聪明的?是靠给全网的数据老老实实交版权费买来的吗?
根本没这回事。
他们早期的做法简单粗暴,直接开着赛博推土机,把人类在互联网上积累了几十年的精华全铲走了。
新闻网站的文章、作家辛辛苦苦写的小说、贴吧老哥的吹水记录、程序员在 GitHub 上一行行敲出来的开源代码,全被打包成了各种巨型数据集,一股脑塞进 GPU 里去「炼丹」。
那时候,纽约时报跟他们打官司,各类作家联名抗议,连画师都急得跳脚,觉得自己的饭碗被砸了。
面对全人类创作者的维权,这帮硅谷精英是怎么回应的?
他们耸耸肩,抛出一个极其优雅的词,叫「合理使用」;他们振振有词地辩解说,AI 只是「阅读」和「学习」,就像人类看书吸收知识一样,这种行为怎么能叫抄袭呢?
这叫「技术无罪」,这叫「加速人类文明进程」。
好家伙,合着你拿人类的数据去训练自己的商业模型,把全世界的羊毛薅秃了,这叫「改变世界」,吸全人类的血叫「赋能」。
结果现在,情况变了。
这帮人靠着全人类的免费数据,加上几万张算力卡,砸了几十亿美金,终于练出了全世界最聪明的大脑(比如 Claude),建起了高高的商业护城河。
他们现在成了赛博时代的新地主,开始按 token 收费了。
这时候,被 Anthropic 挂在墙上的这几家中国大模型独角兽,为了训练自己的模型,开着一堆号称「九头蛇」的代理账号,跑去问 Claude 各种极其复杂的逻辑题。
他们把 Claude 吭哧吭哧算出来的「思维链」和高质量回答全都存下来,拿回家去喂自己的小模型。
这种做法在技术圈有个专有名词,叫「蒸馏」。
Anthropic 一看后台数据,这还了得?连夜给这种行为扣了个大帽子,叫「工业级蒸馏攻击」,定性为赤裸裸的偷窃。
这画面真的太有戏剧性了。
当年你光脚时,去别人地里野蛮生长,你说为了全人类的进步;现在你穿上高跟鞋了,地盘占好了,别人跑来薅你几根羊毛,你就直接报警说这是恐怖袭击,甚至还要在博客里强行扯上「国家安全」和「生物武器」。
这哪里是在保护什么知识产权,你把门焊死了,顺便还把钥匙给吞了。
02
但咱们抛开公关战的口水,往深了想一层,为什么大家现在都要盯着 Claude 薅?因为这里藏着一个行业里心照不宣的信息差:人类的高质量数据,快被吃干抹净了。
现在的大模型行业,撞上了一堵「数据墙」。你现在再去爬互联网,爬出来的全是垃圾农场文和机器生成的废话,用这种水军语料训练出来的模型只会越来越脑残。
想要让模型继续变聪明,唯一出路,是用目前最顶级的 AI(也就是 Claude 和 GPT-5.2 这种级别的),去生成逻辑严密、推理复杂的优质数据,再用这些「合成数据」去训练下一代模型。
也就是说,「AI 教 AI」,用大模型去蒸馏小模型,是整个大模型行业往下走的必然规律。
Anthropic 现在的愤怒,实际上,它极度恐惧;它害怕在这个「合成数据」的时代,别人可以用极低成本,把它耗资百亿筑起来的智力壁垒,给生生拉平了。
所以,这第一笔账,是生死存亡的生意账。
既然这样,那到底是什么把 Anthropic 逼急的呢?我先说结论,答案是定价权,崩了。
过去这两年,做大模型就是一场拼财力的军备竞赛。不管是 OpenAI 还是 Anthropic,信奉的都是「大力出奇迹」。你要让模型变聪明,就得疯狂买英伟达的显卡。
几万张 H100 组个网,光一天的电费就是天文数字。训练一个像 Claude 这样的前沿模型,十几亿美金眼都不眨就砸进去了。
这种商业模式的算盘打得很精:我花几十亿建起极高的门槛,炼出世界上最聪明的大脑。然后,我就可以舒舒服服地向企业收高昂的 API 接口费,躺着把钱赚回来,顺便建立起谁也无法撼动的垄断地位。
但中国的AI独角兽们,根本不按套路出牌。
像 DeepSeek、Kimi 这些团队发现了一条极其致命的捷径。既然世界上已经有 Claude 这样的顶级「数学教授」了,我干嘛还要花几十亿去教一个「婴儿」学微积分?直接让我的模型去看教授的解题步骤不就行了?
这就是「工业级蒸馏」最恐怖的地方。
咱们来算算这笔极度不对等的经济账,Anthropic 搞出 Claude 花了十几个亿美金;而蒸馏者们套取几百万条高质量思维链数据,就算 Claude 的 API 定价再贵,总成本撑死也就几百万美金。
就靠着这几百万美金的「课本」,加上一些极其精巧的强化学习算法,硬生生能搞出一个智力水平达到 Claude 八九成的小模型。
这就好比 Anthropic 花了三百亿修了一条跨海大桥,指望收五十年高价过路费回本;结果旁边有人花三百万造了个传送门,票价只要你的一百分之一,甚至还直接开源。
这谁受得了?你的大桥瞬间就成了赛博时代的烂尾楼。
特别是今年初,这波冲击把大模型 API 的价格直接打成了白菜价;当客户发现,用极低的成本就能满足 90% 的业务需求时,谁还会去买 Anthropic 昂贵的企业级服务?这等于是把闭源巨头的饭碗给端了。
03
但最滑稽的地方来了。商业模式漏水了,投资人要看财报了,你总不能在官网发个公告说「同行抄作业太快,把我们价格打下来了,我们赚不到钱了」吧?这不仅跌份,也得不到华盛顿政客们的同情。
所以,商业理由拿不出手,那就只能玩一招阴的:降维打击,把商业竞争包装成国家安全。
这也就是为什么,Anthropic 在这篇博客里死死咬住「安全护栏」不放。
他们的话术非常巧妙,你们蒸馏了我们的智力,却没有带走我们的安全限制,这种模型如果被用来制造生物武器怎么办?
扯生物武器是假,向监管机构递刀子是真。潜台词就是:老大你快看,美国的芯片禁令被他们用「蒸馏」技术绕过去了,如果政府再不管管这种行为,美国的国家安全就全完了。
这才是《检测和防止蒸馏攻击》背后,最赤裸裸的阳谋。
既然撕破脸了,Anthropic 当然不能光靠向华盛顿告状,在这篇大字报的后半段,他们得意洋洋地亮出了自己研发的「反击武器」。
什么武器呢?主要有两招。
第一招,叫「行为指纹识别」。说白了是抓内鬼。普通人怎么用 Claude?都是问帮我写封邮件、这道菜怎么做。
但那些搞蒸馏的代理机器人,上来就「请一步步仔细思考,输出完整的逻辑推导过程,字数不少于 3000 字」。
这种极其机械、带有明显套话特征的提问,在 Anthropic 的后台监控里,就像黑夜里的探照灯一样明显。只要识别出来,直接打上标记。
第二招更阴,叫「数据投毒」或者「数据降级」。这也是他们觉得最骄傲的一招。
Anthropic 心想,我如果直接封你的号,你肯定马上换个马甲接着来;所以我不封你,只要我识别出你是来偷师的机器人,我就在正常输出里偷偷给你掺沙子。
类似于,我给你看似合理的废话,或者在逻辑链条里悄悄埋下一个极其隐蔽的错误结论。
这套组合拳听起来是不是特别高大上?特别有赛博朋克的威慑力?可是,靠着这种「刻舟求剑」式的封号与投毒,真的能挡住大模型世界的「平权运动」吗?我认为,不能。
04
真正的商业丛林和技术演进面前,这种防御注定只是一场徒劳的「打地鼠游戏」;因为在巨大的商业套利空间面前,任何技术护城河都是千疮百孔的。
你搞指纹识别,拦截带有特征的提示词。那好,对面的独角兽公司立刻就会升级「九头蛇」网络,把提问方式伪装得比真实人类还要自然。
他们甚至可以用另一个小模型,来专门生成千奇百怪的提问方式,彻底打乱你的指纹特征。
你搞数据投毒。确实,这招一开始会恶心到不少人。但别忘了,做模型的公司也不是吃素的;现在行业里流行用「奖励模型」或者让大模型自己做裁判(也就是 LLM-as-a-Judge)来清洗数据。
道高一尺,魔高一丈。只要「千万美金训练」和「十亿美金研发」之间的巨大成本差还在,这种攻防战就永远不会停止,而且进攻方永远处于成本优势。
所以,不难发现,Anthropic 真正对抗的,其实是一股不可逆的历史洪流,大模型发展到现在,本质上正在经历一场惨烈的「平权运动」。
而善于利用开源架构、利用蒸馏技术疯狂追赶的挑战者,他们做的事情,是把高高在上的 AI 能力打落凡间,变成极其廉价的、人人都能用得起的「水电煤」。
蒸馏技术,就是这场平权运动中最锋利的武器,它打破了算力垄断,让知识和逻辑得以低成本复制。
所以,Anthropic 的投毒和封号,本质上和当年马车夫抗议汽车上路、贵族抗议活字印刷术没什么区别;你可以短暂地在代码里下毒,但你无法阻挡技术向着更普惠、更低成本的方向野蛮生长。
既然是一场不可逆的洪流,那这场大戏往后演会被冲刷成什么样?
我认为AI 世界正在落下第一道正式的「柏林墙」。墙的这一边,是以 Anthropic 和 OpenAI 为代表的「旧神」。他们试图建立一种秩序。
AI 必须是昂贵的、被监管的、合规的,并且只有少数通过了「安全测试」的精英才能掌控最强的智力。
墙的那一边,是全球无数的开发者和像 DeepSeek 这样的「叛逆者」。他们信奉智力应该像水电煤一样廉价,数据应该像空气一样自由流动。
他们用蒸馏、用开源、用各种看似「不讲武德」的方式,把高高在上的神坛拆解成无数块砖,铺在每个人脚下。
这场战争才刚刚开始。
Anthropic 以后也许会把墙修得更高,甚至拉上政府的铁丝网。但在商业规律面前,「便宜 99% 但能力只有 90%」的产品,永远比「昂贵 100% 但能力 100%」的产品更有生命力。
正如凯文·凯利所说:目光聚集的地方,金钱必将追随;而效率提升的地方,阻力必将消散。
蒸馏攻击,或许只是推倒这堵墙的第一块多米诺骨牌。
而我们也乐见其成;毕竟,只有当神像被打破时,真正的普惠时代,才会降临。笑死了。
热门跟贴