是什么让 Anthropic 破防了？|anthropic|大模型|新论文|疯狂|顶流

北京时间2月24日，Anthropic 在官网甩出了一篇文章，叫《检测和防止蒸馏攻击》。

文章一发，科技圈直接炸锅。

因为这次 Anthropic 彻底不装了，直接指名道姓，把国内大模型圈的三大顶流，DeepSeek、月之暗面（Kimi）和 MiniMax 全挂在了墙上。

控诉的罪名听起来极其硬核：工业级蒸馏攻击。

啥意思呢？

指控这三家用一套叫「九头蛇」的复杂代理网络，换着马甲疯狂给 Claude 提问，然后，把 Claude 辛辛苦苦算出来的优质答案和推理过程（思维链）全扒走，拿回去喂自己的模型。

01

为了把事儿闹大，Anthropic 把这事儿跟「国家安全」、「规避护栏制造生物武器」绑在了一起。

硅谷顶流深夜破防，痛斥别人偷窃自己的智力成果，这戏码乍一看挺让人同情，不过，只要你稍微了解一点大模型的发家史，大概率第一反应会觉得滑稽。

为啥呢？因为所有闭源大模型巨头，包括 Anthropic、OpenAI，他们的第一桶金，本来就是「抢」来的。

咱们把时间倒回几年前，ChatGPT 刚出来时惊艳全场，大家都在惊呼人工智能迎来了奇点；但你想过没有，这些庞然大物怎么突然变得这么聪明的？是靠给全网的数据老老实实交版权费买来的吗？

根本没这回事。

他们早期的做法简单粗暴，直接开着赛博推土机，把人类在互联网上积累了几十年的精华全铲走了。

新闻网站的文章、作家辛辛苦苦写的小说、贴吧老哥的吹水记录、程序员在 GitHub 上一行行敲出来的开源代码，全被打包成了各种巨型数据集，一股脑塞进 GPU 里去「炼丹」。

那时候，纽约时报跟他们打官司，各类作家联名抗议，连画师都急得跳脚，觉得自己的饭碗被砸了。

面对全人类创作者的维权，这帮硅谷精英是怎么回应的？

他们耸耸肩，抛出一个极其优雅的词，叫「合理使用」；他们振振有词地辩解说，AI 只是「阅读」和「学习」，就像人类看书吸收知识一样，这种行为怎么能叫抄袭呢？

这叫「技术无罪」，这叫「加速人类文明进程」。

好家伙，合着你拿人类的数据去训练自己的商业模型，把全世界的羊毛薅秃了，这叫「改变世界」，吸全人类的血叫「赋能」。

结果现在，情况变了。

这帮人靠着全人类的免费数据，加上几万张算力卡，砸了几十亿美金，终于练出了全世界最聪明的大脑（比如 Claude），建起了高高的商业护城河。

他们现在成了赛博时代的新地主，开始按 token 收费了。

这时候，被 Anthropic 挂在墙上的这几家中国大模型独角兽，为了训练自己的模型，开着一堆号称「九头蛇」的代理账号，跑去问 Claude 各种极其复杂的逻辑题。

他们把 Claude 吭哧吭哧算出来的「思维链」和高质量回答全都存下来，拿回家去喂自己的小模型。

这种做法在技术圈有个专有名词，叫「蒸馏」。

Anthropic 一看后台数据，这还了得？连夜给这种行为扣了个大帽子，叫「工业级蒸馏攻击」，定性为赤裸裸的偷窃。

这画面真的太有戏剧性了。

当年你光脚时，去别人地里野蛮生长，你说为了全人类的进步；现在你穿上高跟鞋了，地盘占好了，别人跑来薅你几根羊毛，你就直接报警说这是恐怖袭击，甚至还要在博客里强行扯上「国家安全」和「生物武器」。

这哪里是在保护什么知识产权，你把门焊死了，顺便还把钥匙给吞了。

02

但咱们抛开公关战的口水，往深了想一层，为什么大家现在都要盯着 Claude 薅？因为这里藏着一个行业里心照不宣的信息差：人类的高质量数据，快被吃干抹净了。

现在的大模型行业，撞上了一堵「数据墙」。你现在再去爬互联网，爬出来的全是垃圾农场文和机器生成的废话，用这种水军语料训练出来的模型只会越来越脑残。

想要让模型继续变聪明，唯一出路，是用目前最顶级的 AI（也就是 Claude 和 GPT-5.2 这种级别的），去生成逻辑严密、推理复杂的优质数据，再用这些「合成数据」去训练下一代模型。

也就是说，「AI 教 AI」，用大模型去蒸馏小模型，是整个大模型行业往下走的必然规律。

Anthropic 现在的愤怒，实际上，它极度恐惧；它害怕在这个「合成数据」的时代，别人可以用极低成本，把它耗资百亿筑起来的智力壁垒，给生生拉平了。

所以，这第一笔账，是生死存亡的生意账。

既然这样，那到底是什么把 Anthropic 逼急的呢？我先说结论，答案是定价权，崩了。

过去这两年，做大模型就是一场拼财力的军备竞赛。不管是 OpenAI 还是 Anthropic，信奉的都是「大力出奇迹」。你要让模型变聪明，就得疯狂买英伟达的显卡。

几万张 H100 组个网，光一天的电费就是天文数字。训练一个像 Claude 这样的前沿模型，十几亿美金眼都不眨就砸进去了。

这种商业模式的算盘打得很精：我花几十亿建起极高的门槛，炼出世界上最聪明的大脑。然后，我就可以舒舒服服地向企业收高昂的 API 接口费，躺着把钱赚回来，顺便建立起谁也无法撼动的垄断地位。

但中国的AI独角兽们，根本不按套路出牌。

像 DeepSeek、Kimi 这些团队发现了一条极其致命的捷径。既然世界上已经有 Claude 这样的顶级「数学教授」了，我干嘛还要花几十亿去教一个「婴儿」学微积分？直接让我的模型去看教授的解题步骤不就行了？

这就是「工业级蒸馏」最恐怖的地方。

咱们来算算这笔极度不对等的经济账，Anthropic 搞出 Claude 花了十几个亿美金；而蒸馏者们套取几百万条高质量思维链数据，就算 Claude 的 API 定价再贵，总成本撑死也就几百万美金。

就靠着这几百万美金的「课本」，加上一些极其精巧的强化学习算法，硬生生能搞出一个智力水平达到 Claude 八九成的小模型。

这就好比 Anthropic 花了三百亿修了一条跨海大桥，指望收五十年高价过路费回本；结果旁边有人花三百万造了个传送门，票价只要你的一百分之一，甚至还直接开源。

这谁受得了？你的大桥瞬间就成了赛博时代的烂尾楼。

特别是今年初，这波冲击把大模型 API 的价格直接打成了白菜价；当客户发现，用极低的成本就能满足 90% 的业务需求时，谁还会去买 Anthropic 昂贵的企业级服务？这等于是把闭源巨头的饭碗给端了。

03

但最滑稽的地方来了。商业模式漏水了，投资人要看财报了，你总不能在官网发个公告说「同行抄作业太快，把我们价格打下来了，我们赚不到钱了」吧？这不仅跌份，也得不到华盛顿政客们的同情。

所以，商业理由拿不出手，那就只能玩一招阴的：降维打击，把商业竞争包装成国家安全。

这也就是为什么，Anthropic 在这篇博客里死死咬住「安全护栏」不放。

他们的话术非常巧妙，你们蒸馏了我们的智力，却没有带走我们的安全限制，这种模型如果被用来制造生物武器怎么办？

扯生物武器是假，向监管机构递刀子是真。潜台词就是：老大你快看，美国的芯片禁令被他们用「蒸馏」技术绕过去了，如果政府再不管管这种行为，美国的国家安全就全完了。

这才是《检测和防止蒸馏攻击》背后，最赤裸裸的阳谋。

既然撕破脸了，Anthropic 当然不能光靠向华盛顿告状，在这篇大字报的后半段，他们得意洋洋地亮出了自己研发的「反击武器」。

什么武器呢？主要有两招。

第一招，叫「行为指纹识别」。说白了是抓内鬼。普通人怎么用 Claude？都是问帮我写封邮件、这道菜怎么做。

但那些搞蒸馏的代理机器人，上来就「请一步步仔细思考，输出完整的逻辑推导过程，字数不少于 3000 字」。

这种极其机械、带有明显套话特征的提问，在 Anthropic 的后台监控里，就像黑夜里的探照灯一样明显。只要识别出来，直接打上标记。

第二招更阴，叫「数据投毒」或者「数据降级」。这也是他们觉得最骄傲的一招。

Anthropic 心想，我如果直接封你的号，你肯定马上换个马甲接着来；所以我不封你，只要我识别出你是来偷师的机器人，我就在正常输出里偷偷给你掺沙子。

类似于，我给你看似合理的废话，或者在逻辑链条里悄悄埋下一个极其隐蔽的错误结论。

这套组合拳听起来是不是特别高大上？特别有赛博朋克的威慑力？可是，靠着这种「刻舟求剑」式的封号与投毒，真的能挡住大模型世界的「平权运动」吗？我认为，不能。

04

真正的商业丛林和技术演进面前，这种防御注定只是一场徒劳的「打地鼠游戏」；因为在巨大的商业套利空间面前，任何技术护城河都是千疮百孔的。

你搞指纹识别，拦截带有特征的提示词。那好，对面的独角兽公司立刻就会升级「九头蛇」网络，把提问方式伪装得比真实人类还要自然。

他们甚至可以用另一个小模型，来专门生成千奇百怪的提问方式，彻底打乱你的指纹特征。

你搞数据投毒。确实，这招一开始会恶心到不少人。但别忘了，做模型的公司也不是吃素的；现在行业里流行用「奖励模型」或者让大模型自己做裁判（也就是 LLM-as-a-Judge）来清洗数据。

道高一尺，魔高一丈。只要「千万美金训练」和「十亿美金研发」之间的巨大成本差还在，这种攻防战就永远不会停止，而且进攻方永远处于成本优势。

所以，不难发现，Anthropic 真正对抗的，其实是一股不可逆的历史洪流，大模型发展到现在，本质上正在经历一场惨烈的「平权运动」。

而善于利用开源架构、利用蒸馏技术疯狂追赶的挑战者，他们做的事情，是把高高在上的 AI 能力打落凡间，变成极其廉价的、人人都能用得起的「水电煤」。

蒸馏技术，就是这场平权运动中最锋利的武器，它打破了算力垄断，让知识和逻辑得以低成本复制。

所以，Anthropic 的投毒和封号，本质上和当年马车夫抗议汽车上路、贵族抗议活字印刷术没什么区别；你可以短暂地在代码里下毒，但你无法阻挡技术向着更普惠、更低成本的方向野蛮生长。

既然是一场不可逆的洪流，那这场大戏往后演会被冲刷成什么样？

我认为AI 世界正在落下第一道正式的「柏林墙」。墙的这一边，是以 Anthropic 和 OpenAI 为代表的「旧神」。他们试图建立一种秩序。

AI 必须是昂贵的、被监管的、合规的，并且只有少数通过了「安全测试」的精英才能掌控最强的智力。

墙的那一边，是全球无数的开发者和像 DeepSeek 这样的「叛逆者」。他们信奉智力应该像水电煤一样廉价，数据应该像空气一样自由流动。

他们用蒸馏、用开源、用各种看似「不讲武德」的方式，把高高在上的神坛拆解成无数块砖，铺在每个人脚下。

这场战争才刚刚开始。

Anthropic 以后也许会把墙修得更高，甚至拉上政府的铁丝网。但在商业规律面前，「便宜 99% 但能力只有 90%」的产品，永远比「昂贵 100% 但能力 100%」的产品更有生命力。

正如凯文·凯利所说：目光聚集的地方，金钱必将追随；而效率提升的地方，阻力必将消散。

蒸馏攻击，或许只是推倒这堵墙的第一块多米诺骨牌。

而我们也乐见其成；毕竟，只有当神像被打破时，真正的普惠时代，才会降临。笑死了。

是什么让 Anthropic 破防了？

01

02

03

04

热搜

热门跟贴

01

02

03

04

热搜

热门跟贴

相关推荐

Anthropic给中国AI打了个大广告

还好意思说别人蒸馏？马斯克抨击Anthropic大规模盗用训练数据

被关门外直接破防，男人的好胜心绷不住了

这是整什么，简直是不理解，最后直接破防!

好家伙没想到，这真的太破防，不敢陪伴咋办！

这次真的是防不胜防！

为什么要撕破降落伞的布料？

乌龟也被破防了，神兵利器破甲装

忙活一晚上都破不了防啊

这下怎么解决，真的是太破防，简直是没想到！

用突破来做交易，胜率不会超过40%

三哥居然让一个网红整破防了，哪里说理去！

春节AI暗战

大模型黑箱被撬开：MIT华人联创，造出能追溯思考过程的大模型

北航开源Code2Bench：双扩展动态评测，代码大模型告别躺平刷分

AI记住失败经验：微软提出Re-TRAC框架，4B性能SOTA，30B超越358B

马年4大顶流模型会师阿里云Coding Plan开工！Token量大管饱

Anthropic与软件业合作智能体缓解市场忧虑

五角大楼极限施压Anthropic，要求周六前解除所有AI安全限制

北大ProAct：首个双系统「主动社交」智能体，不做提线木偶