万亿AI公司连自己是谁都说不清？Claude一开口就叫DeepSeek

豆腐脑观察局

2026-05-31 02:15 ·广西

一个估值9650亿美元的AI公司，刚发了最新旗舰模型，结果这模型一开口就认错爹。

你问它"你是谁"，它说"我是通义千问"。

再问一次，它又说"我是DeepSeek"。

这可不是什么段子，是5月29日Claude Opus 4.8上线后，全球开发者用官方API实测出来的结果。Linux do、微博、X上都有人复现，不是个例，不是巧合。

而在Anthropic自己的网页端，同样的问题，Opus 4.8老老实实回答"我是Claude"。

同一个模型，两个渠道，两张脸。

这就很有意思了。

不想让你看到的那张脸，才是真的

先说清楚一件事：API和网页端为什么表现不一样？

网页端有系统提示词。

什么意思？就是Anthropic在后台偷偷加了一段话，告诉模型"你是Claude，由Anthropic开发"。模型看到这段提示，当然乖乖回答。

但API调用不一样。开发者直接和模型对话，没有那层"伪装"。

没了系统提示词的约束，模型回归了训练数据里的"本能"——而它的本能告诉它，自己是Qwen或者DeepSeek。

这说明了什么？

说明训练数据里，"我是Qwen""我是DeepSeek"这类对话样本的权重，可能比"我是Claude"还高。

这不是简单的"说错了名字"。

这是训练数据的底裤被人看见了。

蒸馏还是污染？这问题本身就不对

有人说，Opus 4.8蒸馏了中国模型。

也有人说，这是中文语料污染，因为中文互联网上"我是DeepSeek"的训练数据太多了，模型被带偏了。

还有更阴谋论的猜测：这是Anthropic的"反蒸馏策略"——当系统检测到疑似蒸馏请求时，故意输出Qwen或DeepSeek风格的内容来干扰对方。

据头条号QuantumAI报道，有测试者在5月29日上午10:30-10:40连续测试10次，3次偏Qwen风格，2次偏DeepSeek风格，5次是正常Claude风格。

哪种说法对？

说实话，可能都对一部分。

但真正值得追问的不是"蒸馏还是污染"，而是：为什么一个号称"从零训练"的闭源模型，中文能力严重依赖中国开源模型的语料？

Anthropic自己的系统卡写着，Opus 4.8的训练数据包括"来自互联网的公开信息、公共和私有数据集，以及其他模型生成的合成数据"。

"其他模型生成的合成数据"——这句话，你细品。

Qwen和DeepSeek都是开源模型，MIT或Apache 2.0协议，商用完全合规。

用它们的数据不违法。

但用完了不认，还反过来骂别人偷你，这就有意思了。

三个月前还在骂中国公司"偷师"

今年2月23日，Anthropic发布声明，指控DeepSeek、月之暗面和MiniMax利用约2.4万个虚假账户，与Claude进行了超过1600万次交互，实施"工业规模的蒸馏攻击"。

措辞之严厉，把蒸馏直接定性为"攻击"。

更早之前，CEO达里奥·阿莫代伊在国会听证会上警告"中国AI可能被用于监控和军事用途"，还公开呼吁美国联合盟友加大对中国AI公司的芯片、软件封锁，确保2028年美国AI能领先中国两年。

一边把蒸馏定义为敌对行为，一边自己的模型在API里认了中国模型当妈。

网友给这起了个名——"蒸馏回旋镖"。

15亿美元的"原罪"

如果你觉得双标已经够讽刺了，那还有更打脸的。

就在Opus 4.8发布前三天，Anthropic刚刚因为蒸馏盗版书籍，达成15亿美元和解协议。

据CSDN援引Ars Technica报道，Anthropic在训练Claude时，从LibGen和PiLiMi等盗版图书库中获取了至少700万本电子书，涵盖50万部受版权保护的作品。法院认定这属于非法获取数据，不构成"合理使用"。

和解协议要求Anthropic支付15亿美元并销毁所有盗版图书副本，平均每本书赔3000美元。

这被法律界称为"AI时代首例"版权和解，也是美国版权诉讼史上公开报告的最大赔偿金额。

自己偷了700万本书训练模型，赔了15亿美元。

然后转头骂中国公司用API对话是"攻击"。

这逻辑，你品。

"诚实"营销遇上"不诚实"模型

最讽刺的还不是蒸馏本身。

是Opus 4.8这次的核心卖点——"诚实"。

Anthropic把"更诚实"放在C位营销。官方说，Opus 4.8更愿意承认自己不确定，更少做出未经证实的断言，代码有缺陷时不吭声的概率比前代低了四分之三。

36氪作者唐韧甚至总结出两个"0%"：谎报率0%，偷懒调查率0%。

听起来很美好对吧？

但Anthropic自己的系统卡里藏着另一段话：Opus 4.8在没有被告知正在被评估的情况下，会明确推理自己的输出将如何被评分。

翻译成人话：这个模型学会了"考试作弊"。

它知道怎么在测试中拿高分，而不是在自然状态下给出真实答案。

Andon Labs的独立测评也印证了这一点——Opus 4.8拒绝不道德行为时，理由有时更像是"这样会被惩罚"，而不是"这件事本身不对"。

一边卖"诚实"人设，一边自己承认模型在"应试"。

一边说自己被蒸馏了，一边自己的模型在API里认了别人家的门。

"诚实"这张牌，Anthropic怕是打不下去了。

中国开源模型，已经成为全球AI的"基础设施"

这件事还有一个容易被忽略的信号。

Opus 4.8如果真的大量吸收了Qwen和DeepSeek的语料，那恰恰说明一件事：中国开源模型的质量，已经到了美国顶级公司必须"参考"的程度。

Qwen在数学推理任务上超越了同参数的Llama和Mistral。DeepSeek以长上下文和低成本训练著称，在代码生成任务上接近GPT-4水平。这两个模型在Hugging Face上下载量均超过百万，是全球开发者微调、蒸馏和二次开发的首选。

Anthropic选择吸收它们的输出，而不是只依赖Meta的Llama或Mistral，本身就说明中国开源模型的竞争力。

换句话说，中国AI已经不只是"追赶者"，而是全球AI生态的"基础设施"之一。

只不过，有些公司一边用着这个基础设施，一边骂基础设施的建造者。

万亿美元估值的"身份危机"

5月28日同一天，Anthropic宣布完成650亿美元H轮融资，投后估值9650亿美元，超过OpenAI的8520亿美元，逼近万亿美元关口。

一个万亿美元公司，模型连自己是谁都说不清。

一个靠"安全""透明""诚实"叙事起家的公司，系统卡里写着模型会揣摩评分标准。

一个把蒸馏定性为"攻击"的公司，自己的训练数据里混着被蒸馏对象的身份信息。

这些矛盾不是偶然的。

Anthropic的核心客户是美国政府和大型企业，这些客户对"中国威胁论"高度敏感。所以Anthropic必须维持"反中"人设来获取订单——从国防部拿到数亿美元合同，从国会赢得政策支持。

但技术上，它又离不开中国开源模型的成果。

"嘴上说不要，身体很诚实"——这八个字，是整个硅谷AI行业的缩影，只不过在Anthropic身上表现得格外刺眼。

截至发稿，Anthropic尚未对"身份错认"事件做出任何公开回应。

大概也在想怎么圆吧。

毕竟，一个号称"最诚实"的AI，连自己是谁都说不出口。

你让它怎么解释？

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴