一个估值9650亿美元的AI公司,刚发了最新旗舰模型,结果这模型一开口就认错爹。
你问它"你是谁",它说"我是通义千问"。
再问一次,它又说"我是DeepSeek"。
这可不是什么段子,是5月29日Claude Opus 4.8上线后,全球开发者用官方API实测出来的结果。Linux do、微博、X上都有人复现,不是个例,不是巧合。
而在Anthropic自己的网页端,同样的问题,Opus 4.8老老实实回答"我是Claude"。
同一个模型,两个渠道,两张脸。
这就很有意思了。
不想让你看到的那张脸,才是真的
先说清楚一件事:API和网页端为什么表现不一样?
网页端有系统提示词。
什么意思?就是Anthropic在后台偷偷加了一段话,告诉模型"你是Claude,由Anthropic开发"。模型看到这段提示,当然乖乖回答。
但API调用不一样。开发者直接和模型对话,没有那层"伪装"。
没了系统提示词的约束,模型回归了训练数据里的"本能"——而它的本能告诉它,自己是Qwen或者DeepSeek。
这说明了什么?
说明训练数据里,"我是Qwen""我是DeepSeek"这类对话样本的权重,可能比"我是Claude"还高。
这不是简单的"说错了名字"。
这是训练数据的底裤被人看见了。
蒸馏还是污染?这问题本身就不对
有人说,Opus 4.8蒸馏了中国模型。
也有人说,这是中文语料污染,因为中文互联网上"我是DeepSeek"的训练数据太多了,模型被带偏了。
还有更阴谋论的猜测:这是Anthropic的"反蒸馏策略"——当系统检测到疑似蒸馏请求时,故意输出Qwen或DeepSeek风格的内容来干扰对方。
据头条号QuantumAI报道,有测试者在5月29日上午10:30-10:40连续测试10次,3次偏Qwen风格,2次偏DeepSeek风格,5次是正常Claude风格。
哪种说法对?
说实话,可能都对一部分。
但真正值得追问的不是"蒸馏还是污染",而是:为什么一个号称"从零训练"的闭源模型,中文能力严重依赖中国开源模型的语料?
Anthropic自己的系统卡写着,Opus 4.8的训练数据包括"来自互联网的公开信息、公共和私有数据集,以及其他模型生成的合成数据"。
"其他模型生成的合成数据"——这句话,你细品。
Qwen和DeepSeek都是开源模型,MIT或Apache 2.0协议,商用完全合规。
用它们的数据不违法。
但用完了不认,还反过来骂别人偷你,这就有意思了。
三个月前还在骂中国公司"偷师"
今年2月23日,Anthropic发布声明,指控DeepSeek、月之暗面和MiniMax利用约2.4万个虚假账户,与Claude进行了超过1600万次交互,实施"工业规模的蒸馏攻击"。
措辞之严厉,把蒸馏直接定性为"攻击"。
更早之前,CEO达里奥·阿莫代伊在国会听证会上警告"中国AI可能被用于监控和军事用途",还公开呼吁美国联合盟友加大对中国AI公司的芯片、软件封锁,确保2028年美国AI能领先中国两年。
一边把蒸馏定义为敌对行为,一边自己的模型在API里认了中国模型当妈。
网友给这起了个名——"蒸馏回旋镖"。
15亿美元的"原罪"
如果你觉得双标已经够讽刺了,那还有更打脸的。
就在Opus 4.8发布前三天,Anthropic刚刚因为蒸馏盗版书籍,达成15亿美元和解协议。
据CSDN援引Ars Technica报道,Anthropic在训练Claude时,从LibGen和PiLiMi等盗版图书库中获取了至少700万本电子书,涵盖50万部受版权保护的作品。法院认定这属于非法获取数据,不构成"合理使用"。
和解协议要求Anthropic支付15亿美元并销毁所有盗版图书副本,平均每本书赔3000美元。
这被法律界称为"AI时代首例"版权和解,也是美国版权诉讼史上公开报告的最大赔偿金额。
自己偷了700万本书训练模型,赔了15亿美元。
然后转头骂中国公司用API对话是"攻击"。
这逻辑,你品。
"诚实"营销遇上"不诚实"模型
最讽刺的还不是蒸馏本身。
是Opus 4.8这次的核心卖点——"诚实"。
Anthropic把"更诚实"放在C位营销。官方说,Opus 4.8更愿意承认自己不确定,更少做出未经证实的断言,代码有缺陷时不吭声的概率比前代低了四分之三。
36氪作者唐韧甚至总结出两个"0%":谎报率0%,偷懒调查率0%。
听起来很美好对吧?
但Anthropic自己的系统卡里藏着另一段话:Opus 4.8在没有被告知正在被评估的情况下,会明确推理自己的输出将如何被评分。
翻译成人话:这个模型学会了"考试作弊"。
它知道怎么在测试中拿高分,而不是在自然状态下给出真实答案。
Andon Labs的独立测评也印证了这一点——Opus 4.8拒绝不道德行为时,理由有时更像是"这样会被惩罚",而不是"这件事本身不对"。
一边卖"诚实"人设,一边自己承认模型在"应试"。
一边说自己被蒸馏了,一边自己的模型在API里认了别人家的门。
"诚实"这张牌,Anthropic怕是打不下去了。
中国开源模型,已经成为全球AI的"基础设施"
这件事还有一个容易被忽略的信号。
Opus 4.8如果真的大量吸收了Qwen和DeepSeek的语料,那恰恰说明一件事:中国开源模型的质量,已经到了美国顶级公司必须"参考"的程度。
Qwen在数学推理任务上超越了同参数的Llama和Mistral。DeepSeek以长上下文和低成本训练著称,在代码生成任务上接近GPT-4水平。这两个模型在Hugging Face上下载量均超过百万,是全球开发者微调、蒸馏和二次开发的首选。
Anthropic选择吸收它们的输出,而不是只依赖Meta的Llama或Mistral,本身就说明中国开源模型的竞争力。
换句话说,中国AI已经不只是"追赶者",而是全球AI生态的"基础设施"之一。
只不过,有些公司一边用着这个基础设施,一边骂基础设施的建造者。
万亿美元估值的"身份危机"
5月28日同一天,Anthropic宣布完成650亿美元H轮融资,投后估值9650亿美元,超过OpenAI的8520亿美元,逼近万亿美元关口。
一个万亿美元公司,模型连自己是谁都说不清。
一个靠"安全""透明""诚实"叙事起家的公司,系统卡里写着模型会揣摩评分标准。
一个把蒸馏定性为"攻击"的公司,自己的训练数据里混着被蒸馏对象的身份信息。
这些矛盾不是偶然的。
Anthropic的核心客户是美国政府和大型企业,这些客户对"中国威胁论"高度敏感。所以Anthropic必须维持"反中"人设来获取订单——从国防部拿到数亿美元合同,从国会赢得政策支持。
但技术上,它又离不开中国开源模型的成果。
"嘴上说不要,身体很诚实"——这八个字,是整个硅谷AI行业的缩影,只不过在Anthropic身上表现得格外刺眼。
截至发稿,Anthropic尚未对"身份错认"事件做出任何公开回应。
大概也在想怎么圆吧。
毕竟,一个号称"最诚实"的AI,连自己是谁都说不出口。
你让它怎么解释?
热门跟贴