国内某些大模型评测榜单刷新,又有人开始唱衰:华为盘古连前十都挤不进,是不是技术真不行了?可转头看大洋彼岸,英伟达老板黄仁勋亲口承认"市场让给华为了",还赶在最后一秒挤上特朗普的访华专机。

一边是榜单上的"查无此人",一边是对手主动认怂——这两幅画面叠在一起,违和感拉满。这就奇怪了。

盘古这个大模型,气象局拿去算天气,中医药行业拿去做数据分析,问界、享界这些车上的智能驾驶也靠它训练。按理说不算冷门,可碰上那些写诗答题的评测榜,名字就是出不来。

打开网易新闻 查看精彩图片

问题到底出在哪?得先把盘古这东西的来路说清楚。它不是这两年蹭风口蹦出来的新玩意,2019年立项,一路迭代到现在第五个大版本。

华为内部把它分成三层,底层是通用基础模型,中间一层对应行业,最上面一层针对具体场景。气象、矿山、金融OCR、药物分子、海浪预测,这几个分支都已经在干活。

去年东莞的开发者大会上,盘古升到了5.5版本,覆盖自然语言、多模态、预测、科学计算、视觉这五块,不是单独一个模型,而是一整套"不作诗只做事"的产业AI路线。

打开网易新闻 查看精彩图片

同期还甩出一个参数规模7180亿的盘古Ultra MoE,从头到尾全程跑在昇腾平台上完成训练。更狠的动作发生在今年三月。

华为云的负责人在合作伙伴大会上直接宣布,盘古要全面开源,从最小的1B到最大的718B,全尺寸矩阵都对外放出去。这意思很明白——不光自己用,把家底也亮给外面的开发者一起折腾。

绕回开头那个疑问。为什么这种成绩单,在公开榜单上几乎听不到回响?里头其实有个不太被外人提起的逻辑。

打开网易新闻 查看精彩图片

跑分这件事,本身就是可以"应试"的。专门冲着评测题去调参、刷数据,名次自然好看。

但工业级的活儿不是这么干的——煤矿井下要的是稳定、气象云图要的是精度、银行流水要的是合规,这些场景上不了榜,可一个不能出错。华为这几年的劲,明显都使在了后面这头。

当然,盘古也吃过亏。去年夏天有一阵闹得挺大,一个匿名账号在GitHub发技术报告,指控盘古Pro MoE 720B和阿里的Qwen-2.5在注意力参数分布上"相似度异常"。

打开网易新闻 查看精彩图片

华为团队的回应是,这个模型基于昇腾硬件平台独立开发训练,并非基于其他厂商模型微调,部分基础组件参考过业界开源实践,但遵循了开源协议。这场风波各执一词,外界吵了一阵也就过去了,迭代节奏倒是一点没耽误。

故事的另一半得放到太平洋对岸看才完整。黄仁勋这位英伟达老板,最近大半年几乎是逢人就提中国市场,话锋一次比一次重。

先是在一次智库访谈上松了口,说英伟达在中国AI加速器市场的份额已经掉到了0%。后来接受CNBC的镜头又补了一句,华为非常强劲,那个市场基本上让给他们了,顺带提醒美方别指望先进芯片还能往中国卖。

打开网易新闻 查看精彩图片

这话听上去像是放弃,可身体却特别诚实。特朗普这次访华的随行名单里原本压根没他,最后是临时接到电话,赶到阿拉斯加才"压哨"登上空军一号。

真要是看不上这块市场,谁会赶最后一班飞机?数字摆在那不会撒谎。

伯恩斯坦的一份预测说,到今年华为将拿下中国AI芯片市场约一半的份额,英伟达的份额可能从39%大幅萎缩至8%,本土AI芯片销售额未来三年的复合年增长率预计能到74%。从九成跌到归零,对比有多扎眼,不用多说。

打开网易新闻 查看精彩图片

最让对手坐不住的,其实不只是芯片销量,而是连大模型也跟着搬家了。智谱前阵子发GLM-5.1时明确说,在约10万张华为昇腾910B芯片上完成全流程训练,使用的是华为自家的MindSpore框架。

DeepSeek新一代推理服务也全面挪到了昇腾950PR集群上,实测单卡推理性能据称达到英伟达H20的2.87倍,部署成本只有对方方案的三分之一。把这两幅图叠起来再看,就好玩了。

一边是国内某些榜单上华为"查无此人",弹幕里阴阳怪气说"又输一局";另一边是英伟达老板飞越大半个地球,亲口承认"打不过"。这中间的落差,怎么解释?

打开网易新闻 查看精彩图片

公允地说,差距不能装看不见。在最顶层的训练集群上,国产芯片在多卡之间的通信延迟、长时间训练的稳定性上,跟英伟达还有代差。

制程层面,主流国产GPU还卡在7纳米到14纳米这一档,英伟达已经进4纳米了。这种工程层面的差距,不是喊口号一两年能填上的,软件生态的积累更是个慢功夫。

但路也确实走通了。华为公布过昇腾从950到970一年一代的路线图,节奏已经摆到2028年。

打开网易新闻 查看精彩图片

IDC给的数据更实在——去年国产AI加速卡在中国市场的出货量约165万张,本土厂商份额头一次过四成,昇腾一家就吃下81万张稳坐头把交椅。这数字比任何评测榜都管用。

所以再回头琢磨开头那个问题。华为在大模型榜单上"排不上号",真的等于输了吗?

打开网易新闻 查看精彩图片

把家伙什儿藏在天气预报里、嵌在中医大数据里、装在汽车的辅助驾驶里、铺到矿井和港口里的玩家,本来就不太指望靠几道选择题刷脸。黄仁勋那句"让给华为",与其当成客气话,不如当成被市场逼出来的实话。

看明白这层,"输赢"两个字也就没那么扎眼了——榜单是面镜子,但镜子的取景框,从来都不是真实世界的全部。