打开网易新闻 查看精彩图片

作者 | 季新

这不是一个关于追赶的故事。

这是一个关于重新定义游戏的故事。

2026年初的H200,是一场精心算计的放行和25%的买路钱。美国总认为已经凭芯片死死扼住了全球AI发展的咽喉,却不曾想过,此刻的中国,已经凭借NPU等自主研发的芯片和超节点,完成了蜕变。

当对手用封锁划定边界,我们用代码凿穿高墙。当对手迷信单一芯片的“神力”,我们用系统集群改写规则。当对手沉浸在实验室的排行榜时,我们的算法已经钻进矿井、爬上港口、站在了生产线的中央。

三个决定性的时刻,如同三块紧密咬合的齿轮,共同启动了这场超越之征。

01DeepSeek时刻:被封锁逼出来的“蹊径”

2026年1月,一场来自大洋彼岸的争论,意外地照亮了赛场另一端的崛起。图灵奖得主杨立昆公开指责Meta的Llama4模型“作弊刷榜”。这场风波的背景,是2025年初中国深度求索公司的DeepSeek-R1模型横空出世,其表现对尚未面世的Llama4构成了实质性压力。

时间倒回到2023年,中美顶尖模型在主要基准如MMLU、HumanEval、MATH上的差距还保持在两位数百分比。然而到了2024年底,这一差距已大幅缩小至5%以内,部分领域甚至仅差不到1%。中国的DeepSeek-V3、阿里Qwen 2.5等模型在编码、数学和通用语言理解上,已经能够匹敌甚至在某些指标上超越美国的GPT-4o和Claude 3.5。

打开网易新闻 查看精彩图片

尽管在涉及复杂逻辑推理和极具创造性的任务上,美国最新的OpenAI o1/o3系列模型仍保持着“代际”领先,但基础能力中美大模型之间已经可以打成平手。

美国原以为靠芯片垄断优势和堆参数做出来的顶级大模型,能把中国AI逼到墙角,却没想到,不靠硬件堆砌的蛮力,中国大模型用“效率魔法”完成了一场轻盈而漂亮的转身,一举逆袭。

这是一场暴力美学和极致效率之间,注定要被载入史册的对决。在算力的限制下,中国大模型被迫选择了不同的技术路线,这反而催生了极高的算法效率。

众所周知,GPT-4等美国大模型倾向于依赖巨大的算力和数据规模(Scaling Law),训练成本极高,可达1亿美元以上,且能耗巨大。受限于高端芯片出口管制,中国开发者只能专注于算法优化和架构创新。这使得MoE架构的DeepSeek模型能以仅为美国同类模型几分之一的极低成本实现相近的性能,在美国眼皮子底下成功突围。

DeepSeekMoE架构
打开网易新闻 查看精彩图片
DeepSeekMoE架构

“DeepSeek时刻”的本质,是宣告了一种新范式的可行性:在最严苛的物理与地缘政治约束下,通过极致的工程与算法创新,可以在单位算力内实现更高的“智能密度”,达到甚至超越行业最前沿的实用性能。

而这仅仅是以技术路线撕开的一道口子。接下来,则是思虑更为深远的战略胜利。

谁也想不到,在大模型开源生态中,中国正在占据主导地位,这是一个可能改变未来格局的变量。虽然美国拥有最强的闭源模型,但中国在开源模型方面表现出极强的竞争力。数据显示,中国开源模型的全球下载量和采用率正在迅速上升,甚至在某些平台上超过了美国模型。通过发布高性能的免费开源模型如DeepSeek、Qwen等,中国正在吸引全球开发者构建基于其技术的应用生态,打破美国的闭源高墙。

02超节点时刻:“系统对单点”的大杂烩奇迹

当芯片的单点性能遭遇壁垒,中国产业选择在另一个维度开辟战场。以英伟达为代表的“美国路线”,凭借顶级的4纳米制程、一年一迭代的芯片如Blackwell以及牢不可破的CUDA软件生态,构筑了高高的性能与生态壁垒。

近期获准对华销售的H200芯片,确实展现了吸引力。其FP16算力高达733TFLOPS,配备146GB显存和4800GB/s的带宽,最大支持256卡集群,总处理性能(TPP)达15840。相较之下,当时国产主流芯片水平大致处于英伟达A100与H100之间,仅有华为的昇腾910C能在部分参数上接近。

然而,依赖即意味着受制。中国芯片产业没有选择在单点性能上被动追赶,而是转向了一种东方式的系统思维,那就是集体主义的胜利——通过架构创新,整合成一个强大的“超级组合”。

打开网易新闻 查看精彩图片

于是华为云的CloudMatrix384诞生了。它的核心不是追求单芯片的极致,而是通过高速互联技术,将成百上千的计算单元整合为一个逻辑统一的“超级计算节点”。它打破了传统集群中CPU与NPU/GPU的层级管理结构,让384颗昇腾NPU与192颗鲲鹏CPU处于平等地位,任何两颗芯片都能通过高速网络直接通信。这一架构带来了巨大的系统级红利:尽管单颗昇腾芯片性能不足英伟达GB200的三分之一,但整个CloudMatrix384集群的算力,却达到了同期英伟达集群方案的约1.7倍,在内存容量和带宽上优势更大。

打开网易新闻 查看精彩图片

尤为令人振奋的是,CloudMatrix384催生了中国的超节点浪潮,成为集体突围的旗帜。2025年,中国主要云厂商集体追随亮剑:百度智能云推出基于自研昆仑芯的“天池”系列超节点;阿里云发布磐久AL128超节点服务器。

“超节点时刻”,彻底击碎了美国的算力狙击,为大模型的发展杀出了一条血路。

03新质生产力时刻:用AI解行业难题

如果前两个时刻是突破了技术与系统的“点”和“线”,那么第三个时刻,则关乎能否将这些成果铺成推动整个经济肌体进化的“面”。人工智能的价值,最终必须通过破解千行万业的难题来兑现。

中国的“人工智能+”计划,正在将这一理念变为现实。2025年底的全国工业和信息化工作会议披露,人工智能核心产业规模已超过万亿元。这意味着AI已从一个“风口”,成长为具有实质产出与收入的成熟产业。

应用落地的深度与广度,超出了许多人的想象:

在有色金属行业,中国铝业与华为云打造的“坤安”大模型,已在采矿、冶炼、安全生产等8大领域落地。其“金属智眼”能将单张铝合金组织图片分析时间从3-5分钟压缩至10秒以内,精度达99.5%。

打开网易新闻 查看精彩图片

在能源开采领域,山东能源集团在井下500-700米深处,依托华为云AI实现无人采煤;AI算法优化洗煤工艺,将精度提升0.1%,每年减少数以万吨计的煤炭资源浪费。

在智慧港口,天津港、青岛港通过华为云模型驱动全流程协同,将码头每小时吞吐量从过去的1-2个自然箱,提升至5.7个自然箱。

在医疗领域,上海瑞金医院与华为合作的“瑞智”病理大模型,能覆盖中国每年90%常见癌种的诊断,将病理医生从繁重的显微镜审视中部分解放出来。

打开网易新闻 查看精彩图片

这些案例并非孤立的胜利。它们共同揭示了中国“新质生产力时刻”的两大根基:其一,中国拥有全球最完整、最复杂的工业体系,这为AI提供了海量且苛刻的“练兵场”,倒逼技术必须“沉下去”解决真问题;其二,中国的“人工智能+”战略具有明确的系统导向,一手抓技术供给,一手抓行业应用,致力于打造协同创新生态。

这与美国的焦点形成了战略层面的分野。美国致力于定义技术的绝对高度与全球标准,维持其霸权地位。而中国,正全力追求技术在经济肌体中的渗透深度与应用广度。

中国的AI重新校准了价值的标尺:它将判断AI成败的考场,从实验室的排行榜,移向了工厂的良品率、矿山的资源回收率、港口的吞吐效率与医院的诊断效率。这不是否定基础创新,而是将技术的胜利,与实实在在的经济动能和产业升级紧密锁定。

打开网易新闻 查看精彩图片

从DeepSeek在算法层面的“约束下创新”,到超节点在架构上的“系统级集结”,再到新质生产力中“用AI解行业难题”的全面萌发,三个时刻勾勒出一条清晰而坚实的中国AI从追赶到超越之路。

这条路,始于被迫的应对,但再难的题也要解,再难的路也要走。

因为,没有退路,就是胜利之路。

-End-

本文仅代表作者观点,不代表平台立场

作者 | 季新

编辑 | 夏龙心

统筹 | 孙梅

排版 | 思乐