打开网易新闻 查看精彩图片

出品 | 网易智能

作者 | 辰辰

编辑 | 王凤枝

中国超算重返世界第一。

但这次,它没用一张GPU。

6月23日,德国汉堡,ISC 2026大会上,深圳国家超算中心的"灵晟"系统以2.198 Exaflops登上TOP500全球超算榜首。

打开网易新闻 查看精彩图片

上一次中国站到这个位置,还是2017年的神威·太湖之光。

九年过去,中国交出的新答案,不是GPU集群,而是一套纯CPU系统。

打开网易新闻 查看精彩图片

TOP500组织者、田纳西大学教授杰克·唐加拉(Jack Dongarra)最近去深圳实地看过这台机器。他的评价很简短:

"一套令人印象深刻的系统。"

然后他补了一句更关键的话:

"他们超过我们,靠的是不依赖GPU。"

一、一张没有GPU的成绩单

灵晟最扎眼的,不只是快。是它用什么做到的。

过去几年,全球顶级超算的主流路线越来越清楚:CPU负责调度,GPU负责堆算力。美国的El Capitan用AMD MI300A,Frontier也是类似逻辑。GPU几乎成了顶级超算的默认答案。

灵晟偏偏不用GPU。

它用一颗自研的LX2处理器,304核,ARMv9架构,1.55GHz主频。整机塞了1379万颗核心,90个机柜。自研灵启互联网络。功耗42.2兆瓦,能效52.07 GFlops/瓦。

更具体地看,每颗LX2 CPU依赖两个计算芯粒(chiplet),304个核心被组织为8个核心集群,每个集群内含38个核心。每个核心都集成了Arm SVE(可伸缩矢量扩展)和SME(可伸缩矩阵扩展)单元,以加速AI训练和科学计算中的矢量及矩阵运算,支持FP64、FP32、BF16、FP16和INT8等多种数据格式。芯片采用了极为独特的内存架构:将32GB的封装(on-package)HBM内存提供高达4 TB/s的带宽,与多达256 GB的外部DDR5内存相匹配,在最大化内存带宽的同时,兼顾了容量扩张。

打开网易新闻 查看精彩图片

纯CPU路线听起来很复古。上一次纯CPU拿下TOP500第一,还是2020年的日本富岳,能效只有灵晟的三分之一。

但灵晟和富岳不是一回事。富岳是传统CPU路线,灵晟是把GPU的活儿(向量和矩阵运算)做进了CPU的指令集。 唐加拉把这种设计描述为"一种可能更好的、把AI与传统科学任务融合的方式"。

14个戈登·贝尔奖申报项目用了灵晟。三个入围决赛,三个入围气候科学奖。应用覆盖大气海洋模拟、材料科学、药物研发、脑科学、大模型推理。

不是PPT机器。

二、"他们交了卷"

灵晟登顶本身不算意外。

意外的是深圳交了卷。

过去三年,中国超算系统集体缺席TOP500榜单。2023年起,中国停止了所有系统的排名提交。背景很清楚:美国从特朗普第一任期开始,一轮接一轮收紧芯片和计算相关的出口管制,拜登接力加码。中国的策略是低调,有系统,不参赛。

所以Intersect360 Research分析师艾迪森·斯内尔(Addison Snell)的那句话,成了这次所有外媒报道里被引用最多的:

"我不意外它能拿第一。我意外的是他们主动提交了,想要这个认可。"

这句话的信息量很大。不参赛,是因为怕暴露哪些芯片能造、哪些不能。参赛,是因为不怕了。

打开网易新闻 查看精彩图片

唐加拉在深圳得知了一个关键细节:灵晟没有使用政府资金,设计者认为提交排名不违规。这解释了"能交卷"的法律逻辑。

更重要的信号不在合规层面。

合规是前提,但合规不等于动机。

资深科技分析师马继华说得更直接:中国不再保持低调,重新参与全球"基准竞争"。早前的克制,主要是外部限制和谨慎披露策略。现在自主超算能力取得突破,中国重新进入顶级竞赛,性能大幅领先西方系统。

"重新参与"四个字,比"拿了第一"更值得读。

美国那边的解读则完全不同。加州大学全球冲突与合作研究所高级研究员吉米·古德里奇(Jimmy Goodrich)说:"中国在试图让世界相信出口管制没用。"

三、换了解题思路

灵晟的故事里,最让美国人难受的可能不是它拿了第一。

而是这个第一,恰恰是用美国人断定走不通的那条路走出来的。

2017年之后,美国出口管制策略有一个清晰假设:卡住GPU和先进制程,就是卡住了中国超算的咽喉。这个假设不无道理。全球顶级超算都在GPU上堆算力,英伟达和AMD是这个生态的核心。没有GPU,按常理出不了顶级超算。

灵晟证明的不是"没有GPU也凑合能跑"。而是在TOP500这张传统超算卷子上,确实存在另一条路线:不用GPU,也能跑到第一。

X用户@OopsGuess那条被广泛转发的推文,抓住了这个叙事里最深的讽刺:"限制没有阻止答案。它换了考题。而中国还是拿了第一。"

打开网易新闻 查看精彩图片

这就是灵晟这件事的核心张力。外部限制本意是切断路径,结果逼出了路径创新。

中国科技与战略研究院副院长陈靖的解读最为系统:灵晟体现的不是单一硬件突破,而是体系级能力,独立生态建设、架构创新、全系统集成,以及存储和冷却的配套突破。他把这条路比作华为的"韬定律",从单点竞争转向系统架构创新和工程优化,是"换道",不是"弯道超车"。

马继华也强调同一个判断:这不是突然的超车,而是长期技术积累和体系重建的结果。中国超算底子本来就不弱,这几年虽然不参赛,能力建设没停过。

但这个叙事,美国那边不太认。

四、两个第一,不在同一条赛道上

这里需要拆一个很少被大众讨论的技术细节。

TOP500的核心排名基准是Linpack,测试双精度浮点(FP64)性能。 这是传统科学计算的标准:气候模拟、密码破译、核武器设计,需要64位的高精度计算,分毫不差。

AI不这么干活。

大模型训练和推理用的是低精度,8位、4位浮点。精度低,但一次能算更多。不求准,求快。

两条赛道。

灵晟在传统赛道上碾压:Linpack 2.198 Exaflops,HPCG 22.0 PFlops,两个都是第一。

换到AI赛道(HPL-MxP混合精度测试),灵晟排第四。7.92 Exaflops,落后于El Capitan、Frontier和Aurora。

LX2从双精度转到混合精度,性能只提升了3.6倍。集成专用低精度加速器的AMD MI300A和Intel Ponte Vecchio,提升幅度大得多。这意味着灵晟的设计目标从一开始就不在AI赛道上,但其在传统超算任务上的杰出表现弥补了这一短板。

说人话就是:灵晟干科学计算,全球没人比它快。干AI训练,美国还有余量。

古德里奇承认灵晟"引人注目、令人印象深刻"之后,立刻换了一个维度:"它们跟美国AI实验室建造的那些大规模AI超算相比,不值一提。"

他的依据确实真实存在:大型云服务商的AI计算集群(微软、谷歌、亚马逊、xAI)从不参加TOP500。2025年一项研究估算,xAI的Colossus系统实际算力可能已经超过El Capitan。古德里奇等人认为,如果这些系统参赛,灵晟进不了前五。

听起来是在贬低灵晟。也可以理解成:美国甚至要搬出不参赛的选手,才能找到心理平衡。

古德里奇说的不是假话,如果你只比AI算力。

斯内尔也没说假话,如果你比的是TOP500排名。《纽约时报》引了他的原话:"总有人说美国是唯一能造这些系统的国家。然后你会发现,别的国家也有这个能力。"

两句话都指向同一个事实:决定话语权的,不是哪个数据准确。是说话的人选择用哪条赛道的数据。

劳伦斯伯克利国家实验室的HPC架构师格伦·洛克伍德(Glenn Lockwood)在X上写了一句技术圈内分量很重的点评:"灵晟相对El Capitan的效率跃升是惊人的。这表明了为FP64优先而设计,与把FP64硬塞进一个AI优先的芯片封装里,之间的差距。"

打开网易新闻 查看精彩图片

从事高性能计算的人读这句话,能听到真正的技术判断:灵晟不是在跟美国比谁更AI。它是在证明,当所有人都在为AI改赛道的时候,纯科学计算这条路,还有人在走,而且走到了最前面。

中科院计算所研究员张云泉点了一个更本质的问题:纯CPU路线在科学计算这样的传统超算场景里,兼容性优势很强。这条路技术难度更大,但走通之后与传统应用的适配成本极低,不需要重新写代码去适配GPU架构。

简单说:灵晟不是为AI竞赛设计的。它是为科学计算、工程模拟、药物研发这些"老派"超算任务设计的。在这些任务上,GPU+CPU混合架构不一定更优。

硬件上为科学计算优化,软件上与既有代码天然兼容,两头都顺。

TOP500则在自己的总结里写了一句含蓄但关键的话:"通往顶级计算没有单一主导的技术路线;供应商在追求CPU、GPU、APU和定制加速器等多种路径。"

不点名,但灵晟就是这句话的最好注脚。

五、第三国的选择题

一名用户在X上抛出了一个更长远的问题:

"让我们来品味一下这何其像是'自摆乌龙'。欧美企业不仅在中国失去业务和丰厚机遇,如今中国已拥有能在全球舞台上竞争的产品。假如你是第三国,你会选择昂贵的美国技术栈,并随时面临被限制的风险,还是选择价格更低、可能性能更优的中国产品,而且没有人对你如何治理本国指手画脚?"

打开网易新闻 查看精彩图片

这个问题不好回答,但不能不回答。

全球超算市场本身不大。可超算是算力金字塔的顶端,顶端路线一旦被证明可行,影响会向下渗透到数据中心、云服务和企业计算。

灵晟现在还谈不上直接改变全球采购格局。芯片由谁代工、使用什么工艺节点、ARM授权能否覆盖出口型号,这些问题都还没有答案。

但这件事真正刺到美国的地方,不是"中国超算能不能卖出去"。而是美国限制的可信代价。

如果每一次限制(GPU、半导体设备、架构授权)最后都逼出新的替代路径,那么限制本身的威慑力就会被削弱。

灵晟的意义不只在超算排名,而在于它展示了一种可能:在最不利的条件下,换一条路,仍然能跑到最前面。

另一位用户总结得更锋利:"这就是人们低估的东西。限制不只是减少能力,它可以重新引导工程人才。灵晟听起来像中国对着硬件封锁说了句:'好,那我们重新设计整条路。'非常棘手的剧情转折。"

打开网易新闻 查看精彩图片

截至2025年中,中国算力总规模全球第二,已批复14个国家超算中心。今年1月,国家超算互联网平台用户突破100万,超算资源从集中供给转向普惠服务。

灵晟的排名,只是这条更长弧线上的一个点。

六、结语:未完的竞赛

当然,灵晟的答卷上还有一些没填的空白。

唐加拉在深圳看到机器,但设计者没有披露由哪家公司制造芯片、使用什么工艺水平。ARM架构授权来自日本软银旗下的ARM公司。ARM发言人表态:"ARM在全球运营,都遵守适用的出口管制法律法规。"

措辞精准。没说代工厂。没说工艺节点。

陈靖也承认,底层约束仍然存在,架构授权、先进制造工艺、部分芯片制造环节。中国超算从"对外依赖"到"完全自主",还在过渡阶段。

兑现到哪个程度,下一台机器才能回答。

打开网易新闻 查看精彩图片

美国那边也没闲着。灵晟登榜前一天,特朗普签署了一份量子计算行政令,目标是确保美国在新兴计算领域对中国保持领先。2025年11月启动的"创世使命"计划,正在把国家实验室和私营公司的超算资源整合起来,加速AI和科学研究。

至于古德里奇说的"美国应该对CPU也加强管制",且不说技术上是否可行,ARM是一家英国公司,由日本软银控股。管不管得到,本身就是问题。

竞赛还在继续。换卷子的故事,考的不是一台机器的排名。考的是一个产业在被外力阻断后,能不能长出另一条肌肉。

灵晟拿下了第一场考试的第一名。

但这场竞赛,不止一场考试。