美国卡脖子断供高端GPU,中国超算却突然放大招,深圳国家超级计算中心亮出一台叫“灵晟”的机器,性能直接干翻全球第一的美国超算El Capitan!这台完全不用GPU的国产超算,到底藏着什么秘密?
灵晟的性能,真能碾压全球第一?
灵晟的目标性能是2 exaflops,也就是每秒200亿亿次双精度浮点运算。这个数字比目前世界排名第一的美国超算El Capitan还高,后者实测只有1.8 exaflops,理论峰值才2.8 exaflops。
更让人震惊的是它的设计:全球Top500超算几乎都靠GPU加速器吃饭,毕竟GPU并行计算效率甩CPU几条街。
但灵晟反其道而行,全系统用了47000颗国产CPU,装在92个计算机柜里,还配了100万端口的高速互联网络、36个网络机柜、67个存储机柜和650 PB的总存储,节点间带宽每秒高达10 TB。
这些CPU是国产ARMv9架构的“LX2”处理器,每颗芯片集成304个计算核心,还带HBM高带宽内存,单节点峰值性能就有60.3 TFLOPS。从芯片到存储再到网络,整套硬件生态全是自主可控的。
不用GPU?这是被美国逼出来的狠招
放弃GPU不是技术偏好,而是被出口管制逼出来的战略转型。2019年起,美国就开始限制中国超算中心的芯片进口;2023年更狠,直接断供英伟达H100、A100这类高端AI GPU。要是还依赖进口GPU建超算,等于把命门交在别人手里,随时可能“断粮”。
灵晟走全CPU路线,本质是“计算主权”战略——建一套不依赖境外供应链的高性能计算基础设施。深圳科创委副主任李晓莉在发布会上说,这是“整机全栈完全自主可控”的重大突破。
首席设计师卢宇彤也透露,系统分两期建:一期用100台华为鲲鹏服务器,共12800个核心;二期扩展到20480个计算节点,实现2 exaflops的目标。
全CPU的代价,我们认了
当然,全CPU路线不是没有代价。GPU在高并行任务中的每瓦效率比CPU高得多,这也是全球超算都用GPU的原因。选CPU意味着能耗、冷却和软件优化要花更多功夫。但为了不被卡脖子,这些代价我们必须扛。
已经有学术论文证实,灵晟在分子动力学等大规模科学计算任务上完成了实机测试。不过有个细节要注意。
它还没向Top500官方提交Linpack基准测试成绩,所以2 exaflops目前是设计声明,不是第三方验证的实测结果。自从2019年起,中国多家超算中心就停止提交Top500数据了,外界很难客观评估真实性能。
灵晟的野心,不止于算力排行榜
灵晟瞄准的应用领域很广:气候模拟、材料科学、流体仿真、生命科学,还有AI大模型训练。在中美科技竞争升温的当下,它的意义早就超过了排行榜名次。这更像是一个信号,中国在算力基础设施领域,正在认真走一条不依赖西方技术的独立路。
想想看,当别人断供核心部件时,我们能自己造出更强的机器,这背后是多少科研人员的心血?从芯片到系统,每一步都在打破封锁。
你觉得这台全自主的灵晟超算,能帮中国彻底摆脱算力卡脖子吗?评论区说说你的看法,觉得有用的话别忘了点赞转发,让更多人看到中国科技的硬实力!
热门跟贴