打开网易新闻 查看精彩图片

来源:国家超级计算郑州中心官方发布 ,郑州国家超算互联网核心节点上线仪式现场实拍

中国科技领域又一场里程碑式的破局!

2026年2月,国家超算互联网核心节点在郑州正式上线试运行,3万卡全国产算力集群正式商用。

中科曙光、华为、清华大学、郑州大学等数十家国内科研机构、科技企业联手 团结合作,击穿了美企英伟达高端算力垄断。

打开网易新闻 查看精彩图片

中科曙光scaleX万卡超集群机房内部实拍图。

很多人到现在也许还会有疑问,不就是3万张算力卡吗?英伟达早就有10万卡集群了,这到底有什么好激动的?

答案很简单:

英伟达的10万卡集群,是闭源闭环的“自家玩具”,核心技术不对中国开放,美国一道禁令,我们连一张高端卡都买不到。

而我们这3万卡集群,是一套全自主可控、全链条国产化的异构算力系统。

它解决的不是“谁的卡更多”的问题,是中国人能不能把高端算力的命脉,彻底握在自己手里的问题。

下面就分点和大家聊一聊这件事情,让大家知知道,这是一个多么了不起的成就,是足以让中国人自豪的事情

一、AI时代的科技之争,本质就是算力之争

当下全球科技竞争的核心战场,早已不是手机、电脑的终端之争,而是人工智能的底层能力之争。

而AI的所有能力,都建立在一个基础之上——算力

国产大模型、能精准到分钟的天气预报、能把新药研发周期从几年缩短到几个月的分子筛选、能支撑国产大飞机研发的工业仿真,甚至是国土安全、灾害预警的核心系统,全靠高端算力支撑。

毫不夸张地说,算力就是AI时代的“电力”。

没有自主可控的算力,所有的科技突破都像是建在沙滩上的高楼,随时可能被别人釜底抽薪。

而过去十几年,全球的高端算力市场,一直被美企英伟达牢牢垄断。

它给我们套上了三层解不开的枷锁,每一层都精准卡着我们的脖子。

首先是硬件供给垄断。

美国持续对华禁售英伟达H100、H200、A100等高端AI芯片,哪怕后续放开特供版,也附加了“采购量不超美国本土50%、禁止用下一代架构”的苛刻条件。

说白了,我们永远拿不到最先进的芯片,供应随时可能被切断,完全是“带着枷锁采购”。

其次是生态绑定垄断。

这才是英伟达最狠的护城河。它的CUDA软件生态,绑定了全球90%以上的AI开发者。

过去你训练大模型、写AI代码,全是基于CUDA架构开发的,不用英伟达的芯片,之前写的代码几乎全废了,重写的成本要涨40%、周期拉长半年。

就像它修了一条全球唯一的高速公路,所有车都在上面跑,它想涨价就涨价,想封路就封路。

最后是定价权垄断。

垄断之下,英伟达把算力价格炒到了天价。

2023年到2025年,国内一张二手H100芯片被炒到原价的3倍,高端算力的月租金翻了两番,中小企业想做AI研发,光算力成本就能压垮人。

更离谱的是,国内算力陷入了“东部排队2个月抢不到,西部算力闲置率超70%”的死循环,越抢不到,英伟达的定价权就越稳。

这就是我们之前面临的死局:想搞AI,就离不开算力;想用好算力,就只能被英伟达卡脖子。

每年花上千亿外汇,还要随时担心被断供。

打开网易新闻 查看精彩图片

过去很长时间,ai算力卡被美企英伟达垄断

二、别以为堆芯片就行,这3个世界级难题,之前没人能解决

那么会有人问,打破算力垄断,只要多堆国产芯片就行?

大错特错。

堆芯片谁都会,难的是让成千上万张芯片,像一个整体一样稳定协同干活。

我给你打个最通俗的比方:

这就像让3万个来自不同省份、说不同方言、习惯完全不同的人,同步搬一块重达万吨的巨石。

每个人的发力时间、力度、动作幅度,必须分毫不差,慢0.000001秒,巨石就会失衡坠落,整个任务直接崩盘。

而我们要解决的,是比英伟达更难的3个世界级难题,之前全球没有任何一个国家能彻底解决。

第一个难题,国产芯片的“语言不通”死穴。

国内的算力芯片百花齐放,有华为昇腾、海光DCU、寒武纪思元、曙光自研BW100等多个品牌,但它们的架构、指令集、运行逻辑完全不同。

就像有人说普通话、有人说粤语、有人说闽南语,互相听不懂对方的指令,根本没法协同干活。

英伟达的万卡集群,全用自家同型号的芯片、同一套系统,相当于全是说同一种语言的机器人,协同难度根本不在一个量级。

第二个难题,东西部算力的“供需失衡”死局。

我们国家的算力需求和资源,完全是倒挂的。

东部的上海、深圳、杭州,聚集了全国90%以上的AI企业、互联网公司、科研机构,算力需求爆炸,但缺地、缺电,根本建不了大规模的算力中心,企业排队2个月都抢不到算力。

而西部的贵州、内蒙古、甘肃,有大把便宜的风电、光伏电,地广人稀,建了很多超算中心,但本地没什么算力需求,大量算力长期闲置,利用率不到30%。

想把西部的算力调度到东部,又面临超远距离传输的“数据肠梗阻”——延迟高、带宽不够,数据传过去黄花菜都凉了,根本没法用。

打开网易新闻 查看精彩图片

超算互联网全国算力节点分布官方示意图

第三个难题,英伟达锁死的“生态壁垒”。

就算我们有了国产芯片、有了算力集群,没人用也是白搭。

全球90%的AI开发者,都是基于英伟达的CUDA生态写的代码,换到国产平台,要把几百万行代码全部重写一遍,迁移成本极高,没人愿意花这个冤枉钱。

这就像所有人都在用Windows系统写文档,你就算做了一个国产电脑系统,之前的文档全打不开,根本没人愿意用。

这个难题,每一个都是卡了全球算力行业十几年的硬骨头。

之前不是没人想统筹全国算力,不是没人想做国产算力集群,而是技术达不到,就算把芯片堆起来,就算把网线连起来,也根本用不了。

三、数十家科企联手,我们用中国方案,破了全球死局

面对这三大世界级难题,我们没有走英伟达“闭源闭环、同芯片堆规模”的老路。

而是走出了一条完全属于中国的换道超车之路——国家队牵头,数十家国内科技企业、科研机构联手,打造了一套完全自主可控的国家超算互联网系统,用中国方案,解决了全球都没搞定的难题。

郑州核心节点的上线,就是这套方案的里程碑式成果。

它的核心不是“把3万张卡连起来”,而是彻底攻克了三大技术壁垒,每一项突破,都精准击穿了英伟达的垄断护城河。

1. 定了中国自己的算力标准,让不同“方言”的芯片能一起干活

面对不同品牌芯片“语言不通”的难题,我们没有硬着头皮去仿制英伟达的芯片架构。

而是由国家超算互联网工程技术中心牵头,联合中科曙光、清华大学、郑州大学,制定了全国统一的算力并网标准

这就像国家电网给全国所有电厂定了统一的220V电压标准,不管你是水电、火电、风电,都要按这个标准来,才能并网供电。

这套标准,就是我们自己定的算力规则,不管你的芯片是华为、海光还是寒武纪,不管是什么架构,都能转换成统一标准的“算力单元”。

在此基础上,中科曙光自研了GridStack智能调度系统,华为提供了核心异构适配技术,相当于给所有芯片装了一套「通用翻译器+统一指挥系统」。

哪怕是不同架构、不同品牌的芯片,也能完美同步指令、协同干活,实现了3万张异构国产芯片的稳定商用运行,算力利用率达到了85%以上,远超全球30%的行业平均水平

这件事,之前全球没有任何一个国家能做到。

我们是全球第一个实现万卡级异构芯片稳定协同的国家,直接开创了一个全新的算力技术路线。

2. 建了算力“全国高速网”,破解东西部算力失衡死局

面对超远距离算力调度的“数据肠梗阻”难题,中科曙光自研了scaleFabric高速网络,华为提供了400Gb/s智简全光网技术,打造了一套全国产的高速算力传输网络。

这套网络有多强?

它能实现400Gb/s的超高带宽、低于1微秒的端侧延迟,通信性能比国外垄断的IB网络提升了2.33倍,成本还降了30%。

1微秒是什么概念?是千分之一毫秒,比你点一下鼠标的反应速度快1000倍。

哪怕是调度几千公里外西部的算力,也能做到“即点即有、无延迟”,彻底解决了超远距离传输的卡顿、崩溃问题。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

有了这套高速网络,国家超算互联网就像给中国建了一套算力国家电网。

把全国30多家超算中心的算力连成了一张全国产的算力大网,西部闲置的算力,能通过高速网络实时调度给东部的企业用,彻底破解了“东部抢不到、西部用不完”的死循环,完美承接了国家“东数西算”工程的核心需求。

3. 绕开英伟达CUDA护城河,实现无缝迁移

面对英伟达锁死的生态垄断,我们没有硬刚“重写一套完全替代CUDA的系统”,而是走了一条更聪明的路——自研了一套CUDA兼容层。

中科曙光的DCU兼容平台、华为的CANN架构,联手打造了这套兼容系统,相当于做了一个“万能文档阅读器”。

也就是说,企业之前基于英伟达CUDA写的代码,几乎不用修改,就能直接在我们的国产芯片上跑通,代码迁移成本直接降到了行业平均的30%。

这不是依赖英伟达的技术,恰恰是彻底打破它生态垄断的核心杀招。

就像鸿蒙系统能兼容安卓应用,不是依赖安卓,而是为了让用户无缝迁移,彻底摆脱对国外生态的绑定。

现在,郑州核心节点已经完成了400多个主流大模型的适配优化,百度、硅基流动等头部企业已经在上面稳定跑业务,推理效率比传统方案提升了40%以上。

打开网易新闻 查看精彩图片

要自主,还要兼容

四、3万卡的突破,意义远不止于数字比拼

肯定有人会杠:英伟达都有10万卡集群了,你3万卡有什么好吹的?

这里必须说清楚一个核心逻辑:

英伟达的10万卡集群,规模确实更大,但它是闭源的、不对中国开放的,我们有钱也用不上,还随时可能被断供。

而我们的3万卡集群,是全球唯一一套全链条国产化、全自主可控的异构算力系统,它的意义,从来不是数字上的比拼。

它的核心突破,在于三点。

第一,技术难度全球领先。

英伟达的万卡集群,必须用同型号、同架构的自家芯片,才能实现稳定协同。

而我们的3万卡集群,用的是不同品牌、不同架构的国产异构芯片,却实现了更高的算力利用率,这个技术难度,比英伟达同规模集群高了不止一个量级。

第二,彻底打破了美企的卡脖子垄断。

从芯片、架构、调度系统到高速网络,全链条100%国产自研,我们终于有了一套完全不用看任何人脸色的高端算力底座。

以后我们搞AI大模型、搞新药研发、搞工业仿真,再也不用排队等英伟达的算力,再也不用担心被断供,高端算力的命脉,终于握在了我们自己手里。

第三,开创了全新的算力发展路线。

我们没有跟在英伟达的后面,去抢芯片、拼规模,而是自己开了一条全新的赛道,定了一套全新的规则。

从之前爆火的海水直接制氢,到今天的超算互联网破局,我发现中国科技的破局逻辑,从来都是一样的:

不跟在别人的老路上内卷,而是用中国方案,解决全球难题,自己开新路,自己定规则。

打开网易新闻 查看精彩图片

超算中心工作启动会现场

截至2026年2月,依托郑州核心节点的国家超算互联网平台,已经服务了超100万用户,上架应用超7300个,单日处理作业峰值103万个,累计支撑了1.96亿次科研、工业计算任务。

它已经实实在在地,在改变我们的生活,譬如:

新药研发的筛选周期,从6个月缩短到了2周;

公里级分辨率的全球数值天气预报,精度大幅提升;

中小企业的AI创业门槛,降到了之前的三分之一。

3万卡只是一个开始。

有了这套完全自主可控的技术,我们想扩到10万卡、100万卡,随时都能做到。

未来,这套全国产的算力系统,会成为中国AI发展、科技突破的最坚实底座,让我们彻底告别被美企卡脖子的时代。

本文权威信源 1. 人民网河南频道《国家超算互联网核心节点在郑州正式上线试运行》,2026年2月 2. 中国新闻网《3万卡国产算力池落地!国家超算互联网核心节点上线》,2026年2月 3. 中科曙光官方发布《scaleX万卡超集群支撑国家超算互联网核心节点建设》,2026年2月