你以为AI卷的是模型?错了!现在连最底层的硬件都开始“军备竞赛”了——万卡集群,这个听起来像军事术语的词,正在让中国AI产业疯狂“堆料”。过去两年,从深圳到上海,从科技巨头到初创芯片公司,谁能建成、撑起万卡集群,已经偷偷变成了一场国家级的算力比拼。

所谓万卡集群,就是把1万张以上的AI加速芯片用高速网络连起来,变成一台超级计算机。它最牛的地方在于,能把大模型训练时间从“月”缩到“天”甚至“小时”——这对AI迭代来说,简直是“开火箭”。

打开网易新闻 查看精彩图片

深圳那套率先激活的万卡集群,算力达到1.1万petaflops,相当于550万台个人电脑同时满负荷运转。这可不是数字游戏,背后是整个AI产业链“训得起、跑得快”的迫切需求。根据中国信息通信研究院的数据,到2025年6月,中国智能算力总量已经到96.2万petaflops,同比涨了30%多,AI市场规模今年要突破万亿。在这么大的市场压力下,万卡集群从“能建”变成了“必须建”。

第一个吃螃蟹的是深圳。这座城市激活了中国首个用国产芯片的万卡智算集群,芯片是华为昇腾910C。这款芯片用了计算小芯片架构,单卡FP16算力达320 TFLOPS,加上之前投用的3000 petaflops集群,总算力到了1.4万petaflops。

华为在这场竞争里的地位没人能替代。IDC数据显示,2025年华为海思在中国AI加速卡出货量占了49.2%,卖了81.2万块,甩其他国产厂商几条街。这成绩背后,是美国芯片管制带来的市场真空——英伟达H100、A100进不来,华为昇腾正好补上了这个缺口。

阿里巴巴从另一个方向切入。2026年4月,阿里宣布在大湾区建成首个用自研“祯吾”芯片的万卡数据中心,这是祯吾芯片最大规模的实际部署,既能训练又能推理。这说明阿里不再满足于当算力的“买家”,而是要在供应链上掌握话语权。

摩尔线程也不甘落后。他们推出的KUAE万卡智算集群,主打全栈交付的“AI工厂”方案,从底层MUSA架构芯片到上层调度软件,一条龙服务,目标是中小算力需求方。2025年前三季度,摩尔线程营收7.9亿元,同比增长三位数——这速度,说明市场很认可他们的方案。

理解万卡集群的热潮,不能离开地缘政治背景。美国从2022年开始对中国实施AI芯片出口管制,H800、A800相继被限,英伟达在中国的份额从高峰时的九成以上,跌到2025年的不足六成。但这种压力反而成了国产算力产业的催化剂——IDC数据显示,2025年中国本土GPU和AI芯片厂商的市场份额已经升到41%,三年前这个数字几乎可以忽略不计。

不过,市场份额上升不代表技术代差消失了。目前国产芯片和英伟达H100在互联带宽、软件生态成熟度、单卡能效上还有差距。万卡集群的规模效应,其实就是用数量弥补单卡的短板——堆更多芯片,优化调度算法,在系统层面逼近顶尖水平。

这也解释了为什么各地政府都积极参与。算力已经被纳入国家新型基础设施战略,各省市都争着建智算中心,有些城市甚至把万卡集群落地当成招商引资和产业升级的筹码。

从深圳的华为昇腾集群,到阿里的祯吾数据中心,再到摩尔线程的全栈方案,中国正在用分布式的方式押注同一件事:AI时代,算力不能被别人掐脖子。这场军备赛还没结束,但赛道已经清晰,胜负可能在未来三到五年内见分晓。

你觉得中国能在这场万卡集群竞赛中赢下关键一局吗?国产芯片能彻底打破卡脖子吗?评论区聊聊你的看法!觉得这篇内容有用的话,别忘了点赞收藏转发,让更多人看到中国AI的硬实力!