华为在2025全联接大会上公布了昇腾AI芯片三年迭代路线,从2026到2028,每年都有明确的产品更新节点,而且从芯片到集群架构都完成了全链条自研布局。
很多人盯着参数和英伟达比,却忽略了一个更关键的信号:华为已经搭建了完全自主可控的AI算力底座,从芯片到互联协议全链路没有空白。这不是单纯的性能追赶,而是在被封锁的情况下,重新定义了一套中国AI算力的游戏规则。这套规则背后,藏着怎样的产业逻辑?
AI芯片模型 / 带AI标识的芯片模型置于电路板背景上
三年三代升级 性能稳步翻倍的自研路径
和市场上不少“跳票”的芯片规划不同,华为这次给出的昇腾路线图时间节点非常清晰,每一步都有明确的发布窗口和性能指标。
2026年第一季度推出昇腾950PR,第四季度推出昇腾950DT;2027年第四季度推出昇腾960;2028年第四季度推出昇腾970,每一代的性能提升都有清晰的量化目标。
从参数上看,每一代的核心提升方向非常明确:算力从1PFLOPS(FP8)逐步翻倍到4PFLOPS(FP8),互联带宽从2TB/s提升到4TB/s,内存带宽也同步跟着涨。更关键的是,从昇腾950开始,HBM内存已经实现自研,950PR用HiBL 1.0,950DT升级到HiZQ 2.0,彻底摆脱了对外界存储芯片的依赖。
我们把华为昇腾和英伟达最新 Blackwell B300做了参数对比:
芯片型号
FP8算力
HBM容量
内存带宽
互联带宽
华为昇腾950PR
1PFLOPS
144GB
4TB/s
2TB/s
华为昇腾960
2PFLOPS
288GB
9.6TB/s
2.2TB/s
华为昇腾970
4PFLOPS
288GB
14.4TB/s
4TB/s
英伟达B300
7.5PFLOPS
288GB
8TB/s
可以看到,最新规划的昇腾970在内存带宽上已经超过了英伟达B300,算力差距也在快速缩小。更重要的是,所有这些技术,都是华为自主可控的。
英伟达芯片 / 带有英伟达标识的芯片特写
不止单芯片 万卡级超节点才是真正杀招
外界大多关注单芯片的参数对比,却很少注意到华为这次押注的“超节点”架构,才是改变AI算力产业格局的关键。
徐直军在会上明确提出,超节点将成为AI基础设施建设的新常态。简单来说,超节点就是把几千甚至上万颗AI芯片,通过新型互联协议,在逻辑上整合成一台超级计算机,解决大规模模型训练的通信延迟问题。
2026年第四季度,华为将推出基于昇腾950DT的Atlas 950 SuperPoD超节点,规模达到8192卡,FP8总算力达到8E FLOPS,训练性能比上一代Atlas 900提升17倍,推理性能提升26.5倍。
为了支撑万卡级组网,华为还自研了“灵衢”互联协议,柜间互联带宽达到16PB/s,这个数字超过了全球互联网的峰值带宽。而且华为已经决定开放灵衢2.0技术规范,邀请全产业一起共建生态。
“超节点在物理上由多台机器组成,但逻辑上以一台机器学习、思考、推理。”——徐直军
更狠的是,华为已经规划了百万卡级的超节点集群Atlas 960 SuperCluster,FP8总算力达到2 ZFLOPS,这个规模放在全球都是前所未有的。
很多人不知道,大规模AI训练最大的瓶颈从来不是单芯片算力,而是多芯片互联的通信效率。当模型参数增长到万亿级别,哪怕单芯片算力再强,传数据的速度跟不上,整个集群的效率就会暴跌。华为从架构层面解决这个问题,正好打中了当前大规模AI训练的痛点。
昇腾+鲲鹏双轮驱动 构筑全栈自主算力底座
这次华为不止公布了昇腾AI芯片的路线,同步还放出了鲲鹏CPU的更新计划,AI芯片加通用CPU的双轮布局,让整个算力底座完全自主可控。
根据路线图,2026年第四季度华为会推出鲲鹏950,基于自研双线程灵犀核心,有96核心192线程、192核心384线程两个版本;2028年第一季度推出鲲鹏960,高性能版本单核性能提升50%,高密度版本最多做到256核心512线程,覆盖虚拟化、大数据、数据库等全场景。
华为还基于鲲鹏950开发了全球首个通算超节点TaiShan950 SuperPoD,计划2026年第一季度上市,最大支持48TB内存,支持资源池化。徐直军直接说,它会成为大型机、小型机的终结者。
芯片生产设备与芯片 / 芯片生产设备在电路板上方作业
这意味着,华为已经完成了从通用CPU到AI加速芯片,从单芯片到万卡集群,从硬件到互联协议的全链条布局,整个AI算力基础设施,每一个环节都有了自主替代方案。
过去两年,国内很多AI企业都在被“卡脖子”的问题困扰,想买英伟达高端芯片拿不到货,产能被牢牢控制在别人手里。华为这套全自主方案出来,相当于给国内AI产业提供了一个完全可控的新选择。
真正的突破从来不是某一颗芯片参数超过对手,而是建立一套不依赖别人的完整产业体系。这才是华为昇腾路线图真正的价值所在。
自主路线的长期价值 行业格局正在改变
现在很多讨论还是停留在“单芯片参数和英伟达差多少”,但这种对比本身就已经偏离了本质。华为走的从来不是“跟着对手跑”的路线,而是“从无到有搭建自己体系”的路线。
在被多轮制裁的情况下,华为能在三年内拿出这样清晰的产品路线,每一步都有明确的技术升级和落地时间,本身就是一件非常了不起的事情。更关键的是,它证明了中国企业完全有能力,在高端芯片领域走出一条自主可控的路线。
对国内AI产业来说,华为昇腾的成熟,意味着供应链多了一个稳定的选择,不再需要看别人的脸色安排产能。对整个半导体产业来说,华为的探索也给其他企业趟出了一条路:封锁之下,不是只有“等靠要”,还可以靠自己的研发一步步突破。
当然我们也必须承认,和全球最领先的产品相比,华为昇腾还有差距,整个生态的成熟也需要时间。但方向已经明确,脚步已经迈开,接下来就是一步步落地兑现。
当全球AI算力产业出现了第二套完整自主的供应链体系,最大的改变不是谁打败了谁,而是所有玩家都有了更多选择,整个行业的议价权会重新分配,创新的速度也会更快。
我们不用急于证明“我们已经超过谁”,但必须承认:华为这一步,已经改写了全球AI芯片产业的格局。未来三年,我们能看到一个完全自主的AI算力底座真正成型,这对所有从业者来说,都是一件值得期待的事。
#芯片##华为##算力##昇腾#
热门跟贴