就在最近,英国《金融时报》在AI领域扔下了一颗重磅炸弹:华为昇腾AI芯片2026年营收预计飙至120亿美元(约合820亿人民币),同比暴增60%(2025年约75亿美元)!

而《路透社》报道:阿里、字节、腾讯等国内巨头开始抢购昇腾950芯片,华为的出货量会达到75万颗。

打开网易新闻 查看精彩图片

国内财经则给出了更为具体的数据:字节约25万颗、阿里约15万颗,两家就达到了40万颗

在这种供不应求的局面下,华为AI芯片价格一度上涨20%

更为炸裂的是,当DeepSeek-V4适配昇腾950时,官方技术报告首次将华为昇腾AI芯片与英伟达GPU并列作为标准算力底座。

那么昇腾950凭什么得此殊荣呢?

昇腾950系列是华为2026年一季度推出的新一代AI芯片,包括950PR(推理)和950DT(训练)等型号,支持FP8、FP4等低精度格式。

根据华为昇腾计算业务总裁张迪煊在大会现场的展示,搭载昇腾950PR的Atlas 350加速卡参数为:

算力方面:FP4精度算力为1.56 PFLOPS,是英伟达H20的3倍(H20约为0.54 PFLOPS),甚至接近H100。

存储方面:搭载了自研HBM容量达到了112GB,比H20的96GB多出16GB;

带宽方面:内存带宽为1.4TB/s,低于英伟达H20的4.0TB/s,但是通过优化可将访存效率提升4倍。

也就是说,昇腾950PR在FP4算力方面,非常强悍。

通过查询发现:大模型有上万亿个参数组成,每个参数就是1个或几个数字,这些数字都在存储芯片中。FP8就是用8位比特记录一个数字,而FP4就是用4位比特记录。

FP8记载清晰,但是需要更大的内存、更大的算力,而FP4虽然记载没有FP8清晰,但输出结果也是正确的,日常使用情况下基本没区别,关键是需要的内存、算力明显小一倍。

在这种情况下,华为昇腾950的商用价值就成倍的提升了,因为昇腾950是唯一一款支持FP4的AI加速卡,而英伟达全系基本都在用FP8。

这种错位的竞争,让DeepSeek看到了重大商机。

打开网易新闻 查看精彩图片

DeepSeek-V4的问世,让英伟达、OpenAI、谷歌都感到了危机,因为它在训练阶段就选择了FP4,并且深度与昇腾950绑定。

结果呢?更是惊艳!

DeepSeek-V4的两个版本,Flash版和Pro版都支持百万词元(Token)的上下文,Pro版直接是万亿大模型,总参数量达到了1.6T。

根据专业机构的测评,DeepSeek-V4 Pro版大幅领先其他开源模型,仅次于谷歌的顶尖闭源模型。

参数堆起来只是小试牛刀,更厉害的是成本降低、能耗降低。

根据官方数据,在100万Token的极端场景下,V4-Pro处理数据所需的计算量降低了27%,能耗降低了40%。

这两个参数的降低,意味着成本的降低,那么大模型使用的定价也就降低了。

深度求索的官方定价为:

DeepSeek-V4-Flash,输入价格是0.2元/百万Token,输出2元/百万Token。

DeepSeek-V4-Pro,输入1元/百万Token,输出24元/百万Token。

什么概念,同样级别的大模型,比亚马逊、OpenAI价格低了10倍,谁不抢着用啊!所以,亚马逊、OpenAI这类大模型企业有了压力。

而压力更大的则是英伟达,DeepSeek用万亿级、世界领先的大模型证明了华为昇腾950在AI训练、推理上跑通了。

阿里、字节、腾讯这类国内大厂直接作出了商业决策,购买昇腾AI芯片,来跑自己的大模型,做自己的云服务。

中国企业苦英伟达久矣!

打开网易新闻 查看精彩图片

在美商务部的打压限制下,英伟达芯片被限制出口至中国市场,而且规则不断的改变。

A100、H100、H200先后被禁,哪怕是阉割版的A800、H800、H20也一度被禁,甚至很多企业老总早晨醒来第一件事就是看新闻,看美商务部的禁令。

云计算厂房建好了,冷却设备购买了,但英伟达AI加速卡迟迟不到位,还被各路经销商加价,一旦犹豫不买,就会错过AI发展浪潮。

现在,有了昇腾950,一个能够平替英伟达的方案,自然会优先选择,这不仅仅是国产替代,更是实打实的商业现实。

此外,为了弥补与英伟达旗舰芯片的差距,华为还另辟蹊径将几千颗昇腾950并在一起,打造超节点。

打开网易新闻 查看精彩图片

例如:Atlas 950 SuperPoD超节点,使用了8192颗昇腾950,FP8总算力达到了8EFLOPS,内存容量达到了1152TB,互联带宽16.3PB/s,对比英伟达即将推出的NVL144,在总算力、内存容量、互联带宽方面领先6.7倍、15倍和62倍。

英伟达的加速卡在中国市场份额快速下降,取而代之的是华为昇腾、寒武纪、摩尔线程这些国产AI芯片企业。

随着国产芯片不断的更新迭代、使用场景也会越来越多,生态也会越做越好,而英伟达积累的十几年的CUDA生态护城河,最终也会被攻破。

我是科技铭程,欢迎评论区留言,共同讨论!