DeepseekV4预览版正式发布并与华为昇腾芯片实现深度适配,一经上线便引发行业热议,也让英伟达CEO黄仁勋一直担忧的中国AI全栈自研局面,真正变为现实。

从模型综合实力来看,DeepseekV4在开源模型行列中处于领先位置,但对标ChatGPT5.4、Gemini3.1等国际顶尖闭源大模型,依旧存在一定差距。不过评价这款模型,不能只局限于参数跑分与性能强弱,其真正划时代的价值,在于标志着中国人工智能行业,已经具备独立打造本土技术标准、构建自主产业生态的硬核实力。

以往国内AI发展只能依附海外技术体系,如今我们有能力搭建属于自己的产业生态版图,未来行业规则、发展方向都将由我们自主掌控。

打开网易新闻 查看精彩图片

芯片适配是构建自主AI生态的首要根基。任何大模型的运行落地,都离不开高端算力芯片的支撑,但模型与芯片想要实现完美兼容、性能最大化释放,本身有着极高的技术门槛。

DeepseekV4与华为昇腾芯片达成原生级优化、深层次适配,彻底颠覆了国内行业以往的固有模式。过去国产大模型更新迭代后,都会优先适配英伟达芯片,后续再通过补丁修补的方式勉强兼容国产算力卡,属于事后被动适配。

而此次Deepseek在模型研发初期,就深度钻研华为昇腾芯片的硬件架构与运行逻辑,量身定制模型架构,实现从源头的协同设计。

打开网易新闻 查看精彩图片

可以把大模型比作专业赛车手,算力芯片就是专属赛车。普通适配就像赛车手随意驾驶通用车型,很难发挥出最佳水准;而原生级优化,是根据赛车手的自身特点定制打造赛车,同时让赛车手充分熟悉车辆的优势与短板,实现人车高度契合。

在此基础上经过多场景极限测试、反复调试优化,最终达成深度适配效果。更值得关注的是,Deepseek的布局并未局限于华为昇腾单一芯片品类,在V4版本发布当天,寒武纪就实现了同步适配,这足以说明模型在设计之初,就全面兼顾了多家国产AI芯片的适配需求。

放眼整个国产算力产业布局,2025年9月,华为在全联接大会上公布昇腾950PR、950DT、960、970四款芯片新品路线,明确昇腾950PR于2026年一季度推出。

打开网易新闻 查看精彩图片

仅仅七个月时间,昇腾950PR便搭载华为Atlas350AI训练推理加速卡正式商用,并快速进入大批量量产阶段,全年交货量有望突破75万片,这样的落地速度在全球半导体行业中都十分罕见。

技术层面,DeepSeekV4采用mxFP4精度架构,相较于英伟达主流使用的FP8架构优势明显,同等存储条件下FP4可承载双倍数据量,日常使用中几乎感知不到精度损耗。

而华为昇腾950是目前国内唯一商用、且原生支持FP4低精度推理的AI加速芯片,模型架构与国产芯片技术标准完美契合,为国产AI软硬件协同发展筑牢了技术底座。

打开网易新闻 查看精彩图片

AI基础设施开源,是打破英伟达CUDA生态垄断的关键一步。Deepseek主打开源路线,但它的价值绝不只是开放模型权重,更重要的是底层AI基础设施全面开源。

用通俗的方式解释:闭源模型如同直接上桌的成品菜肴,普通开源模型只提供食材配比,而基础设施开源,是把烹饪火候、专用工具、流程规范全部公开。即便更换硬件设备,也能依照底层标准复刻同等运行效果。

黄仁勋曾直言,英伟达真正的核心竞争力不在于芯片硬件,而是盘踞行业多年的CUDA生态。这套生态涵盖底层操作系统、开发工具、编程语言等全链条配套体系,长期垄断全球AI研发格局。

打开网易新闻 查看精彩图片

过去即便国产大模型选择开源,行业研发依旧离不开英伟达CUDA生态的捆绑依赖。

如今Deepseek主动开放底层全链路基础设施,建立中国自主的技术标准,让国内企业可以依托本土算力硬件,独立研发搭建大模型体系,真正迈出摆脱CUDA生态束缚的关键一步。

4月24日DeepSeekV4正式发布当日,华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份、昆仑芯、平头哥真武、天数智芯八家国产AI芯片品牌全部完成适配。华为云、腾讯云、联想智能云、天翼云等云服务商,宁畅、长江计算等服务器企业,也第一时间完成上架适配。

打开网易新闻 查看精彩图片

万亿参数级别的全新大模型,从模型权重落地到跑通推理、产出性能数据,不可能在短时间内临时调试完成。这也印证了国产芯片厂商早已提前获取V4模型进行内测优化,并且主动避开了英伟达与AMD,这是一场全产业链提前布局、协同发力的集体突围。

极致压缩算力成本,为行业生态迁移提供了强劲现实动力。任何技术生态的更迭与落地,都离不开商业利益的支撑,高昂的转型成本往往会阻碍企业入局意愿,而DeepseekV4恰好完美解决了这一痛点。

模型上线后,行业开发者讨论的焦点并非架构创新与参数升级,而是其极具优势的低廉调用成本。DeepseekV4的token输出成本,仅为海外同类主流模型的1/40到1/100,其中V4-Flash缓存命中输入低至0.2元每百万tokens,堪称AI行业的“价格屠夫”。

打开网易新闻 查看精彩图片

当下智能应用、大模型产业迎来爆发式增长,算力消耗成本居高不下,成为制约中小企业入局和行业普及的一大难题。Deepseek携手华为打造的国产算力解决方案,兼顾高性能与低成本两大优势,实实在在证明了脱离CUDA生态完全具备可行性。

低廉的算力成本,彻底打消了企业生态迁移的顾虑,主动推动各类应用从海外芯片适配版本,向国产算力平台迁移。当前全球大模型行业仍处于发展初期,国内一旦稳固国产算力自主生态,未来还能将这套成熟模式推向海外市场,释放巨大的全球化发展潜力。

如今中美科技博弈日趋激烈,2026年以来美国不断加码对华芯片管控,先后出台《芯片安全法案》《MATCH法案》《远程访问安全法案》等多项法案,从芯片出口、后台核查、云端算力租用等全维度围堵中国AI产业,企图将高端AI芯片的全生命周期都纳入美国监控范围。

打开网易新闻 查看精彩图片

在这样的外部环境下,国内互联网大厂加速国产化替代步伐,字节跳动2026年从华为采购的昇腾芯片订单总额或将超过400亿元,抛出56亿美元采购单锁定35万颗芯片,直接占据华为全年产能近一半,腾讯、阿里巴巴也已就新增芯片订单与华为展开深度接洽。

而DeepSeekV4的成熟落地,恰好为大厂海量芯片采购提供了商业验证,成为国产算力规模化落地的关键验收标杆,让后续更大规模的国产算力采购有了坚实底气。

英伟达CEO黄仁勋此前接受科技博主采访时频频破防,情绪难以掩饰,背后早已看透行业格局的变局。

打开网易新闻 查看精彩图片

向中国出售高端芯片,无异于放任核心技术外流;持续封锁芯片出口,又会倒逼中国加速全栈自研,坚定走出去CUDA化道路,让英伟达陷入卖也两难、禁也两难的尴尬境地。但即便黄仁勋心存顾虑,DeepseekV4的落地,已经让中国AI自主生态建设成为大势所趋。

DeepSeekV4综合能力与全球顶尖模型仍有差距,大模型训练环节暂时还无法完全脱离海外算力支撑,昇腾950芯片也面临产能供不应求的现实问题。

但正如华为轮值董事长徐直军所言,受外部制裁影响,单颗国产芯片算力相较英伟达仍有差距,但凭借华为三十多年在联接领域的技术积累,打造万卡级超节点集群,完全可以从系统层面补齐单点算力短板。

打开网易新闻 查看精彩图片

过去数年,中国AI产业始终走在“用海外芯片、追赶海外模型”的道路上。而DeepSeekV4的问世,开启了“用国产芯片、跑国产模型”的全新发展叙事。

从底层技术架构协同、全产业链同步适配,到低成本算力普及、自主生态搭建成型,中国AI终于在顶级大模型层面跑通了国产算力推理闭环。

恰逢特朗普定于5月14日至15日访华,芯片与人工智能已是此次中美峰会的核心议题,DeepseekV4在关键时间窗口强势亮相,为中国在中美科技谈判桌上亮出了一张重要底牌。

打开网易新闻 查看精彩图片

前路漫漫,CUDA多年构筑的生态护城河不会瞬间瓦解,训练环节技术攻坚、芯片产能爬坡、产业生态磨合仍需漫长时间。但相较于当下的技术差距,自主突围的方向更为重要。

可以确定的是,中国AI依托国产芯片、自主大模型构建全新产业生态的征程已然开启,一场摆脱外部卡脖子、实现科技自立自强的产业变革,正在全面铺开。