2026年4月24日,DeepSeek V4正式发布并引爆AI圈。有媒体宣称其为“全球首个万亿参数MoE大模型100%国产化训推闭环”,官方明确其实现跨算力平台适配,既兼容华为昇腾、寒武纪等国产芯片,由二者混合集群提供算力支撑,也在开源层面保留CUDA底层实现,未完全脱离英伟达生态。这份国产算力突破引发“打破英伟达垄断”的声浪,但冷静审视可知:CUDA霸权未死,中国AI已正式“分家”,双轨并行时代已然来临。

打开网易新闻 查看精彩图片

一、去伪存真:DeepSeek V4的事实与夸大

核心结论:DeepSeek V4不是“完全国产训练”的神话,而是“推理全链路国产化、训练核心国产化”的阶段性胜利。宣传文案中“全程纯国产算力训练”“彻底打破CUDA垄断”有明显夸大,但“推理100%去英伟达”“万卡集群稳定运行”是既定事实。

核心事实:三大突破实打实

从客观事实来看,DeepSeek V4的推理环节已实现100%纯国产,线上服务、API调用、私有化部署均运行在华为昇腾950PR和寒武纪MLU590上,底层框架迁移至华为CANN,数十万行算子重写,完全脱离英伟达生态,标志中国AI应用落地已彻底摆脱英伟达卡脖子;训练采用华为昇腾910B+寒武纪MLU590混合集群,昇腾承担70%以上核心训练任务,寒武纪负责补充训练,实现国产芯片支撑万亿参数MoE模型大规模训练的突破,证明国产算力已从“能用”进入“好用”阶段;同时V4-Pro模型能力比肩国际顶级闭源模型,推理成本仅为GPT-4的1/70,开源实力实现重大突破。

宣传夸大:三点需理性看待

而宣传中的夸大之处也需明确:“全程纯国产训练”不实,万亿参数稠密基座主训练仍少量使用英伟达H100,国产集群仅承担辅助任务,核心原因是CUDA在超大规模稠密训练等领域的优势暂无法替代;“一年打破CUDA垄断”不成立,CUDA是十几年积累的全球科研生态、算子库、工具链的总和,华为CANN仅用1年无法颠覆其生态壁垒;“彻底去英伟达化”片面,DeepSeek V4仅在商用推理、产业落地场景去英伟达,前沿科研、高端训练等领域仍依赖英伟达算力。

二、双雄协同:华为昇腾与寒武纪的分工定位

DeepSeek V4的国产化之路,是华为昇腾主导、寒武纪补充的协同格局,二者各司其职,共同撑起国产算力半壁江山。

华为昇腾:主力核心

其中华为昇腾是国产化体系的核心底座,承担着训练、推理和生态支撑的核心职责:昇腾910B承担70%以上万亿模型分布式训练,是唯一能稳定支撑万卡级MoE模型训练的国产芯片;昇腾950PR承载线上服务推理,单卡性能≈英伟达H20的2.87倍,推理成本极低,是国产推理绝对主力;同时提供CANN软件栈、分布式训练库等,工程师驻场联合调优,解决国产算力“能用不好用”的痛点,堪称AI国产的“主心脏”。

寒武纪:补充备胎

寒武纪则是不可替代的差异化力量,是国产算力的“备胎”,更是私有化、边缘场景的专用方案:MLU590参与部分稀疏层、专家模块训练,分担算力压力,降低单一芯片依赖风险,丰富国产算力技术路线;完成V4 Day0原生适配,主打端侧、私有化、低功耗AI推理,填补昇腾在低功耗领域的空白;更提供完全独立自研AI架构,不依附GPU路线,形成多技术路线竞争的良性生态,是自主可控的重要保障。

三、深层真相:AI世界双轨并行,而非颠覆CUDA

DeepSeek V4的核心意义,不是颠覆CUDA、打败英伟达,而是让全球AI从“单极霸权”进入“双轨并行”时代——美国走CUDA体系,中国走国产算力体系,永久分家、互不兼容、各自闭环。

CUDA:短期仍占霸权

一方面,CUDA霸权仍在,未来3-5年仍是全球科研、高端训练的唯一主流。CUDA的核心优势在“训练”和“科研”,全球95%以上AI论文、算法、开源模型基于CUDA开发,国产生态无法提供同等科研环境和社区支持;英伟达H100/H200在超大规模稠密模型训练等方面领先国产算力1-2代,万亿参数基座主训练短期内仍离不开英伟达;同时CUDA是全球AI通用语言,模型、工具、人才围绕其构建,生态惯性难以打破。

国产算力:商用已闭环

另一方面,国产算力已实现商用闭环,中国AI彻底实现自主可控。DeepSeek V4的真正意义,是拿下“商用推理”和“产业落地”核心底盘,让美国芯片制裁彻底失效:国内主流大模型2028年底前将全部完成国产推理适配,线上服务、政企应用等均脱离CUDA和英伟达依赖;中国拥有全球最多AI应用场景、最完整产业链,国产算力凭借低成本、高性价比,在工业、政务等领域渗透率碾压美国;“国产芯片→国产框架→国产大模型→国产应用”的完整内循环已形成,不再依赖国外技术。

中美格局:双轨各有长板

未来全球AI格局,将是美国强在通用逻辑、数学、AGI探索等“高端智商”领域,闭源旗舰模型仍是全球能力天花板;中国强在中文理解、多模态、低成本、产业落地等“实用能力”,开源模型数量质量、产业渗透率全球第一,二者各有长板、平分秋色,双轨并行成定局。

四、历史意义:中国AI的自主可控拐点已至

核心价值:四大里程碑

DeepSeek V4是中国AI产业的分水岭,标志着中国AI彻底告别技术依附,进入“自研、自训、自用、全球竞争”新阶段。其核心价值在于:打破算力卡脖子,筑牢国家AI安全底线,证明不用英伟达也能训出世界第一梯队万亿大模型,美国高端芯片封锁被实质性击穿;推动国产AI芯片产业链兑现,国内大厂集体转向国产算力,昇腾订单暴涨,国产AI芯片从研发期进入商业化爆发期;开源大模型比肩国际,在模型架构等领域实现原创突破,提升中国AI全球话语权;重构全球AI格局,走出不依赖GPU、CUDA的自主技术路线,让算力自主+全栈国产化成为未来大模型竞争的核心话语权。

结语:理性前行,未来可期

DeepSeek V4是中国AI产业厚积薄发的结果,我们既不盲目吹捧,也不妄自菲薄。清醒认知是:CUDA霸权未死,中国AI仍有差距,但商用推理底盘已牢牢守住,自主可控拐点已至。未来3-5年是补短板、扩应用的关键期,坚持自主研发,从“跟跑”到“领跑”只是时间问题。DeepSeek V4,不是终点,而是中国AI自主可控的新起点。路漫漫其修远兮,我们终将抵达。