黄仁勋慌了？DeepSeek V4成首个脱离英伟达的万亿大模型

侃故事的阿庆

2026-04-19 11:11 ·福建

你敢信吗？黄仁勋最近说了句大实话，他说DeepSeek搞的这事儿"对美国非常糟糕、很可怕"。说实话，当我看到这句话的时候，整个人都愣住了——能让老黄说出"可怕"两个字，这得是多硬核的技术突破？

4月18日，中国AI圈扔出了一颗核弹：DeepSeek V4即将成为全球首个完全脱离英伟达生态的万亿参数大模型。什么意思呢？简单说就是，这玩意儿不再跑在英伟达的芯片上了，而是全面切换到华为昇腾。这波操作，相当于在英伟达的护城河上炸开了一个大口子。

万亿参数大模型，到底有多猛？

你可能想问，这个DeepSeek V4到底有什么能耐，能让黄仁勋都坐不住了？

首先看参数规模。V4采用自研Ultra-MoE稀疏混合专家架构，总参数达到1-1.5万亿。但关键是，它每次处理信息只激活约370亿参数，只占总参数的3%。打个比方，就像一家公司有1万个员工，但遇到问题只需要3%的专家出面就能搞定，效率高得离谱。

再说一个更狠的——100万Token上下文窗口。这是什么概念？普通大模型的上下文窗口大概是几万字，而V4直接支持100万Token，提升了近8倍。更牛的是，通过Engram条件内存架构，V4的信息召回率达到97%。什么意思？你丢给它一部长篇小说，它不仅能记住每个细节，还能精准回答你关于任何情节的问题。

在代码能力上，V4直接超越了Claude 3和GPT-4系列，支持50多种编程语言，能处理百万行级别的代码库。说它是程序员的"超级外挂"一点不为过。

"换芯手术"有多难？8个月，数千个问题

但真正让我佩服得五体投地的，是这次迁移的难度。

DeepSeek团队花了整整8个月，把底层代码从英伟达的CUDA架构全部重写成了华为的CANN框架。8个月啊朋友们！你们知道这意味着什么吗？

CUDA是英伟达花了十几年构建的生态系统，全球几百万开发者都在用这套工具。一旦切换到华为昇腾的CANN框架，相当于把整栋楼的地基挖了重建，还要保证楼上每一层都稳如老狗。

这中间遇到了什么问题？数千个兼容性难题。从编译器到优化器，从底层驱动到上层应用，每一个环节都要重新适配。而且这次迁移，DeepSeek根本没找英伟达或AMD帮忙，完全自己啃下来的。

说实话，我觉得这步棋走得太漂亮了。想想看，如果这次迁移成功，不仅证明了国产算力完全可用，更重要的是，给整个中国AI产业打了个样——原来我们真的可以不用英伟达。

华为昇腾950PR芯片的性能也给这次迁移提供了底气。单卡FP4精度算力达到1.56P，比英伟达H20高出2.87倍，还有112GB的HBM显存。硬件跟上了，软件适配也跟上了，这事儿就成了。

中国AI的"独立宣言"

有人可能会问，费这么大力气换芯片，值得吗？

当然值得！

你想啊，之前为什么大家都用英伟达？因为生态成熟，因为性能领先，因为所有人都这么做。但问题是，当别人卡你脖子的时候，这些"优势"瞬间就能变成劣势。

DeepSeek V4这次迁移，战略意义远超技术本身：

打破垄断：英伟达在前沿AI算力领域的绝对主导地位，第一次被真正撼动了。

降低风险：再也不用担心地缘政治导致的芯片断供问题。

生态建设：华为昇腾生态会因为DeepSeek的加入变得更成熟，吸引更多企业加入国产算力阵营。

难怪黄仁勋会说出"可怕"两个字。一旦中国企业开始"去英伟达化"，英伟达28%的数据中心业务营收都会受到影响。更重要的是，这可能引发连锁反应，让更多企业看到国产算力的可能性。

我的观点

说实话，看到这个消息的时候，我内心是激动的。

DeepSeek从最初的"不融资"到现在的首次融资100亿美元估值，表面上看是战略转向，但骨子里那份"必须掌握核心技术的"执念从来没变过。8个月的"换芯手术"，不是赌气，而是深思熟虑后的战略决策。

梁文锋说过一句话让我印象很深："算力自主不是为了闭门造车，而是为了在全球AI竞争中拥有平等对话的权利。"

这话说得太对了。

以前我们总觉得AI竞争就是比谁家的模型更强，但这次DeepSeek告诉我们，真正的竞争是在底层——谁掌握了算力，谁就掌握了AI时代的主动权。

DeepSeek V4预计4月底发布，到时候肯定会有更多实测数据出来。但不管怎么说，一个新的时代已经开始了。

你觉得中国AI这次能真正实现算力自主吗？评论区聊聊你的看法。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴