2026年4月24日这个日子注定会被AI史记上一笔。当天DeepSeek V4正式发布并开源,几乎同一时间华为昇腾超节点全系列产品宣布支持该模型。
更早几个小时,白宫发出措辞激烈的备忘录,指控中国实体以"工业级规模"窃取美国前沿AI系统。
先倒回去看时间线。DeepSeek V3是2024年底发布的,紧接着2025年1月R1模型横空出世,以586万美元的训练成本对标GPT-4的性能,全球震惊。
按正常节奏,V4本该在几个月后跟进。但知情人士透露,V4经历了三到四次延期,最初确实计划在春节前后发布。
从2月跳到3月,从3月拖到4月,外界猜测纷纷——有人说是缺算力,有人说是团队人员变动。真实原因远比这些猜测更具战略深意。
翻译成大白话就是:DeepSeek要从英伟达的技术体系里彻底搬家。V4完成了对华为昇腾芯片的深度适配,从英伟达CUDA生态向华为CANN架构做了底层代码迁移。
这不是换个驱动、调个参数的事情。整个推理引擎、算子优化方案,全部要针对非英伟达架构重新设计,等于在技术底座上动了一次开膛手术。
为什么非要动这个手术?因为CUDA是英伟达统治AI世界的真正利器。很多人以为英伟达靠的是GPU硬件,这只对了一半。
CUDA从2007年推出,比华为2021年推出的CANN早了十几年,积累了超过500万开发者。全世界做AI训练的研究员,几乎所有代码都是在CUDA上写的,所有框架都围绕它优化。
这就像三十年前你想用电脑就离不开Windows一样,不是你不想换,而是整个软件生态都长在这棵树上。谁控制了底层计算架构,谁就掌握了整个AI产业的命脉。
过去几年美国对华芯片管制的逻辑也正是建立在这个基础上。美国试图通过控制基础层技术建立非对称依赖,使中国被迫在应用层追赶,难以突破底层技术壁垒。
用通俗的话讲:你可以在我的土地上盖房子,但地基是我的。哪天我不高兴了,地基一撤,房子全塌。华为2019年被制裁的教训就是前车之鉴,安卓生态一刀切断,手机业务遭受重创。现在AI时代到来,同样的剧本要不要再演一遍?
这就是DeepSeek V4推迟发布的深层逻辑。团队不是在等技术成熟——V4训练完成时,内部清楚它大约是Opus 4.5或GPT-5.3水平,性能已经够用了。他们等的是华为昇腾950系列芯片就绪。
2026年3月21日,华为宣布Atlas 350加速卡正式上市,搭载昇腾950PR处理器,单卡算力达英伟达H20的2.87倍。
这颗芯片还有一个杀手级特性:它是国内唯一支持FP4低精度的推理产品,而英伟达想卖给中国的H200反而不支持原生FP4。硬件底座准备好了,软件迁移完成了,这才是发射窗口真正打开的时刻。
CUDA到CANN的迁移,核心难点在于算子接口差异处理、Flash Attention重写、精度对齐验证。DeepSeek的工程团队花了好几个月把这些坑一个个填平,相当于在一套全新的地基上重建整栋大楼,还要保证住户搬进来感受不到区别。
有技术博主测算,昇腾950PR单卡理论算力约为H100的70%左右,单芯片确实还有差距。但华为的思路不是拼单兵,而是拼集群——靠超节点架构把成千上万张卡连成一台逻辑上的超级计算机,用规模弥补单卡性能差。
V4发布当天华为能做到"首日兼容",就是这几个月联合调试的成果。华为确认昇腾全系列超节点与最新950系列实现首日兼容。没有提前深度合作,这种级别的同步不可能实现。
更耐人寻味的是产品节奏上的配合——DeepSeek官方在V4价格图表下面用小字明确标注:"受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调"。这不就是在告诉全世界:我们的未来和华为绑在一起了?
那美方是什么反应?精准到令人怀疑早有预案。就在V4发布同日,美国国务院向全球驻外使馆发送外交电报,指示外交人员与各国同行沟通"对于对手提取并蒸馏美国AI模型的关切"。
OpenAI和Anthropic也配合出击,前者指控DeepSeek利用GPT输出训练自身产品,后者在今年2月就点名DeepSeek、月之暗面、MiniMax三家中国公司进行"蒸馏攻击"。一套组合拳打出来,信息战的架势非常明显。
但这些指控经不住细想。蒸馏是一种公开的技术方法,用大模型的输出来训练小模型,全世界的AI实验室都在用。
指控的时机比指控的内容更值得分析。就在V4发布前两天的4月22日,美国众议院外交事务委员会刚刚通过了被业内称为"史上最严对华芯片管制"的MATCH法案。
该法案不再只限制高端芯片,而是把管制范围扩展到成熟制程设备,试图从根子上卡住中国半导体制造的产能扩张。
更绝的是,就在4月28日,美国商务部致函泛林集团、应用材料等芯片设备厂商,要求暂停向华虹半导体部分工厂出口。外交备忘录、立法围堵、设备断供——三管齐下,时间窗口全部对准DeepSeek V4发布前后,说没有协调,你信吗?
美国这一轮动作之所以如此急迫,是因为一个他们最不愿意看到的场景正在成为现实:全球首个主要针对华为昇腾AI处理器深度优化的前沿大模型,全程脱离英伟达CUDA体系。
以前中国AI再怎么厉害,算力底座还是人家的。你用2048张英伟达H800训练出来的模型,不管跑分多高,美国人心里是不慌的——因为水龙头的开关还攥在他手里。现在DeepSeek说我不需要你的水了,自己打了一口井,这才是动摇根基的一击。
黄仁勋对此的判断非常清醒。他曾公开警告,如果DeepSeek在华为芯片上完成首发,意味着AI模型有望在美国技术架构之外实现最优运行,这对美国是重大损失。而他讲这话的背景更加值得玩味——到2025年10月,黄仁勋已经承认英伟达在中国的市场份额从95%降到了0%。
不是因为中国不想买,而是美国管制政策让英伟达彻底退出了中国市场。伯恩斯坦预测,到2026年,华为将占据中国AI芯片市场约50%的份额,英伟达仅剩8%。这个数字本身就是对"出口管制可以遏制中国AI"这一叙事的讽刺。
再看算力投入的差距。美国科技巨头2025年的AI基础设施资本支出确实惊人,微软、谷歌、亚马逊、Meta加起来超过四千亿美元。中国的数字没有这么夸张,但走的是完全不同的路径。
中国不是在跟美国比烧钱,而是在解决一个更根本的问题:这些钱到底花在谁家的芯片上。如果花出去的每一块钱都流向英伟达,那就是在给潜在对手输血。DeepSeek V4和华为的这次联手,本质上是在回答一个产业问题——中国AI产业每年数以千亿计的算力投资,能不能形成内循环?
这也解释了为什么明明已经可以买到英伟达H200,中国大厂却并不急于大规模采购。2025年底特朗普宣布允许英伟达向中国出售H200,但附加了25%的费用。
表面上看是打开了一道门缝,但深层博弈的逻辑早已改变。字节跳动、阿里巴巴等科技巨头已经和华为签署了昇腾950的长期框架订单。
华为计划今年出货75万块950PR,价格仅约7万元人民币,不到H200的三分之一。从成本角度看,买国产芯片不仅更便宜,还不用担心哪天政策再变被断供。
市场数据已经能看到趋势扭转了。2026年2月,全球最大AI模型API聚合平台OpenRouter上,中国大模型Token调用量首次超越美国——那一周中国模型达4.12万亿Token,美国仅2.94万亿。
此后中国模型调用量进一步攀升至5.16万亿,三周累计增长127%。到4月,平台调用量前五名中仍有三个来自中国。关键在于,这些数据是在以美国开发者为主的海外平台上跑出来的,不是国内市场自嗨,而是全球开发者用真金白银投的票。
V4的定价策略又是一记暴击。V4-Flash输出每百万Token只要2元人民币,Pro版24元,而GPT-5.4的输出价格是每百万Token 30美元。大致折算一下,最便宜的V4-Flash只有GPT-5.4报价的大约百分之一。
有人会说便宜没好货,但V4在编程和Agent场景的跑分并不弱——V4-Pro达到开源模型最佳水平,使用体验据评测优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式。差距是有,但不是代差,而且价格只有对手的零头。
更关键的是V4保持了开源。模型权重公开,任何开发者都可以下载部署。API同时支持OpenAI和Anthropic两套接口标准,意味着全球开发者几乎零成本迁移。
这一招特别狠:你闭源收高价,我开源白送技术,同时还兼容你的接口让你的用户无痛切换。这不是对抗,这是釜底抽薪。你的商业壁垒再高,也挡不住免费且够用的替代品。
我认为这就是这盘棋最精妙的地方。DeepSeek不是在跟美国AI公司争谁的分数高,它要争的是生态入口。当全球数以百万计的开发者习惯了用DeepSeek的API,当他们发现这套模型跑在华为芯片上也一样好使,当他们意识到自己可以不用花几十倍的价钱买OpenAI——一个独立于美国技术栈的AI生态就自然而然地生长出来了。这才是美国真正害怕的东西,不是某一款模型的跑分,而是自己苦心经营十几年的生态垄断被从底部瓦解。
2025年8月,华为已经宣布CANN全面开源开放,这步棋也是在为今天的局面铺路。开源意味着任何硬件厂商、任何开发者都能参与到这个生态建设中来。CANN的开发者社区目前大约10万人,跟CUDA的500万相比确实差距悬殊。但有了DeepSeek这个杀手级应用作为牵引,这个数字的增长速度会完全不同。就好比微信刚出来的时候用户也不多,但只要有了足够好的应用场景,生态就会自己滚起来。
从更宏观的视角看,这盘棋指向的不只是中美两家的事。全球南方国家对AI技术的渴求在快速增长,但硅谷闭源模型的价格和英伟达芯片的供给都让他们望而却步。中国此时拿出一套"开源模型+国产算力"的打包方案,门槛低、成本低、不附带政治条件——对于东南亚、非洲、中亚和南美的政府和企业来说,吸引力不言自明。这不是做慈善,这是在AI时代争夺全球影响力的战略布局。
当然,差距是客观存在的。DeepSeek自己也承认V4在部分关键指标上仍落后于美国最先进模型约3至6个月。华为单芯片性能确实不如英伟达最新的Blackwell系列。CANN的生态成熟度跟CUDA相比还有很长的路要走。这些我都不回避。但问题的关键不在于今天谁分数更高,而在于中国AI产业有没有一条不依赖美国的路可以走。V4的发布证明:这条路走得通。
至于美国的AI垄断神话,不是今天就破,但裂缝已经打开了。当免费的开源模型跑在便宜的国产芯片上,当全球开发者开始习惯一个不经过英伟达的技术路径——那堵靠出口管制和专利壁垒砌起来的墙,每一天都在变矮。所有的牌都摆在明面上,你看得清清楚楚,但你挡不住,这就是阳谋。
热门跟贴