DeepSeek 要融资了！抛弃英伟达，估值百亿的中国AI联手华为|cuda|deepseek|中国|知名企业|英伟达

2026年4月18日，一则消息在投资圈和AI圈里迅速传开。那个曾经让无数投资人吃了闭门羹的DeepSeek，被曝正在启动成立以来的首次外部股权融资。

估值不低于100亿美元，计划募集至少3亿美元。对于一家长期由母公司幻方量化输血、多次拒绝外部资本的公司来说，这个转变让很多人感到意外。

几乎在同一时间，另一条技术圈的消息开始流传。 DeepSeek的下一代旗舰模型V4，已经完成了底层代码的重写，从英伟达的CUDA框架，全面迁移到了华为自研的CANN框架上。这款模型将完全运行在华为最新发布的昇腾950PR芯片上。

过去三年，DeepSeek靠母公司幻方量化的资金，搭建了名为“萤火二号”的算力集群，用大约一万张英伟达A100显卡训练模型。 2025年初，其开源的DeepSeek-R1模型在推理能力上对标OpenAI，让硅谷感到压力。

但问题也随之而来。美国对华高端AI芯片的出口管制一轮接一轮收紧。先是A100和H100被禁，后来连专门为中国市场打造的“降级版”H20，也需要出口许可。这些芯片从“生产资料”变成了“消耗品”，而且补货的通道越来越窄。

一位接近DeepSeek的投资人透露，公司多位核心研究员近期被小米、字节跳动等科技公司以高薪挖角。新一代大模型的训练成本呈指数级增长，单纯依靠母公司输血的模式，在激烈的全球竞赛中开始显得吃力。

融资的3亿美元，对于一家估值百亿美元的公司来说不算多。圈内一种分析认为，这笔钱的一个重要用途，是为公司员工的期权定价。没有经过外部融资的真实交易，期权只是一个内部记账符号。通过融资锚定一个市场价格，才能把期权变成真金白银的激励，留住最顶尖的那批研究员。

更实际的开销，在于技术栈的迁移。 把整个模型的底层从CUDA搬到CANN，不是改几行代码那么简单。 它意味着算子要重写，推理框架要重构，集群通信要重新优化。这些工程量巨大，需要大量高水平的系统工程师，而且没有现成的方案可以抄，全得自己摸索。

华为在2026年3月正式发布了昇腾950PR芯片和搭载它的Atlas 350加速卡。官方数据显示，其单卡算力达到英伟达H20的2.87倍，是国内首款支持FP4低精度计算的商用推理产品。多模态生成的效率提升了60%。

纸面性能在追赶，但真正的挑战在软件生态。 英伟达的CUDA生态积累了近二十年，全球有超过600万开发者。大学里教AI编程，默认环境就是CUDA。一个工程师从CUDA转到华为的CANN，痛苦是实打实的。

早期的CANN版本匹配要求极高，驱动、固件、框架、算子包，任何一个环节对不上，就可能出现难以排查的隐性错误。有工程师在技术社区里记录过，从PyTorch模型转成昇腾推理模型的过程，是bug最密集的环节，经常一个算子不支持，整个流水线就卡住了。

转机发生在2026年。华为通过昇腾开源生态开发者计划，发布了超过200项算子任务，并面向高校选拔了2000多名开发者进行培养。更关键的是，最新的CANN框架宣称已实现超过95%的CUDA代码兼容，并提供了“一键迁移”工具。

第三方评测显示，经过深度优化后，DeepSeek V4在昇腾950PR上的推理速度，较初期版本提升了35倍。代码重构的时间，从“按月计算”缩短到了“按小时计算”。

这给了市场明确的信号。在DeepSeek宣布V4将首发于昇腾平台后，阿里巴巴、字节跳动和腾讯等国内科技巨头，已经提前向华为下达了新一代AI芯片的订单，规模达到数十万颗。

华为自己不造服务器，它构建了一个由合作伙伴组成的产业链。从最上游的芯片封装基板，到高速连接器，再到服务器整机、光模块和液冷系统。

做昇腾芯片封装基板的是深南电路和兴森科技。高速背板连接器来自华丰科技。服务器整机由高新发展控股的华鲲振宇、拓维信息、神州数码这些公司生产，工业富联负责代工。应对高功耗的液冷系统，则由高澜股份、川润股份提供方案。

一条从硬件到软件，从制造到应用的国产算力产业链，正在被需求拉动起来。 2026年4月，全球最大的API聚合平台OpenRouter数据显示，其周度累计Token消耗量较一年前提升了约7到8倍，其中国产大模型是主要的驱动力。

Token调用量的井喷，带来了算力需求的极大爆发。机构预测，2026年国产算力芯片的出货量至少能实现翻倍增长。推理环节对算力综合性能的要求相对训练端更低，国产芯片通过与互联网厂商的深度合作，针对特定需求进行定制优化，替代的节奏比训练端更快。

英伟达首席执行官黄仁勋在近期的一次访谈中提到了这种变化。 他表示，如果中国的大模型能够在华为的硬件上完成首发与深度优化，并向全球普及，将推动中国技术成为国际标准。

对于做集群运维的工程师来说，现在的工作变成了两条腿走路。一边要维护现有的、基于英伟达的存量设备，另一边要开始学习CANN的新框架。很多公司的招聘启事里，已经加上了这样一条：“有昇腾开发经验者优先”。

华为常务董事杨超斌在4月19日的一次会议上说，今年要通过开源生态计划发布两百多项算子任务。这些任务，最终会变成一行行代码，跑在昇腾芯片上，支撑着像DeepSeek V4这样的模型去理解问题，生成回答。

一家公司的融资，和另一家公司的芯片，就这样被拧在了同一条链子上。