2026年4月18日,一则消息在投资圈和AI圈里迅速传开。 那个曾经让无数投资人吃了闭门羹的DeepSeek,被曝正在启动成立以来的首次外部股权融资。

估值不低于100亿美元,计划募集至少3亿美元。 对于一家长期由母公司幻方量化输血、多次拒绝外部资本的公司来说,这个转变让很多人感到意外。

几乎在同一时间,另一条技术圈的消息开始流传。 DeepSeek的下一代旗舰模型V4,已经完成了底层代码的重写,从英伟达的CUDA框架,全面迁移到了华为自研的CANN框架上。 这款模型将完全运行在华为最新发布的昇腾950PR芯片上。

打开网易新闻 查看精彩图片

过去三年,DeepSeek靠母公司幻方量化的资金,搭建了名为“萤火二号”的算力集群,用大约一万张英伟达A100显卡训练模型。 2025年初,其开源的DeepSeek-R1模型在推理能力上对标OpenAI,让硅谷感到压力。

但问题也随之而来。 美国对华高端AI芯片的出口管制一轮接一轮收紧。 先是A100和H100被禁,后来连专门为中国市场打造的“降级版”H20,也需要出口许可。 这些芯片从“生产资料”变成了“消耗品”,而且补货的通道越来越窄。

一位接近DeepSeek的投资人透露,公司多位核心研究员近期被小米、字节跳动等科技公司以高薪挖角。 新一代大模型的训练成本呈指数级增长,单纯依靠母公司输血的模式,在激烈的全球竞赛中开始显得吃力。

融资的3亿美元,对于一家估值百亿美元的公司来说不算多。 圈内一种分析认为,这笔钱的一个重要用途,是为公司员工的期权定价。 没有经过外部融资的真实交易,期权只是一个内部记账符号。 通过融资锚定一个市场价格,才能把期权变成真金白银的激励,留住最顶尖的那批研究员。

更实际的开销,在于技术栈的迁移。 把整个模型的底层从CUDA搬到CANN,不是改几行代码那么简单。 它意味着算子要重写,推理框架要重构,集群通信要重新优化。 这些工程量巨大,需要大量高水平的系统工程师,而且没有现成的方案可以抄,全得自己摸索。

华为在2026年3月正式发布了昇腾950PR芯片和搭载它的Atlas 350加速卡。 官方数据显示,其单卡算力达到英伟达H20的2.87倍,是国内首款支持FP4低精度计算的商用推理产品。 多模态生成的效率提升了60%。

纸面性能在追赶,但真正的挑战在软件生态。 英伟达的CUDA生态积累了近二十年,全球有超过600万开发者。 大学里教AI编程,默认环境就是CUDA。 一个工程师从CUDA转到华为的CANN,痛苦是实打实的。

早期的CANN版本匹配要求极高,驱动、固件、框架、算子包,任何一个环节对不上,就可能出现难以排查的隐性错误。 有工程师在技术社区里记录过,从PyTorch模型转成昇腾推理模型的过程,是bug最密集的环节,经常一个算子不支持,整个流水线就卡住了。

转机发生在2026年。 华为通过昇腾开源生态开发者计划,发布了超过200项算子任务,并面向高校选拔了2000多名开发者进行培养。 更关键的是,最新的CANN框架宣称已实现超过95%的CUDA代码兼容,并提供了“一键迁移”工具。

第三方评测显示,经过深度优化后,DeepSeek V4在昇腾950PR上的推理速度,较初期版本提升了35倍。 代码重构的时间,从“按月计算”缩短到了“按小时计算”。

这给了市场明确的信号。 在DeepSeek宣布V4将首发于昇腾平台后,阿里巴巴、字节跳动和腾讯等国内科技巨头,已经提前向华为下达了新一代AI芯片的订单,规模达到数十万颗。

华为自己不造服务器,它构建了一个由合作伙伴组成的产业链。 从最上游的芯片封装基板,到高速连接器,再到服务器整机、光模块和液冷系统。

做昇腾芯片封装基板的是深南电路和兴森科技。 高速背板连接器来自华丰科技。 服务器整机由高新发展控股的华鲲振宇、拓维信息、神州数码这些公司生产,工业富联负责代工。 应对高功耗的液冷系统,则由高澜股份、川润股份提供方案。

一条从硬件到软件,从制造到应用的国产算力产业链,正在被需求拉动起来。 2026年4月,全球最大的API聚合平台OpenRouter数据显示,其周度累计Token消耗量较一年前提升了约7到8倍,其中国产大模型是主要的驱动力。

Token调用量的井喷,带来了算力需求的极大爆发。 机构预测,2026年国产算力芯片的出货量至少能实现翻倍增长。 推理环节对算力综合性能的要求相对训练端更低,国产芯片通过与互联网厂商的深度合作,针对特定需求进行定制优化,替代的节奏比训练端更快。

英伟达首席执行官黄仁勋在近期的一次访谈中提到了这种变化。 他表示,如果中国的大模型能够在华为的硬件上完成首发与深度优化,并向全球普及,将推动中国技术成为国际标准。

对于做集群运维的工程师来说,现在的工作变成了两条腿走路。 一边要维护现有的、基于英伟达的存量设备,另一边要开始学习CANN的新框架。 很多公司的招聘启事里,已经加上了这样一条:“有昇腾开发经验者优先”。

华为常务董事杨超斌在4月19日的一次会议上说,今年要通过开源生态计划发布两百多项算子任务。 这些任务,最终会变成一行行代码,跑在昇腾芯片上,支撑着像DeepSeek V4这样的模型去理解问题,生成回答。

一家公司的融资,和另一家公司的芯片,就这样被拧在了同一条链子上。