来源:市场资讯

(来源:财富FORTUNE)

4月的最后一周,梁文锋做了一件简单而精准的事。

天眼查信息显示,4月27日,DeepSeek注册资本由1000万元增至1500万元,增资幅度50%。梁文锋的直接持股从1%跃升至34%,宁波程恩(合伙企业)持股则从99%降至66%,这位低调的创始人由此可支配公司约84%的股份。看似一次内部股权结构的微调,微妙之处在于时机,因其恰好发生在一场引爆中国AI产业链的旗舰发布之后。

三天前,DeepSeek-V4带着1.6万亿参数的开源模型登场,再次改写了游戏规则。而梁文锋在这个时间点强化控制权,传递了一个明确的信号——“孤勇者”的时代或许已经结束,属于梁文锋的时代则刚刚开始。

图片来源:视觉中国
打开网易新闻 查看精彩图片
图片来源:视觉中国

中国大模型的“DeepSeek时刻”

4月24日,DeepSeek-V4预览版正式上线并同步开源。

这是梁文锋迄今交给世界的最硬核的答案。V4包含两个版本:V4-Pro总参数达1.6万亿(激活490亿)、V4-Flash总参数2840亿(激活130亿),双版本均原生支持百万token超长上下文。在性能维度上,24项基准测试的评估显示,V4-Pro在其中3项中超越了所有参与比较的大语言模型;V4在MMMU多模态基准测试中较前代提升了21.4分,复杂场景理解能力显著增强。

更深远的变化藏在效率里。

相比上一代V3.2,V4的单token推理算力需求下降了73%,KV缓存被压缩到原来的十分之一。DeepSeek自己在论文中也坦率承认——V4-Pro-Max的表现“小幅超越当前的领先开源模型,并高于GPT-5.2和Gemini-3.0-Pro,但仍然落后于GPT-5.4和Gemini-3.1-Pro,差距大概在三到六个月”。这句话传递了两个关键信息:中国大模型正以前所未有的速度逼近第一梯队,而与此同时,这次发布并未改变中美顶级大模型之间的基本格局——追赶仍在继续。

正是这种谦逊里的“实诚”,让整个行业的价值在这场效应中重新分配。在V4开源模型的冲击下,市场给出了极其“教科书式”的反馈。

最显著的效应之一,是当日大模型板块的两极分化。智谱收盘跌9%,盘中最大跌幅超12%;MiniMax收跌9.44%,盘中一度跳水超12%。“Token第一股”迅策收盘也跌近16%,成为当日港股科技板块跌幅最大的标的之一。与此同时,国产芯片板块全线爆发:华虹半导体港股盘中涨约17%,收涨15%;中芯国际收涨超10%。

摩根大通将“大模型回调”与“恒生指数当日上涨0.2%”的事实并列在一张结论表中,认为这并非系统性风险,而是一场产业链内部价值重分配在资本市场的集中定价,并称DeepSeek-V4的发布是“行业利好,而非零和冲击”。

为何如此乐观?在摩根大通的分析框架里,V4事实上强化了中国LLM行业的三个关键支柱——算力供应释放、定价纪律和结构性成本曲线压缩。DeepSeek一直在其分析师“4-5月事件日历中最大的单一负面竞争催化剂”中占据重要位置,随着V4落地并被消化,这一不确定性正式出清了。

招商证券指出,1M token上下文的V4全系标配“开源SOTA兑现,但并未全面超越海内外旗舰竞品”,意味着竞争加剧但未到格局重塑的地步。瑞银报告也仍然看好智谱在编码领域的持续领先地位和MiniMax在V4未着重强调的多模态领域的差异化定位。

但不得不承认的另一面是,DeepSeek的开源策略将大大挤压其它大模型公司在B端市场的议价空间,毕竟企业客户有了更多开源模型的选择权,大模型公司的“纯技术稀缺性溢价”也随之下降。而且,这些公司还面临一个共同的定价压力:DeepSeek预告下半年昇腾950出货后V4-Pro价格还会大幅下调,这会进一步压缩模型的定价空间。

“国芯+国模”:国产AI的双向奔赴

DeepSeek-V4的真正叙事,从来不仅仅在模型本身。

很长一段时间里,中国顶级大模型的训练与推理几乎完全依赖英伟达的GPU和CUDA生态,国产芯片扮演的角色不过是“备选项”。但这一次,行业惯例发生了根本逆转。DeepSeek-V4并未向英伟达和AMD提供早期访问权限,反而优先开放给华为昇腾,从而从设计阶段就开始了芯模协同优化,获得了数周时间进行底层适配,包括指令级、算子库和推理框架。

在深度优化后,V4在华为昇腾芯片上的推理速度较初期版本提升了整整35倍,华为CANN框架与英伟达CUDA的代码兼容性已逼近95%。而且这种“Day 0”级别的适配已从华为昇腾蔓延至更广阔的本土芯片阵容,包括寒武纪、沐曦、海光、摩尔线程(FP8)、昆仑芯、平头哥真武、天数等主流国产AI芯片都迅速实现了全量适配与推理部署。

链式反应由此放射。

数月之前,据The Information援引知情人士消息,阿里、字节和腾讯已累计订购数十万颗华为AI芯片。这不是一次试验,而是一项“协调一致的努力,旨在建立一个纯国产的AI技术栈”。2025年全年,国产AI芯片在国内市场的份额已跃升至41%,其中华为昇腾占据近半。英伟达曾在这个市场上占据90%以上的绝对垄断地位,如今,不可动摇的格局开始松动。

中银国际指出这一链条的深层意义:“国产大模型已基本跑通全栈国产化,理论上已形成从底层硬件、基础软件、平台服务到上层应用、安全体系的完整技术链条,国产算力板块迎来质变临界点”。华泰证券研报也表示,市场容易被“降本”二字迷惑,但真正的边际变化,在于长上下文成本的断崖式下降将让复杂Agent、多文档分析、长周期任务等场景变得可用——推理调用量与存储访问频次将随之扩张。

显然,无论外界如何评价,梁文锋截至目前仍然保有不被任何人设计好的时间线。他自掏腰包投入DeepSeek的资金据传累计超过200亿元。他曾被媒体贴上所有这些标签——“不融资”、“不接受外部资本”、“不被任何人的商业化时间表绑架”。他运营着一家近乎“研究机构”而非商业公司的心态。

只是即使是这位“AI隐士”,也不得不在2026年向现实迈出了一步。近期有消息称DeepSeek正启动成立以来的首次外部股权融资,以超100亿美元的估值,计划募集不少于3亿美元资金。在V4面世之际,梁文锋在融资启动和内部增持方面同步推进,无疑是为未来的IPO铺路,从而全面激发人才留存与发展。而他在融资真正落地前抢先出手加码控制权,传递了清晰的信号:资本可以进来,但控制权不在谈判桌上。

值得注意的是,DeepSeek-V4的发布公告引用了《荀子》:“不诱于誉,不恐于诽,率道而行,端然正己。”这些话由DeepSeek自己写上,指向某种远超股价涨跌的东西,其中最关键的是“国芯+国模”的适配进程。

4月27日,中国信通院宣布,正式启动DeepSeek V4国产化适配测试,推动模型与国产软硬件深度协同、加速产业落地。本次测试依托工信部重点实验室与AISHPerf基准体系开展,覆盖芯片、服务器、一体机、集群、开发工具链、智算平台等全栈AI软硬件产品,聚焦DeepSeek V4全系列模型的推理、微调流程,并形成立体化评测体系。

DeepSeek的股权变更可被视为其正式融入主流商业竞争的号角,梁文锋也将不再是在中国大模型发展路上那个“孤勇者”。而这条路,是用国产算力铺就的。(财富中文网)

申报《财富》榜单