来源:财经风象
2026年4月18日,一则消息震动了整个AI圈:DeepSeek被曝计划以不低于100亿美元的估值,筹集至少3亿美元的首轮外部融资。投资圈瞬间沸腾,梁文锋的电话被打爆,甚至有人已经开始订机票,只为见一见这位此前“神龙见首不见尾”的创始人。
这件事之所以引发震动,不在于金额,而在于姿态——梁文锋,这位曾多次拒绝腾讯、阿里等巨头投资、从公司成立第一天就划下“不接受外部融资”红线的“技术长期主义者”,终于开始寻求外部资金的支持。
在一个所有AI创业公司都在拼命融资、疯狂烧钱的行业里,DeepSeek曾是唯一的“异类”。它不融资、不站队、不追逐商业化时间表,依靠幻方量化的“量化养AI”模式自我供血,在“百模大战”中活出了一条特立独行的路。如今这个“异类”开始主动拥抱资本,信号意义非同小可。
要理解这件事,不能只看“缺钱”两个字——DeepSeek背后有幻方量化这颗“摇钱树”,2025年幻方全年收益率高达56.6%,营收超50亿人民币,仅梁文锋个人当年收入就超过7亿美元。短期运营资金显然不是核心问题。
真正的问题是:什么让梁文锋“妥协”了?
01
为什么融?
DeepSeek这次融资,不是“缺钱”,而是“不够烧了”。更准确地说,是四重结构性压力同时爆发。
第一重:算力军备竞赛——低成本神话的边界
DeepSeek-R1以560万美元训练成本震惊全球的故事,至今仍是行业津津乐道的“神话”。但“神话”的另一面,是这条路的边际成本正在急剧抬升。
据悉,DeepSeek下一代旗舰模型V4的单轮训练成本已超过5亿美元,是R1的近百倍。更关键的是,V4全面迁移至华为昇腾芯片,从英伟达CUDA生态重写底层代码,工程量之浩大远超外界想象。这也是V4多次延期发布的核心原因,不是算法遇阻,而是硬件迁移带来的工程挑战远超预期。
当模型参数从千亿级迈向万亿级,算力基础设施的投入呈指数级增长。幻方的钱袋子再厚,也扛不住这种量级的持续烧钱。一位AI创业者直言不讳:“梁文锋不可能一直拿幻方的钱无限制补贴DeepSeek,独立分拆出来按市场化估值融资,是更合理的商业选择。”
第二重:人才保卫战——被精准“抄底”的核心团队
这是最让梁文锋感到刺痛的一击。过去一年,DeepSeek至少流失了5名核心研发成员,覆盖基座模型、推理、OCR、多模态四条核心技术线:V3核心贡献者罗福莉被雷军千万年薪挖至小米;R1核心研究员郭达雅以传闻近亿元总包入职字节跳动Seed团队;第一代大语言模型核心作者王炳宣去了腾讯;多模态核心阮翀加入元戎启行……
竞争对手开出的薪酬包可以翻倍甚至更多。而DeepSeek由于长期没有融资,员工手里的期权完全依赖内部估值,缺乏市场锚点,在顶级人才眼中缺乏足够的流通性。与此同时,智谱、MiniMax已相继在港股上市,市值均超过3000亿港元,人家手里的期权有了明确的财富锚点。
这笔融资,本质上是通过市场化方式给公司定价,为期权体系引入公允价值——告诉核心团队:我不会让相信长期价值的人吃亏。这是一场迟到的组织修复。
第三重:商业化突围——理想主义遭遇现实检验
DeepSeek的开源策略和低成本模型确实积累了庞大的开发者生态,但商业化路径始终不清晰。国内C端AI助手到今天没一家把商业化真正跑通——即便是被公认为C端表现最好的MiniMax,2025年全年收入也不过7903万美元。
更现实的信号是:2026年3月底,DeepSeek经历了长达11小时的宕机,一度登上热搜。模型能力再强,只要面向海量用户和开发者提供服务,就必须接受商业化检验。服务器要稳,最直接的方法就是花钱,买更多服务器、建设更强的云服务与运维体系。当开源生态的用户规模与基础设施投入之间的裂口越拉越大,“零商业化压力”的叙事正在瓦解。
第四重:安全逻辑——芯片供应链的隐性风险
2025年全球AI一级市场融资中,79%流向美国企业。英伟达的CUDA生态是全球大模型训练的“基础设施”,一旦出现供应链变数,整个公司的研发、训练、推理都可能受到严重影响。
DeepSeek V4选择全面适配华为昇腾芯片,不仅是技术路线选择,更是地缘政治考量下的安全布局。融资筹集的资金,有相当一部分将用于支撑这场底层硬件的大规模迁移,包括自建算力设施——据报道,DeepSeek已在内蒙古乌兰察布、鄂尔多斯投入数亿建设自有算力集群。
这不是选择题,而是生存题。
02
为什么是现在?
DeepSeek选择在这个时间点启动融资,并非一时冲动。
2026年第一季度,全球风险投资部署了创纪录的3000亿美元,其中前所未有的80%(即2420亿美元)流向了人工智能公司。仅OpenAI一家就完成了1220亿美元融资,估值高达8520亿美元;Anthropic完成约300亿美元融资,估值达3800亿美元。
但这并非普惠的春天。同一时间,国内AI领域种子轮融资额同比下滑11%,超300家中小AI公司因现金流断裂停止运营。资本从“普惠撒钱”转向“极度集中”,不是所有人都拿到了钱,而是极少数公司拿到了更多的钱。
更残酷的变化是,投资逻辑正在重构。投资决策的核心问题从“有什么技术突破”变成了更冷的三个:有没有真实订单?能不能形成持续收入?是否具备规模化交付能力?资金正在向头部项目加速集中,中腰部公司的生存空间被急剧压缩。
国内同行也在疯狂抢跑。智谱和MiniMax已成功赴港上市,“大模型六小虎”中,月之暗面在完成5亿美元C轮融资后,新一轮超7亿美元融资即将交割;阶跃星辰1月完成超50亿元人民币B+轮融资,刷新了过去12个月中国大模型赛道的单笔融资纪录。
对DeepSeek而言,如果现在不融资,意味着在资本、算力、人才三个维度上持续被对手拉开差距。这是一场不进则退的博弈,不是梁文锋想清楚了才出发,而是行业节奏已经不允许他继续等待。
03
融什么?为什么值百亿估值?
100亿美元的估值,横向对比似乎偏低,但放在行业坐标系里看,实则暗藏玄机。
DeepSeek 100亿美元的估值仅为智谱AI(约500亿)的五分之一、MiniMax(约344亿)的三分之一,甚至低于月之暗面(约180亿)。与OpenAI 8520亿美元、Anthropic 3800亿美元的体量相比,更是差了不止一个量级。
但这一定价已充分反映了DeepSeek商业化迟缓的折价因素。资本市场仍愿意买单,核心逻辑在于三重稀缺性的叠加。
技术稀缺性:国产算力替代的关键赌注
V4模型放弃英伟达CUDA框架,全面适配华为昇腾芯片,若成功,将成为全球首个不依赖英伟达的前沿AI模型。这不是在赌一个模型,而是在赌一个产业方向的成立,资本视此为中国AI生态自主可控的里程碑。
一旦验证成功,DeepSeek将获得显著的算力成本优势。据其披露的数据,R1的推理成本仅为GPT-4的七十分之一。如果这种成本优势能在V4上延续,DeepSeek将成为价格敏感的中小企业和开发者市场的强力竞争者。
市场稀缺性:全球南方的先发卡位
据微软产品数据,DeepSeek在非洲和受美国科技制裁地区的渗透力惊人:在白俄罗斯市占率高达56%,古巴占49%,俄罗斯占43%。全球南方市场正在成为中美AI竞争的新战场,而DeepSeek凭借开源策略和低成本优势,已在这些地区建立了先发优势。
这是一张被低估的牌,当欧美巨头忙于争夺发达市场时,DeepSeek已经在第三世界国家生根发芽。
人才期权套利空间:低位进场的吸引力
以100亿美元估值引入外部资本,可为团队期权提供公允价值,抵御大厂三到五倍薪资的挖人攻势。这不仅是一笔融资,更是一场人才保卫战的组织修复行动,只有建立与头部科技公司对等的长期激励机制,才能守住技术护城河。
04
DeepSeek融资意味着什么?
如果只看到“缺钱”,就把这件事彻底看小了。DeepSeek这次融资,表面上是引入资金,实质上是完成一次从“异类”到“玩家”的范式转换。
第一层:从“研究机构”到“商业公司”
梁文锋此前给DeepSeek的定位,更像一个纯粹的研究机构——追AGI、做开源、不被任何人的商业化时间表绑架。这种姿态在2025年初R1发布时达到巅峰,“十分之一的钱做出同级模型”的故事让行业重新思考资源效率的意义。
但故事的漏洞在于,它需要不断被续写。当人才被高薪挖走、模型迭代被硬件迁移延迟、服务稳定性因基础设施不足而暴露短板,“理想主义”的叙事需要一个新的支撑框架。融资,意味着DeepSeek正式承认自己是一家需要接受市场检验的商业公司。
第二层:从“单点突破”到“生态作战”
大模型之争已从单纯的模型能力比拼,演进为技术路线、商业模式与生态构建的立体战局。字节有豆包、有即梦、有Seedance视频生成模型;阿里和腾讯把世界模型推到台前;智谱、MiniMax已登陆港股并在二级市场上完成了新一轮价值重估。
而DeepSeek在模型能力之外,入口、多模态、Agent、编程生态等方面尚未形成体系化能力。这笔融资将帮助DeepSeek补齐生态短板,从“靠一个模型打天下”转向“靠一个体系打仗”。
第三层:从“跟随者”到“规则制定者”
当OpenAI以8520亿美元估值融资、Anthropic以3800亿美元估值扩张时,DeepSeek以百亿美元估值加入战局,象征中国大模型正式告别“跟跑模仿”,进入与全球巨头同台竞争的新阶段。
这不是一个量级的玩家同台竞技——但意义在于,中国终于有了一家敢于站上这张牌桌的公司。
05
走向深水区
梁文锋的转身,绝不仅是他一个人的故事,而是整个中国大模型行业进入深水区的一个关键切片。
2025年初,DeepSeek-R1的横空出世带来了全行业技术层面的转折;而如今智谱、MiniMax的上市,DeepSeek的首轮融资,则标志着商业层面的新阶段,AGI的梦想叙事开始让位于更清晰的财务逻辑和资本回报要求。
如果说2024年是“拼参数”的年份,2026年就是“拼生存”的年份。
这场游戏规则已经彻底改变:资本不再为“可能性”买单,只为“确定性”下注;行业不再崇拜“参数规模”,只认“算力投入产出比”;市场不再追捧“炫技式Demo”,只看“能不能赚钱、能不能持续赚钱”。
国内大模型公司正在集体从卖算力、做项目,转向卖Token、做订阅。Anthropic的Claude Code年化收入已冲至25亿美元,Cursor以500亿美元估值融资,这两个海外样本告诉所有国内玩家:商业模式是能跑通的,关键看谁先到达终点。
对DeepSeek而言,融资只是第一步。真正的考验在后面:
V4能否在华为昇腾上跑出有竞争力的性能? 这是技术大考,直接关系到国产替代叙事能否自洽。
期权激励能否有效遏制人才流失?这是组织大考,决定了技术团队能否保持稳定。
商业化体系能否从开源生态中长出可持续的现金流?这是商业大考,关系公司能否独立造血。
在全球南方市场的先发优势能否转化为真正的收入和利润?这是市场大考,关系国际化的成败。
百亿估值,不是终点,而是一场更大博弈的起点。
梁文锋“想通了”,但这场仗,才刚刚打响。
(弘毅/文,财经风象原创)
热门跟贴