这个周末,投资圈被一条消息炸开了锅。
据外媒The Information引述四位知情人士报道,国内AI明星公司DeepSeek正式启动成立以来的首次外部融资——目标估值不低于100亿美元,计划募集至少3亿美元资金。
对此,《上海证券报》的记者多方求证,有接近人士表示“很有可能”,多位投资人直言“圈里信息已经炸了”。有消息人士甚至说,已经有投资人订好了机票,务必要在这周末见到梁文锋。
那个曾经把所有投资人挡在门外的DeepSeek,为什么突然要钱了?
1.“不差钱”
在聊这轮融资之前,我们先来理解一个事实——梁文锋是真不差钱。
2023年7月,DeepSeek正式成立,由量化私募巨头幻方量化孵化。梁文锋从第一天就给这家公司划了一条清晰的红线:不接受外部融资,不稀释股权,不被任何人的商业化时间表绑架。
他确实有这个底气。梁文锋是幻方量化的创始人,而幻方是国内顶级的量化对冲基金,管理规模超700亿元,2025年平均收益率高达56.6%。
2025年初DeepSeek爆火之后,投资人们曾密集寻找见梁文锋的机会。五源资本创始合伙人刘芹找了三拨人想约见,被拒绝;与DeepSeek北京办公室同楼办公的百度风投,也没能投进去。
梁文锋的态度异常鲜明,他曾对联想创投高级合伙人宋春雨明确表示:“对商业化不感兴趣,只想做技术研究。”
2025年3月,腾讯和阿里巴巴等科技巨头递出橄榄枝,他同样婉拒,担心“外部投资者会干预公司决策”。
然而,如今风向变了。
2.人才危机
最先松动的,是人。
过去半年,DeepSeek的核心团队经历了一场不小的动荡。
V3架构的关键开发者罗福莉,在2025年底转投小米,接手了MiMo大模型团队;差不多同一时期,第一代大语言模型核心作者王炳宣去了腾讯;多模态方向的核心研究员阮翀加入了元戎启行做首席科学家;OCR系列核心作者魏浩然在今年春节前后离开。
最令人关注的是郭达雅。1994年生,中山大学博士,在DeepSeek只待了两年,却全程参与了V3、R1、Coder、Math、Prover等几乎所有标志性模型的研发。他提出的GRPO算法是R1的核心技术底座。
近期,郭达雅被曝以近亿元的薪酬包入职字节跳动Seed团队。抖音集团副总裁李亮虽否认了“年薪近亿”的说法,但也承认,如果业务发展良好,部分技术人员四年后的收益确实可能达到数亿元。
这些人为什么要走?
其实,不是梁文锋给不起工资。据业内消息,DeepSeek的薪资并不低,问题出在期权上。
DeepSeek从未融资,没有市场化的估值锚点,员工手中的期权完全依赖内部估值。在外部机构未以真金白银确认价格之前,这种账面财富在顶级人才眼中缺乏足够的流通性和溢价锚点。
一个VC朋友直言:“DeepSeek的员工期权,就像一个没有行权价的彩票。虽然中奖概率可能很高,但没法换成人民币。”
DeepSeek过去可以靠技术理想、开源声望和梁文锋的个人号召力凝聚一批人。但当竞争对手开出翻倍的薪资和可流通的期权时,“理想”这两个字就变得格外沉重。
这称不上道德层面的背叛。毕竟,对于任何一个顶级的AI研究员来说,他们的市场价值已经被大厂和资本的激烈竞争推到了一个不可思议的高度。DeepSeek如果不建立市场化的估值体系和薪酬激励,就永远无法在这个层面与字节、阿里掰手腕。
正是在这个背景下,这次融资最核心的目的之一就是给期权体系引入市场化定价,让员工知道“我手里的期权到底值多少钱”。
3.新的压力
人才只是表面的问题,DeepSeek压力的根源是V4。梁文锋从没公开谈过,但业内人都心知肚明,V4是一场硬仗,而且是换了跑道的硬仗。
DeepSeek已经有15个月没有发布大版本更新了。在这段时间里,字节发布了豆包2.0,阿里和腾讯把世界模型推到了台前,智谱和MiniMax不仅上市还完成了新一轮估值重估。
而DeepSeek的下一代旗舰模型V4一再跳票,原定春节前后发布,推到2月,再推到3月,目前的口径是4月下旬。
V4不是普通迭代,它是一个万亿参数的MoE架构模型,支持原生多模态(文本、图像、视频),上下文窗口扩展到100万token,还首次引入了Engram条件记忆机制。从工程复杂度来看,这已经不是刷benchmark的基础模型,而是一个系统级工程。
更关键的是,V4是DeepSeek第一个专门为国产芯片深度优化的模型。
据路透社报道,V4的核心计算迁移到了华为最新的昇腾芯片上。从英伟达的CUDA生态迁移到华为的CANN架构,整套技术栈都需要重写。有报道称,V4正是因为软件栈磨合不顺而推迟过两次。
英伟达CEO黄仁勋对此直言不讳,DeepSeek基于华为平台的新模型“对美国来说将是一个糟糕的结果”。
言下之意,一旦AI模型被优化为在中国硬件上跑得最好,美国芯片的护城河就不再牢固。
但换跑道的代价是巨大的,万亿参数模型、多模态能力、国产芯片适配,每一项都在烧钱,烧钱量级已经跟过去DeepSeek不是一个级别。
幻方能养一个专心搞研究的DeepSeek,但一个既要换国产芯片、又要支持全球API调用、还要做多模态的DeepSeek,就不一定了。
4.战略卡位
面对这样的一场硬仗,那为什么只融3亿美元?
这个金额,放在今天AI行业,说多不多说少不少。OpenAI今年3月刚以8520亿美元估值融了1220亿美元,Anthropic在2月以3800亿美元估值融了300亿美元。国内同行的估值也早已起飞,智谱和MiniMax的市值一度突破400亿美元,月之暗面的最新估值达到180亿美元。
100亿美元的估值,3亿美元的融资,放在这个坐标里,甚至显得有点“便宜”。
梁文锋不是融不到更多钱。我的判断是,他要的其实不是钱本身,一方面他希望借助融资稳定人才队伍,另一方面顺便买一张“入场券”。
早在去年融资传闻中,就有消息透露中投、全国社保基金主动接洽、表达投资意向。
这个资方结构本身就是一个信号。国有资本入场,意味着DeepSeek有可能获得政府AI项目的“优先供应商”资格。在国内To-G市场,有没有国资背书,有时候直接决定了你能不能进场。
这不是简单的财务投资,而是战略卡位。
5.梁文锋不“装”了
过去三年,梁文锋在“装”一个“完全不需要资本、完全不需要商业化、完全不受任何世俗约束”的技术隐士。
这个形象为他赢得了整个行业的尊敬和媒体的追捧。但也正因如此,当DeepSeek真的面临人才流失、产品迭代压力、生态建设需求时,他反而被自己的形象绑架了。
这一次,梁文锋彻底“不装了”。
幻方的钱是他的子弹,资本的钱是市场的子弹。两种子弹有不同的用途,打不同的仗。当一个AI公司需要的不仅仅是研发经费,还需要市场化的治理结构、薪酬激励、商业化渠道和生态入口时,自我供血的模式就不再适用了。
如果非要我给这件事下一个定义,我会说梁文锋正在从一个“技术极客”变成“商业领袖”。
这是一个所有伟大的科技公司创始人都必须经历的转变。乔布斯有过,扎克伯格有过,马化腾有过,张一鸣也有过。区别只在于,有些人在创业初期就完成了,有些人在公司爆发后才被迫完成。
梁文锋属于后者。
DeepSeek100亿美元的估值只是一个开始。V4模型即将在4月底亮相,如果它在华为昇腾芯片上跑出世界级的性能,它将是全球第一个不依赖英伟达的前沿AI模型。这个意义,远不止100亿美元的估值能够衡量。