打开网易新闻 查看精彩图片

投资人订好机票,务必见到梁文锋

投资人,又因为梁文锋忙起来了。

据外媒The Information报道,DeepSeek正首次寻求外部融资,目标估值超过100亿美元(约合人民币681.8亿元)。

据多位知情人士透露,DeepSeek已开始与投资人接触,计划融资至少3亿美元(约合人民币20.5亿元),以补充资金储备,应对AI大模型研发日益高昂的成本竞争。

如果本轮融资落地,DeepSeek将首次引入外部资本,也意味着其长期坚持的“自我供血”模式出现转变。

这个周末,投资人已经订好机票,务必要在这一次,见到梁文锋!

梁文锋,终于“松口”了

2025年初爆火之后,梁文锋选择低调行事,并拒绝了投资人们的橄榄枝。而这一次,他终于松口了?

据报道,这一转向背后,一方面是资金压力加大,另一方面或许也与其近期的人才流失有关。

自2025年初,DeepSeek-R1模型爆红以来,DeepSeek尚未推出新一代模型,同时多位核心研究人员相继离开。其中,DeepSeek V3模型重要贡献者罗福莉已加入小米负责AI业务,另一位核心研究员郭达雅则跳槽至字节跳动,薪资大幅提升。

引入外部资金后,DeepSeek有望加大算力投入,继续推进前沿模型研发,同时通过更具竞争力的薪酬体系稳定核心团队。

不过,这笔融资也可能面临一定不确定性。知情人士称,部分美国投资机构在是否参与投资上态度相对谨慎。此前,美国国会曾对DeepSeek提出过相关质疑,但目前该公司并未被纳入任何美国贸易限制名单。

产品层面,DeepSeek原计划于今年2月发布下一代旗舰模型DeepSeek V4,但因工程问题多次推迟。

报道称,其团队正在投入大量精力,使模型能够直接适配华为昇腾芯片运行,这一调整也拖慢了进度——此前其模型主要基于英伟达芯片。

行业环境的变化同样构成压力来源。当前AI模型迭代速度持续加快,中美科技巨头凭借资金优势不断加码,对初创公司形成挤压,这也被认为是DeepSeek转向融资的重要背景。

值得一提的是,DeepSeek此前推出的R1模型曾以更低成本实现接近海外顶级模型的性能,引发市场广泛关注,并一度引起资本市场对高端AI芯片长期需求的重新审视。该模型主要基于A100、H800等上一代芯片训练完成,这些芯片原本用于其母公司幻方量化的数据训练。

另据The Information此前报道,DeepSeek正在使用英伟达最新一代Blackwell芯片训练下一代模型,不过该类芯片目前受到出口管制影响,获取存在一定限制。

投资圈,“追求”梁文锋

时间回到去年年初,DeepSeek突然爆火,让梁文锋成为资本狂热的对象。

DeepSeek的横空出世,让投资独角兽项目的难度,第一次如此直观的摆到台面上。

2025年春节收假后,创投机构的第一堂研究课程都与这家爆火的企业有关。2月11日,开年复工的第一次全员周会上,某早期投资科技组对DeepSeek进行了深入的谈论,DeepSeek为什么这么火?真正的技术创新是什么?为什么是DeepSeek?“谁认识梁文锋?找一下关系,见一面。”风头无量的梁文锋,成为投资机构追寻的“灯塔人物”,“实在不行,加个微信,一定要联系上。”

五源资本创始合伙人刘芹直言,一年多前曾找过三拨人想约见梁文锋,却遭到拒绝,对方的理由大致是觉得他们缺乏创新精神,道不同不相为谋。

元禾璞华管理合伙人陈大同稍打趣称,因投资领域涉及芯片,和DeepSeek有相关业务交集,才得以和其团队有过交流,算是获得了一点接触机会。

就连与DeepSeek北京办公室同楼办公的百度风投,也没能成功投资,其CEO高雪后续还专门澄清,是因幻方量化的大模型业务未拆分独立融资,才和其他VC一样错失投资机会。

“给你们投了这么多钱,为什么没有给我们投出梁文锋?”自从年初DeepSeek火了之后,各地开展了一轮又一轮自省会,拿着政府引导基金的VC们,少不得被LP们问上一句。“好在梁文锋目前没有开放融资,所有机构都没投进去,要不然真的很难向上交代。”某华南机构合伙人告诉融中记者。

直到今天,整个VC圈还在反思为何会错过DeepSeek。“我在一年多前找了三拨人,想通过他们找梁文锋(DeepSeek创始人)见面,但都被拒绝了。

如今机会来了,没人会甘愿错过。

大模型,进入新阶段

过去,梁文锋坚持不融资,一方面资金来自幻方,不必急于通过融资输血。

幻方作为国内量化私募巨头,管理规模峰值曾达千亿级别。即便在市场波动期,其收取的管理费和业绩提成也极为可观。

梁文锋曾明确表示,DeepSeek的研究经费来源于幻方的研发预算。对他而言,与其去求投资人,不如用自己赚的钱搞科研,这种“富养”模式让DeepSeek避开了早期融资的繁琐。

另一方面,也能避免稀释股权,影响企业发展方向。

梁文锋是一个典型的“技术极客”,他对公司的掌控欲和服务于技术理想的决心非常强。

融资往往伴随着业绩对赌、商业化指标和退出压力。梁文锋担心外部投资者会干预公司的决策,特别是强迫DeepSeek过早进行“商业化”。

他曾表示:“我们不做应用,我们只做研究和探索。”他希望把所有的算力和人才都砸向通往AGI(通用人工智能)的路径,而不是为了短期盈利去开发各种碎片化的商业应用。

如今,大模型的竞争已经到了新的阶段。

据斯坦福大学2026年度AI指数报告,截至今年3月,美国顶级模型与中国最强竞品之间的性能差距仅剩2.7个百分点。差距越小,每一步追赶的边际成本越高。

如果说此前的“不融资”是为了极致的独立性,那么现在的“开启融资”则是为了极致的规模化。

虽然DeepSeek以“省钱、高效”著称(如R1的训练成本极低),但随着模型向V4、V5以及更高级别的AGI迈进,算力需求呈指数级增长。

2026年全球算力价格由于需求暴增而上涨。即便幻方量化赚钱能力极强,但是,在面对单次模型训练动辄数亿美金、且需要储备数万片国产顶级芯片的背景下,单靠自有资金已经显得捉襟见肘。

此次融资目标估值超100亿美元,计划筹资至少3亿美元。这笔钱不是为了生存,而是为了在算力竞赛中“饱和式投入”,确保不掉队。

除了资金层面的原因,战略转型或许也是原因之一。

从最新的动态看,DeepSeek正在承担更深层的战略角色。

有消息称DeepSeek V4将不再优先适配英伟达,而是深度适配华为等国产芯片。这种转向需要极大的工程量和研发成本。

随着DeepSeek影响力的出圈,它已不再只是幻方的附属科研部门,而是一个具备社会属性的基础设施。通过融资引入外部股东,有助于公司治理结构的规范化,让DeepSeek成为一个更具开放性的生态平台,而非梁文锋个人的“私人实验室”。

更重要的是,人才的争夺。

AI行业的竞争归根结底是人才的竞争。

如果公司不融资、不上市,员工手中的期权就只是“废纸”,很难在人才市场上与OpenAI或国内大厂抗衡。通过融资确立100亿+美金的估值,能让员工的期权瞬间变现预期清晰化,从而吸引全球最顶尖的华人AI科学家加入。

在DeepSeek R1震撼全球后的窗口期融资,是估值最高、筹码最贵的时刻。梁文锋此时出让少量股份就能换回数亿美金,性价比极高。