为什么DeepSeek突然要融资?人才争夺战:大厂的"精准收割"小团队的困境:每个人都是单点依赖1钱够多:字节、腾讯、小米的现金储备,远超任何创业公司2平台够大:技术落地场景多,人才能看到"影响力"3期权够香:豆包期权四年归属,如果业务爆发,收益可能达数亿元V4延期:人才流失的直接后果1架构突破:V4可能在架构层面有重大创新,不是简单升级模型大小,需要更多时间2市场时机:V3已经足够强,R1又把推理能力打出去了,V4需要一个足够惊艳的发布时机3算力卡住:训练大模型需要H100/H800,贸易管制收紧,算力获取更困难融资能解决问题吗?1算力投入:可以购买更多GPU,扩大训练规模2人才竞争:可以提高薪资待遇,留住核心人才3研发加速:可以招募更多人手,加快V4进度1团队文化:从"纯粹研究机构"变成"有投资人对赌的公司",研发节奏会被商业化压力影响2决策效率:引入外部资本,意味着要向投资人汇报、解释、妥协3理想主义:AGI梦想可能要给商业化让路AI创业生态的残酷现实写在最后

昨天看到一条新闻,我愣了几秒——DeepSeek启动首次外部融资了。

这家曾经放话"不融资"的AI明星公司,终于向资本敞开了大门。目标估值100亿美元,融资至少3亿美元。

我翻了十几篇报道,发现这事儿没那么简单。表面是融资,背后是一场残酷的人才争夺战。DeepSeek的核心团队,正在被大厂"精准收割"。

先说个背景。DeepSeek成立于2023年7月,创始人是量化巨头幻方的梁文锋。这家公司从一开始就划了一条线:不接受外部融资,不稀释股权,不被商业化时间表绑架

梁文锋的理由很直接:

"VC都是帮LP管钱,都得赚钱,所以就谈不到一块去。"

他想做的是纯粹的研究机构,追AGI、做开源、让技术本身说话。底气也很足——幻方2025年全年收益率56.6%,营收超50亿人民币。梁文锋的钱袋子,比绝大多数AI创业公司的投资人都丰盛。

打个比方:DeepSeek就像一个富二代创业,家里有矿,不需要看投资人脸色。梁文锋想证明一件事——用"少资源路径"也能做出顶级模型。DeepSeek-R1做到了,训练成本560万美元,性能逼近OpenAI顶级系统。

那为什么现在突然要融资?

两个原因:研发成本激增,核心人才流失。

这是DeepSeek面临的最大危机。过去几个月,多位核心成员离职:

姓名: 郭达雅 | 职位: DeepSeek-Coder/Math主要作者 | 去向: 字节跳动

姓名: 罗福莉 | 职位: V3模型关键开发者 | 去向: 小米

姓名: 王炳宣 | 职位: 第一代大语言模型核心作者 | 去向: 腾讯

姓名: 阮翀 | 职位: 多模态核心研究员 | 去向: 元戎启行

我试着理解了一下这个局面。DeepSeek是一个小团队,每个人都是单点依赖。流失一个核心研究员,对大厂是局部损失,对DeepSeek意味着整条技术线出现断层。

郭达雅的案例最能说明问题。

这位95后AI博士,是DeepSeek-Coder、DeepSeek-Math的主要作者。他提出的GRPO算法,能显著降低训练资源需求、提升推理效率,后来也被用于DeepSeek R1的训练。Google Scholar引用量超3800次,是真正的技术骨干。

他3月从DeepSeek离职,加入字节跳动Seed团队,职级L8,负责Agent方向。市场传闻字节开出了接近亿元年薪的总包。

字节官方否认了"近亿元年薪"的说法,但补充了一句:

"如果业务发展良好,不排除部分Seed技术人员四年后收益达到数亿元。"

说白了,钱不是问题,问题是钱给得够不够久。

薪资差距有多大?

DeepSeek的深度学习研究员最高年薪154万元。但竞争对手开出的条件是"翻2到3倍问题不大",部分甚至给出8位数总包。

小米请罗福莉,雷军亲自出马,千万年薪。字节请郭达雅,现金+字节期权+豆包期权,四年归属。如果豆包业务爆发,四年后收益可能达到数亿元。

情怀打不过2到3倍的薪资差距。这不是夸张,是人才市场的残酷现实。

DeepSeek的问题,不是个例。这是整个国产AI硬科技初创公司在巨头碾压下面临的共同困境。

大厂有三大优势:

创业公司有什么?

情怀、理想、AGI梦想。

但在人才市场上,情怀打不过2到3倍的薪资差距。

对大厂而言,流失一个核心研究员是局部损失;对DeepSeek而言,流失一个核心研究员意味着整条技术线出现断层。

这不是夸张,是小团队的先天脆弱性。人少意味着每个人都是单点依赖,没有人可以被"替代"。

我试了一下理解这个局面:假设你是一个10人的技术团队,每个人负责一个核心模块。走了一个人,那个模块就没人懂了。大厂有几百人,走一个还有几十个备胎。创业公司没有备胎。

这不是DeepSeek独有的问题。

我翻了更多报道,发现整个AI行业都在经历一场人才大洗牌。字节Seed团队近70名核心员工被挖角,其中包括加入DeepSeek的徐名宇。而DeepSeek首位员工李宇琨,恰恰是2023年从字节跳槽过去的。

人才双向流动,看起来是"公平竞争"。但问题是,大厂有70个人可以流失,创业公司只有10个人。

这就是"不对称战争"的本质。

DeepSeek V4原定2026年2月中旬发布,现在一推再推,至今仍未正式发布。

根据公开信息,V4将采用万亿参数MoE架构,支持百万Token上下文,原生多模态能力。更重要的是,它计划从英伟达芯片迁移到华为昇腾平台。

这是一个巨大的技术挑战。迁移训练平台不是换个硬件那么简单,需要重新优化整个训练流程。核心人才的流失,让这个挑战变得更加困难。

V4延期,是人才流失的直接后果。

有意思的是,行业里流传三种猜测:

无论哪种原因,核心人才的流失都是雪上加霜。

DeepSeek这次融资,估值100亿美元,出让的股权极少(3亿美元/100亿美元=3%)。这说明梁文锋还是想保持控制权。

融资能解决什么问题?

但融资解决不了什么问题?

这是一次妥协,也是一次无奈之举。

DeepSeek的困境,折射出整个AI创业生态的残酷现实。

大厂碾压:字节、腾讯、阿里、小米,都在疯狂抢人。他们有钱、有平台、有场景,创业公司拿什么竞争?

资本回归:生数科技融资近20亿元,极佳视界两个月融资25亿元,估值破百亿。AI创业公司融资潮又来了,但这次是"被迫融资"——不融资就留不住人。

人才定价:AI顶尖人才的身价水涨船高。大模型算法工程师月薪中位数24,760元,顶尖人才年薪逼近200万元。这已经不是创业公司能承受的范围。

更残酷的是:美国对全球AI人才的吸引力正在下降。自2017年以来,前往美国的AI研究人员和开发人员数量已下降了89%。从2024年开始,美国22-25岁的年轻开发者岗位减少了近20%。AI先替代的是"入门级执行",而不是"有经验的判断"。

这意味着,全球AI人才竞争正在加剧。中国的大厂们,正在用更高的薪资、更好的平台、更香的期权,抢夺最顶尖的大脑。

中美竞争:根据斯坦福《2026年AI指数报告》,中美AI模型性能差距仅剩2.7%。DeepSeek-R1曾短暂追平美国顶级模型。但技术领先是一回事,人才留不留得住是另一回事。

一个值得关注的细节:2025年2月,DeepSeek-R1发布时,训练成本560万美元,成本利润率545%。这个数据让行业意识到,顶级模型能力并非只能通过极端资源堆叠获得。

但问题是,做出R1的人才,现在正在被大厂挖走。技术可以领先,但人才留不住,一切归零。

DeepSeek首次融资,不是"AGI理想向资本低头"那么简单。这是一场被迫的妥协,是人才困局下的无奈之举。

梁文锋曾经想验证一条"少资源路径"——用十分之一的钱做出同级模型。DeepSeek-R1做到了。但问题是,做出模型是一回事,留住做模型的人是另一回事。

这是一个残酷的悖论:技术理想主义需要人才来实现,但人才市场不相信理想主义。当大厂开出2到3倍薪资,当期权四年归属后可能价值数亿,多少人能抵挡住诱惑?

技术理想主义很美好,但人才市场不相信情怀。当大厂开出2到3倍薪资,当期权四年归属后可能价值数亿,多少人能抵挡住诱惑?

DeepSeek的困境,是所有AI创业公司的困境。技术可以领先,但人才留不住,一切归零。

这不是钱的问题,是认知的问题。真正的天才,从来不是被"买"来的,是被"看见"的。

但问题是,大厂也能"看见"他们,而且看得更清楚。

打开网易新闻 查看精彩图片