但一年后的2026年4月,故事急转直下。

DeepSeek被曝正与投资人洽谈首次外部融资,寻求以超100亿美元估值筹集至少3亿美元——这个曾经拒绝过多家顶级VC和科技巨头投资邀约、坚持"纯搞AGI创新"的技术理想主义者,终究开始向资本低头。V4模型从原定2026年2月中旬一推再推,至今仍未正式发布。

这不是一个人的理想妥协,这是整个国产AI硬科技初创公司在巨头碾压下的一面镜子。

DeepSeek总共不到200人,核心研究团队约100多人,基模架构团队仅小几十人。更关键的是,这支团队的构成极为年轻:本科和硕士占比超七成,30岁以下超七成,几乎不社招,以应届生和实习生留任为主。

对大厂而言,流失一个核心研究员是局部损失;对DeepSeek而言,流失一个核心研究员意味着整条技术线出现断层。这不是夸大其词,而是小团队的先天脆弱性——人少意味着每个人都是单点依赖,没有人可以被"替代"。

人才为什么走?先算一笔账。

据多方信源,DeepSeek的绝对薪资并不低,但竞争对手开出的条件"翻2到3倍问题不大",部分甚至给出8位数总包(含股票/期权)。罗福莉的案例最具代表性——雷军以千万年薪加码招募,亲自盯这件事。郭达雅虽被字节官方否认"亿元年薪",但多路信源指向其总包远超DeepSeek的薪酬体系。

再对比AI行业的整体薪酬水平:大模型算法工程师月薪中位数已达24760元,顶尖人才年薪逼近200万元。北京海淀区官方发布的紧缺岗位目录显示,人工智能领域整体平均年薪为48.14万元,而芯片算法与设计优化工程师年薪已突破百万元。

大厂则恰恰相反。字节跳动虽未上市,但期权有明确的流通渠道;腾讯的股票激励体系成熟;小米在港股上市,薪酬+期权的组合包可以做到精准定价。当一个95后研究员面临"DeepSeek的无限可能"和"字节的8位数确定性"二选一时,理性的选择并不难做。

如果把DeepSeek的人才困境归结为"给不起钱",就低估了问题的复杂性。薪资只是表面,背后是三层结构性矛盾的叠加。

第三层:信心动摇。V4从2026年2月中旬一推再推,至今未正式发布。在AI行业,模型的发布节奏就是技术生命线。当OpenAI连续推出GPT系列迭代、Claude快速升级、字节豆包市场份额持续攀升时,DeepSeek在V3.2之后的"静默期",对内部信心的侵蚀远超外部想象。一个没有明确绩效考核、没有DDL、每天下午6点下班的研究团队,当外部竞争压力加大、内部看不到新一代模型落地的节点时,人才出走只是时间问题。

值得注意的是,人才争夺战并非单向收割。过去一年,字节跳动Seed团队同样流失了近70名技术人才——近30人加入腾讯AI Infra团队,部分流向阿里、OpenAI、Google、Meta等。字节系前员工创办了30余家AI创业公司,覆盖Agent、多模态创作、具身智能等赛道。

而DeepSeek也在吸纳人才:从字节搜索团队挖来李宇琨(DeepSeek首位员工,负责预训练数据),从字节Seed Edge引入徐名宇(从事模型结构研发)。人才的流向从来不是单向的,但格局很清晰——大厂和初创公司之间的人才交换,大厂凭借规模和确定性,始终处于净流入端。

这意味着,DeepSeek面对的不是一个偶发的人才流失事件,而是一个系统性的竞争劣势:在人才市场的"汇率"中,大厂的薪酬包、算力储备和生态场景构成了"硬通货",初创公司能打出的牌,只有技术理想和组织自由度——这两张牌,在现实面前越来越不好用。

具体动作包括:2025年秋天起频繁提及产品化和商业化方向,首次招聘"模型策略产品经理"等非研究岗,开始想办法给公司做估值、给团队更确定的预期。2026年4月17日,The Information报道DeepSeek正在以超100亿美元估值寻求至少3亿美元首轮融资。

但问题在于,接受融资只是第一步。融资到位后,DeepSeek将面临一个更棘手的平衡题:如何在引入资本后保持技术团队的专注力和自由度?如何在提升薪酬竞争力的同时避免大厂化的层级膨胀?在V4发布后,技术领先性能否转化为商业壁垒?

这些问题,没有一个是靠钱能解决的。

DeepSeek的人才困局,给整个AI行业提了一个醒:当核心人才可以用8位数总包精准定价时,技术理想就成了最廉价的留人工具。

这不是对DeepSeek的否定。在不到200人的团队规模下,用远低于大厂的算力和人力,做出V3/R1这样震动行业的产品,本身就是中国AI硬科技实力的证明。但这也恰恰说明了一个残酷的现实——在技术密集型赛道上,个体的技术突破可以被复制,而系统的资源优势不可逾越。

对整个行业而言,需要思考的不是"DeepSeek能不能留住人",而是"如何在巨头的资源碾压下,为技术理想主义留出生存空间"。这个问题,比任何一个模型的训练成本都更值得算清楚。