打开网易新闻 查看精彩图片

作者|周松

原创首发|蓝字计划

500亿元融资到手后,DeepSeek准备先把钱花在哪里?

更多芯片,更多算力,还是下一代模型?

梁文锋给出的第一个答案,是人。

近日,DeepSeek在社交平台发布一条名为“寻找闪亮发光的你”的招聘公告,宣布要将所有部门的规模扩大至少一倍。

打开网易新闻 查看精彩图片

图源:DeepSeek官方微信

招聘公告很简单:7大类、33个岗位,涉及从研发、算力、产品到运维、职能等一整套互联网组织架构,且所有岗位均接受实习。

这也成了2023年DeepSeek成立以来规模最大的一次公开招聘。

有钱了要花,天经地义。特别是据媒体报道,这轮融资也将DeepSeek的投后估值推至500亿美元以上,跻身全球估值最高的AI创业公司之列。

当然,放在任何一家刚刚拿到巨额融资的科技公司身上,大规模招聘都算不上新鲜事。

但这次扩招,对DeepSeek 来说却有不一样的意义。毕竟对于这家几乎是全中国最知名的大模型公司来说,人少、层级少、决策快,一直是其“效率神话”中最重要的一部分。

而这次DeepSeek不惜一改过去的人设,也要追求“做大做强”,实则与DeepSeek长期存在的一种焦虑息息相关。

“小而美”,曾是DeepSeek的杀手锏

DeepSeek这次扩招之所以罕见,首先是因为这家公司过去的人数,一直有意保持在很少的范围内。

关于DeepSeek的员工数量,最近一次相对可靠的公开口径,是2025年3月《金融时报》披露的约160人。

160人是什么概念?

对一家普通创业公司来说,160人可能只是一个刚起步、“小而美”的团队;但从行业地位来看,DeepSeek早已坐上了全球顶级大模型公司的牌桌。

V3、R1发布之后,它最常被放在一起比较的对手,已经变成了OpenAI和Anthropic。

但在人员规模上,这几家公司完全不像一个量级。

截至2026年3月,OpenAI已经拥有约4500名员工,Anthropic的员工数量也达到了约2500人。

甚至国内的大模型新贵智谱,截至2025年末也拥有938名员工。

但正是DeepSeek这一百多人,却干出了几千人公司的动静,推出了享誉全球的DeepSeek V3和R1。

DeepSeek的人少,并不只是省下了工资和管理成本。

团队规模小,模型、算法和基础设施人员之间没有太多层级,一个新想法被认为值得尝试,很快就能拿到算力、拉起人手进入验证。

打开网易新闻 查看精彩图片

图源:AI生图

梁文锋曾介绍,DeepSeek内部更接近自然分工,成员围绕具体问题自由协作。后来成为关键技术之一的MLA,最初就来自年轻研究员的个人想法,公司发现方向有潜力后,很快调配资源把方案跑通。

人少、层级少,再加上高人才密度,让DeepSeek能够把有限资源集中到少数关键问题上。这才是百人团队能够连续做出V2、V3和R1的重要组织基础。

只不过,如果用现在眼光看,“小而美”的团队架构也不全是好事。至少有一点,对DeepSeek来说是一个实打实的焦虑:

这家公司比大多数对手更怕“被挖角”,特别是核心员工的挖角。

一家拥有几千名员工的大模型公司,离开几名研究人员,或许还能通过内部团队迅速补位。

DeepSeek的团队规模很小,许多关键模型、算法和基础设施,又长期集中在少数核心成员手中。

一名骨干离开,带走的可能是一整块技术积累。

据媒体梳理,从2025年下半年以来,DeepSeek已经有至少5名核心研发人员陆续离开。

DeepSeek-V2的重要贡献者罗福莉加入小米,如今已经成为小米MiMo大模型团队的负责人。

DeepSeek R1论文第一作者郭达雅转投字节跳动Seed团队。

打开网易新闻 查看精彩图片

图源:图灵联合创始人刘江X账号

参与DeepSeek早期模型研发的王炳璇加入腾讯混元;多模态方向的核心研究员阮翀,则去了自动驾驶公司元戎启行。

这些人的新去向也很有意思。小米、字节、腾讯都在重金投入大模型,它们缺少的,恰好是已经完整经历过顶级模型训练的人。

DeepSeek用几年时间培养出来的一批年轻研究员,也因此成了整个行业最抢手的人才。

罗福莉等人的离开,甚至让外界开始把DeepSeek称为中国大模型行业的“黄埔军校”。

人才被行业认可,当然证明了DeepSeek的培养能力。

但对于一家原本只有百人规模的公司来说,自己培养出来的人不断成为竞争对手的核心负责人,压力也会被迅速放大,这也是精兵模式最脆弱的地方。

要是过去一两年,DeepSeek还可以凭借技术理想、研究自由和高薪吸引年轻人。

只是,随着全球AI人才争夺进入白热化,竞争对手能够拿出来的,还有大额现金、股票、期权,以及直接负责一条业务线的机会。

过去不接受外部融资、也没有明确外部估值的DeepSeek,在人才激励上很难一直和互联网巨头硬碰硬。

如今,500亿元人民币融资到位,DeepSeek终于拥有了更加明确的公司估值,也有了扩充团队和完善长期激励的资本。

只不过,梁文锋这次的扩大招聘,所瞄准的实际上已经远超了“补充几个离职员工留下的缺口”那么简单。

从算力基础设施、Agent研发到产品、法务、采购和行政,比起扩招,梁文锋更像是要“重构”DeepSeek。

估值500亿美元的公司,还在招行政

这次招聘里,最让人意外的岗位,可能并不是什么顶尖算法工程师,而是行政。

一家投后估值超过500亿美元、已经站上全球大模型牌桌的公司,这次公开招聘里,竟然同时出现了HR、法务、财务、采购和行政

打开网易新闻 查看精彩图片

图源:DeepSeek官方微信

这些岗位听上去和大模型没有多大关系,也很难出现在DeepSeek过去的技术故事里。

但它们恰好说明,DeepSeek过去的组织到底有多单薄。

500亿元融资进来后,资金如何管理、算力采购如何决策、合同流程如何规范、团队扩张如何推进,以及数据和产品出现问题时由谁来承担责任,这些事情都不再能靠几个人顺手解决。

所以,行政岗位虽然不起眼,却是这场招聘中最有代表性的信号之一。

DeepSeek终于要从一支能做出顶级模型的团队,变成一家能够长期运转的大公司。

更有意思的是,DeepSeek补的还不只是公司的基本骨架。

在招聘名单里,法律、医学和小语种等专业领域的数据产品经理,也第一次集中出现。

这些人未必直接参与底层模型训练,但他们能解决通用模型进入专业场景后,算法工程师很难单独处理的问题。

比如法律文件的整理方式、医学数据的使用边界、小语种语料的来源,以及其中可能涉及的版权和隐私问题,都离不开真正懂行业的人来参与和把关。

除此之外,DeepSeek在这次的招聘中也非常“新潮”,紧紧抓住了当前AI潮流的脉搏:Agent

这次招聘中,DeepSeek专门组建了Agent Harness团队

Harness可以理解为套在模型外面的一整套运行系统,负责上下文管理、工具调用、文件读写、代码修改、终端执行和结果检查。

此前,DeepSeek资深研究员陈德里已经公开招募DeepSeek Code Harness团队,对标的正是Anthropic旗下的Claude Code

打开网易新闻 查看精彩图片

图源:DeepSeek资深研究员陈德里X账号

也正是这个岗位的招聘,正式颠覆了过去DeepSeek“扫地僧”的形象。在一年之前,我们都觉得DeepSeek是那种“双耳不闻窗外事”,丝毫不在意市场热点,赛道热潮的公司,只会埋头训练自己的模型。

但显然,现在Agent是主流,Harness也风头正盛。强如Claude Code,它能够迅速流行,靠的也不只是Claude模型本身,还有背后一整套围绕真实编程工作搭建的产品和工程能力。

如今的DeepSeek,也开始顺着这条路线补齐产品和工程能力。

再加上DeepSeek还在补充全栈开发、算法与AI核心系统研发等岗位,并把招聘地点扩展到了内蒙古乌兰察布,开始招募数据中心的高级运维工程师和高级交付经理。

打开网易新闻 查看精彩图片

图源:DeepSeek官方招聘网站

从行政、财务、法务,到Agent、算力的相关岗位,可以看到在500亿元到手后,梁文锋显然不准备只训练一个更大的模型。

他要给DeepSeek补上一套产品体系、一套基础设施,以及一家估值500亿美元的公司该有的完整组织。

只是,新的问题也就此浮现。

等到人员翻倍、部门增多、流程逐渐建立起来,DeepSeek还能不能保住过去那种百人团队的反应速度,延续过去的“效率神话”?

是扩招,更是重生

其实,从DeepSeek决定把所有部门扩大一倍的那一刻起,过去那套“效率神话”,其实就已经翻篇了。

团队人数增加、部门会变多之后,财务、法务、采购、行政都会建立起自己的流程。随着Agent、专业数据、算力基建和商业交付一起推进,DeepSeek也不可能继续像一家百人研究团队那样运转。

简而言之,整个组织的复杂度会随着业务范围的扩大明显增加。

这是DeepSeek决定“做大做强”之后,必须支付的账单。

而这样的“阵痛”,实则是每家大公司从“小而美”阶段毕业后,后续都会经历的。

特别是谷歌,它可以说是大规模公司一度出现管理混乱的典型案例。

当年ChatGPT刚刚爆发时,谷歌明明拥有Transformer、DeepMind和庞大的算力资源,却因为研究团队分散、模型和产品之间距离太远,一度在生成式AI产品竞争中显得行动迟缓。

Bard上线后的多次失误,也进一步坐实了外界对谷歌“大公司病”的判断。

但好在,犯错之后的Google开始重新整理自己的AI组织。

2023年,Google Brain与DeepMind合并,组成Google DeepMind。

2024年,谷歌又陆续把更多模型研发、安全团队和Gemini应用团队放进DeepMind,试图让模型、研究和产品靠得更近,缩短从技术突破到产品上线之间的距离。

最终,Gemini从一个被外界嘲笑的追赶者,逐渐回到全球顶级模型的竞争中。到2025年末,Gemini应用的月活跃用户已经超过7.5亿。

2026年初,路透社甚至用“从落后者到领先者”,形容谷歌在这一轮AI竞争中的变化。

谷歌的变化至少说明,大公司并非注定失去创新能力。把资源、人才和产品入口重新组织起来之后,庞大的公司也可能重新找回竞争节奏。

而且DeepSeek的处境,至少在组织包袱方面比当年的谷歌好得多。

它没有谷歌几十年积累下来的部门和历史包袱,也还没有形成一套难以改变的官僚体系。

打开网易新闻 查看精彩图片

图源:网络表情包

现在扩招,反而给了梁文锋一次提前设计组织的机会。

法务、财务和采购可以承接公司扩张带来的复杂工作,产品和数据团队可以负责把模型送进真实场景,算力团队可以保证基础设施稳定运行。

核心研发团队,则需要继续保持足够高的自主权。

最终,DeepSeek的技术人员反而可能比以前更加专注。

500亿元融资给了DeepSeek足够的资金,过去几年的模型成绩,也给了梁文锋试错的底气。

过去的DeepSeek已经证明,一百多人也能把模型做到世界前列。

接下来,它需要证明,一家拥有数百名员工、完整产品体系和稳定基础设施的公司,同样可以保持足够强的创新能力。

无论如何,过去那套“人少干大事”的效率神话,大概率会成为过去式。

但一个部门更齐全、产品能力更强,也更有能力长期交付结果的DeepSeek,才刚刚开始。