继AI天才少女罗福莉之后，DeepSeek-R1第一作者郭达雅将离开DeepSeek，加入某头部大厂

大白聊IT

2026-03-23 12:18 ·四川 ·优质科技领域创作者

你有没有发现？

去年刷爆 AI 圈的 DeepSeek，今年好像没什么动静了。

以前刷小红书，刷知乎，到处都是 DeepSeek 的消息。

什么 V2 版本超 GPT-3.5，V3 对标 GPT-4，R1 还上了《Nature》封面。

怎么今年就突然哑火了？

网友们扒来扒去，终于找到了答案：里面的大佬们，一个个被挖走了。

先是罗福莉，那个 95 后 AI 天才少女，被雷军千万年薪挖到小米去了。

她可是 DeepSeek-V2 的核心开发者，MoE 架构的大拿。

去年 11 月官宣加入小米 MiMo 大模型团队，朋友圈一句 “我正在 Xiaomi MiMo”，让整个 AI 圈都炸了。

近期在OpenRouter平台，

累计调用量破万亿的神秘模型- “Hunter Alpha”

正是小米自研的MiMo-V2-Pro！

现在AI圈又传出，DeepSeek 的另一位顶梁柱，郭达雅，也要走了。

消息一出，评论区直接炸开锅。

有人说 “这是要把 DeepSeek 掏空啊”，

有人问 “下一个是谁？”，

还有人叹息 “创业公司留不住人啊”。

郭达雅是谁？为啥这么多人关心

郭达雅，1994 年出生，广东珠海人。典型的学霸路线。

2014 年考进中山大学数据科学与计算机学院。

大四就进了中山大学 — 微软亚洲研究院联合培养项目。

在 MSRA 那几年，开了挂的他2020 年拿了微软学者奖学金，

亚太地区就 12 个人能拿到。

跟着印鉴教授、周明博士，后来又跟段楠搞代码智能，做出来的 CodeBERT、GraphCodeBERT，现在还是行业标杆。

2023 年博士毕业，第三天就完成了中大博士毕业论文要求，发了一堆顶会论文。

7 月就加入了 DeepSeek，成了代码智能和推理方向的核心研究员。

他在 DeepSeek 这一年多，干了很多大事：

主导 DeepSeek-Coder 系列，从 1.3B 到 33B 参数，让 AI 写代码的能力直接飙升，能一次性看懂整个项目的代码架构。

负责 DeepSeek-Math，把模型的数学解题能力提了一大截。

作为第一作者搞出 DeepSeek-R1，直接上了《Nature》封面。不用人类示例，让模型自己开发推理步骤，训练成本降了好多。

深度参与 V3 混合专家模型，14.8T tokens 训练，性能对标顶级闭源模型。

他的研究主线特别清楚：让模型更会写代码、更会做数学、更会推理。这三个方向，正是现在大模型赚钱的核心痛点。

你想想，企业用大模型，不就是想让它帮着写代码、算数据、解决复杂问题吗？

郭达雅就是把这三件事做到极致的人。

他的贡献有多牛？说出来吓你一跳

郭达雅在 DeepSeek 的成果，随便拿一个出来，都能在 AI 圈引起轰动。

就说 DeepSeek-R1，他是第一作者。

这个模型牛在哪？它能自己反思，自己验证答案。

传统模型要靠人类标注数据，成本高得吓人。

R1 不用，通过强化学习，让模型自己比较多个答案，找出最好的那个，训练资源直接省了一大半。

还有 DeepSeek-Coder，现在很多程序员都在用。

能理解代码里变量之间的依赖关系，重构代码、修 Bug 都特别顺手。

有程序员说，用了 DeepSeek-Coder，写代码效率直接翻倍。

数学方面更不用说，DeepSeek-Math 让模型解数学题的能力大幅提升，很多竞赛题都能轻松搞定。

他的论文，几乎篇篇都是顶会级别，引用量高得惊人。

这样的人才，哪个大厂不想要？

大佬出走，中国大模型的困境

罗福莉走了，郭达雅也要走了。

这背后，是中国大模型行业的残酷现实。

创业公司再努力，也扛不住大厂的钞能力。

人家一张口就是千万年薪，还有股票期权，创业公司拿什么比？

网友们看出来了：这已经不是百模混战了，是人才争夺战。

你以为拼的是参数，是产品化速度？

其实拼的是能不能留住郭达雅这样的人，

能不能给他们足够的算力，

足够好的科研环境，

还有长期的组织能力。

更让人叹息的是，现在很多企业，根本没能力做真正的大模型研究。

你看最近的 “小龙虾” 热潮，也就是 OpenClaw 智能体。

中国数十家家科技大厂集体下场，腾讯、字节、阿里、百度、小米都来了。

有的做适配，有的推自研，有的搭平台。

大部分都是跟风。

有人花 3999 元学 “龙虾赋能生产管理”，

最后只学会了用 AI 生成报表，对流水线作业一点用都没有。

所谓的 “定制化方案”，就是套模板改几个字。

还有人在云服务器上 “养虾”，默认设置都是裸奔的。

让龙虾接管电脑 5 分钟，就被 139 个 IP 尝试连接。

这哪里是 AI 创新？这分明是割韭菜。

真正在做底层研究的，没几家。

愿意沉下心来，培养像郭达雅这样的人才的，更少。

最后想说的话

郭达雅的离开，不只是 DeepSeek 的损失，更是整个中国大模型行业的缩影。

我们总说要追赶 OpenAI，要实现 AI 自主可控。

但如果连自己培养的顶尖人才都留不住，怎么追赶？

创业公司不容易，拿着有限的资源，跟财大气粗的大厂抢人，太难了。

而那些跟风做应用的企业，看似热闹，实则是在浪费资源。

没有底层技术的突破，没有顶尖人才的积累，

再热闹的 “小龙虾” 热潮，也只是昙花一现。

我们需要更多像郭达雅这样的研究者，

沉下心来做基础研究。

我们也需要更多能留住这些研究者的环境，

让他们不用为了钱，为了资源，而离开自己奋斗的地方。

不然，中国的大模型，永远只能跟在别人后面跑。

希望有一天，我们能骄傲地说，中国的大模型，不仅有应用，更有自己的核心技术，自己的顶尖人才。

而不是每次提起，都是 “谁谁谁又被挖走了” 。

阿斯麦高管：中国EUV原型机仅有我们20年前（2006年）的水平！白春礼院士：中国做光刻机时还没有阿斯麦！

高志凯教授：西方抹黑中国的“总指挥”，被特朗普抖出来了

孙逢春院士直言：国产车技术已经超越特斯拉，规模全球第一！网友：基本盘的专家

国际电池开发商：美国在芯片上全力制裁中国，但中国已经在下一个技术时代开始称霸了

黄仁勋说，“如果你的父母是中国人，那么你一定经受过很多痛苦和磨难，我祝福你，一生都充满「痛苦和磨难」”

美国要求台积电在美追加投资3.15兆台币，合千亿美金，因未满足DEI合规（缺乏盲人和跨性别、女同性恋工程师）

“在看”的永远年轻~

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴