打开网易新闻 查看精彩图片

你有没有发现?

去年刷爆 AI 圈的 DeepSeek,今年好像没什么动静了。

以前刷小红书,刷知乎,到处都是 DeepSeek 的消息。

什么 V2 版本超 GPT-3.5,V3 对标 GPT-4,R1 还上了《Nature》封面。

打开网易新闻 查看精彩图片

怎么今年就突然哑火了?

网友们扒来扒去,终于找到了答案:里面的大佬们,一个个被挖走了。

先是罗福莉,那个 95 后 AI 天才少女,被雷军千万年薪挖到小米去了。

打开网易新闻 查看精彩图片

她可是 DeepSeek-V2 的核心开发者,MoE 架构的大拿。

去年 11 月官宣加入小米 MiMo 大模型团队,朋友圈一句 “我正在 Xiaomi MiMo”,让整个 AI 圈都炸了。

打开网易新闻 查看精彩图片

近期在OpenRouter平台,

累计调用量破万亿的神秘模型- “Hunter Alpha”

正是小米自研的MiMo-V2-Pro!

现在AI圈又传出,DeepSeek 的另一位顶梁柱,郭达雅,也要走了。

打开网易新闻 查看精彩图片

消息一出,评论区直接炸开锅。

有人说 “这是要把 DeepSeek 掏空啊”,

有人问 “下一个是谁?”,

还有人叹息 “创业公司留不住人啊”。

郭达雅是谁?为啥这么多人关心

郭达雅,1994 年出生,广东珠海人。典型的学霸路线。

2014 年考进中山大学数据科学与计算机学院。

大四就进了中山大学 — 微软亚洲研究院联合培养项目。

在 MSRA 那几年,开了挂的他2020 年拿了微软学者奖学金,

亚太地区就 12 个人能拿到。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

跟着印鉴教授、周明博士,后来又跟段楠搞代码智能,做出来的 CodeBERT、GraphCodeBERT,现在还是行业标杆。

2023 年博士毕业,第三天就完成了中大博士毕业论文要求,发了一堆顶会论文。

7 月就加入了 DeepSeek,成了代码智能和推理方向的核心研究员。

他在 DeepSeek 这一年多,干了很多大事:

主导 DeepSeek-Coder 系列,从 1.3B 到 33B 参数,让 AI 写代码的能力直接飙升,能一次性看懂整个项目的代码架构。

负责 DeepSeek-Math,把模型的数学解题能力提了一大截。

作为第一作者搞出 DeepSeek-R1,直接上了《Nature》封面。不用人类示例,让模型自己开发推理步骤,训练成本降了好多。

深度参与 V3 混合专家模型,14.8T tokens 训练,性能对标顶级闭源模型。

打开网易新闻 查看精彩图片

他的研究主线特别清楚:让模型更会写代码、更会做数学、更会推理。这三个方向,正是现在大模型赚钱的核心痛点。

你想想,企业用大模型,不就是想让它帮着写代码、算数据、解决复杂问题吗?

郭达雅就是把这三件事做到极致的人。

他的贡献有多牛?说出来吓你一跳

郭达雅在 DeepSeek 的成果,随便拿一个出来,都能在 AI 圈引起轰动。

就说 DeepSeek-R1,他是第一作者。

这个模型牛在哪?它能自己反思,自己验证答案。

传统模型要靠人类标注数据,成本高得吓人。

R1 不用,通过强化学习,让模型自己比较多个答案,找出最好的那个,训练资源直接省了一大半。

还有 DeepSeek-Coder,现在很多程序员都在用。

打开网易新闻 查看精彩图片

能理解代码里变量之间的依赖关系,重构代码、修 Bug 都特别顺手。

程序员说,用了 DeepSeek-Coder,写代码效率直接翻倍。

数学方面更不用说,DeepSeek-Math 让模型解数学题的能力大幅提升,很多竞赛题都能轻松搞定。

打开网易新闻 查看精彩图片

他的论文,几乎篇篇都是顶会级别,引用量高得惊人。

这样的人才,哪个大厂不想要?

大佬出走,中国大模型的困境

罗福莉走了,郭达雅也要走了。

这背后,是中国大模型行业的残酷现实。

创业公司再努力,也扛不住大厂的钞能力。

人家一张口就是千万年薪,还有股票期权,创业公司拿什么比?

网友们看出来了:这已经不是百模混战了,是人才争夺战。

你以为拼的是参数,是产品化速度?

其实拼的是能不能留住郭达雅这样的人,

能不能给他们足够的算力,

足够好的科研环境,

还有长期的组织能力。

更让人叹息的是,现在很多企业,根本没能力做真正的大模型研究。

你看最近的 “小龙虾” 热潮,也就是 OpenClaw 智能体。

中国数十家家科技大厂集体下场,腾讯、字节、阿里、百度、小米都来了。

打开网易新闻 查看精彩图片

有的做适配,有的推自研,有的搭平台。

大部分都是跟风。

有人花 3999 元学 “龙虾赋能生产管理”,

最后只学会了用 AI 生成报表,对流水线作业一点用都没有。

所谓的 “定制化方案”,就是套模板改几个字。

还有人在云服务器上 “养虾”,默认设置都是裸奔的。

让龙虾接管电脑 5 分钟,就被 139 个 IP 尝试连接。

这哪里是 AI 创新?这分明是割韭菜。

真正在做底层研究的,没几家。

愿意沉下心来,培养像郭达雅这样的人才的,更少。

最后想说的话

郭达雅的离开,不只是 DeepSeek 的损失,更是整个中国大模型行业的缩影。

我们总说要追赶 OpenAI,要实现 AI 自主可控。

但如果连自己培养的顶尖人才都留不住,怎么追赶?

创业公司不容易,拿着有限的资源,跟财大气粗的大厂抢人,太难了。

而那些跟风做应用的企业,看似热闹,实则是在浪费资源。

没有底层技术的突破,没有顶尖人才的积累,

再热闹的 “小龙虾” 热潮,也只是昙花一现。

我们需要更多像郭达雅这样的研究者,

沉下心来做基础研究。

我们也需要更多能留住这些研究者的环境,

让他们不用为了钱,为了资源,而离开自己奋斗的地方。

不然,中国的大模型,永远只能跟在别人后面跑。

希望有一天,我们能骄傲地说,中国的大模型,不仅有应用,更有自己的核心技术,自己的顶尖人才。

而不是每次提起,都是 “谁谁谁又被挖走了” 。

阿斯麦高管:中国EUV原型机仅有我们20年前(2006年)的水平!白春礼院士:中国做光刻机时还没有阿斯麦!

高志凯教授:西方抹黑中国的“总指挥”,被特朗普抖出来了

孙逢春院士直言:国产车技术已经超越特斯拉,规模全球第一!网友:基本盘的专家

国际电池开发商:美国在芯片上全力制裁中国,但中国已经在下一个技术时代开始称霸了

黄仁勋说,“如果你的父母是中国人,那么你一定经受过很多痛苦和磨难,我祝福你,一生都充满「痛苦和磨难」”

美国要求台积电在美追加投资3.15兆台币,合千亿美金,因未满足DEI合规(缺乏盲人和跨性别、女同性恋工程师)

在看”的永远年轻~