你有没有发现?
去年刷爆 AI 圈的 DeepSeek,今年好像没什么动静了。
以前刷小红书,刷知乎,到处都是 DeepSeek 的消息。
什么 V2 版本超 GPT-3.5,V3 对标 GPT-4,R1 还上了《Nature》封面。
怎么今年就突然哑火了?
网友们扒来扒去,终于找到了答案:里面的大佬们,一个个被挖走了。
先是罗福莉,那个 95 后 AI 天才少女,被雷军千万年薪挖到小米去了。
她可是 DeepSeek-V2 的核心开发者,MoE 架构的大拿。
去年 11 月官宣加入小米 MiMo 大模型团队,朋友圈一句 “我正在 Xiaomi MiMo”,让整个 AI 圈都炸了。
近期在OpenRouter平台,
累计调用量破万亿的神秘模型- “Hunter Alpha”
正是小米自研的MiMo-V2-Pro!
现在AI圈又传出,DeepSeek 的另一位顶梁柱,郭达雅,也要走了。
消息一出,评论区直接炸开锅。
有人说 “这是要把 DeepSeek 掏空啊”,
有人问 “下一个是谁?”,
还有人叹息 “创业公司留不住人啊”。
郭达雅是谁?为啥这么多人关心
郭达雅,1994 年出生,广东珠海人。典型的学霸路线。
2014 年考进中山大学数据科学与计算机学院。
大四就进了中山大学 — 微软亚洲研究院联合培养项目。
在 MSRA 那几年,开了挂的他2020 年拿了微软学者奖学金,
亚太地区就 12 个人能拿到。
跟着印鉴教授、周明博士,后来又跟段楠搞代码智能,做出来的 CodeBERT、GraphCodeBERT,现在还是行业标杆。
2023 年博士毕业,第三天就完成了中大博士毕业论文要求,发了一堆顶会论文。
7 月就加入了 DeepSeek,成了代码智能和推理方向的核心研究员。
他在 DeepSeek 这一年多,干了很多大事:
主导 DeepSeek-Coder 系列,从 1.3B 到 33B 参数,让 AI 写代码的能力直接飙升,能一次性看懂整个项目的代码架构。
负责 DeepSeek-Math,把模型的数学解题能力提了一大截。
作为第一作者搞出 DeepSeek-R1,直接上了《Nature》封面。不用人类示例,让模型自己开发推理步骤,训练成本降了好多。
深度参与 V3 混合专家模型,14.8T tokens 训练,性能对标顶级闭源模型。
他的研究主线特别清楚:让模型更会写代码、更会做数学、更会推理。这三个方向,正是现在大模型赚钱的核心痛点。
你想想,企业用大模型,不就是想让它帮着写代码、算数据、解决复杂问题吗?
郭达雅就是把这三件事做到极致的人。
他的贡献有多牛?说出来吓你一跳
郭达雅在 DeepSeek 的成果,随便拿一个出来,都能在 AI 圈引起轰动。
就说 DeepSeek-R1,他是第一作者。
这个模型牛在哪?它能自己反思,自己验证答案。
传统模型要靠人类标注数据,成本高得吓人。
R1 不用,通过强化学习,让模型自己比较多个答案,找出最好的那个,训练资源直接省了一大半。
还有 DeepSeek-Coder,现在很多程序员都在用。
能理解代码里变量之间的依赖关系,重构代码、修 Bug 都特别顺手。
有程序员说,用了 DeepSeek-Coder,写代码效率直接翻倍。
数学方面更不用说,DeepSeek-Math 让模型解数学题的能力大幅提升,很多竞赛题都能轻松搞定。
他的论文,几乎篇篇都是顶会级别,引用量高得惊人。
这样的人才,哪个大厂不想要?
大佬出走,中国大模型的困境
罗福莉走了,郭达雅也要走了。
这背后,是中国大模型行业的残酷现实。
创业公司再努力,也扛不住大厂的钞能力。
人家一张口就是千万年薪,还有股票期权,创业公司拿什么比?
网友们看出来了:这已经不是百模混战了,是人才争夺战。
你以为拼的是参数,是产品化速度?
其实拼的是能不能留住郭达雅这样的人,
能不能给他们足够的算力,
足够好的科研环境,
还有长期的组织能力。
更让人叹息的是,现在很多企业,根本没能力做真正的大模型研究。
你看最近的 “小龙虾” 热潮,也就是 OpenClaw 智能体。
中国数十家家科技大厂集体下场,腾讯、字节、阿里、百度、小米都来了。
有的做适配,有的推自研,有的搭平台。
大部分都是跟风。
有人花 3999 元学 “龙虾赋能生产管理”,
最后只学会了用 AI 生成报表,对流水线作业一点用都没有。
所谓的 “定制化方案”,就是套模板改几个字。
还有人在云服务器上 “养虾”,默认设置都是裸奔的。
让龙虾接管电脑 5 分钟,就被 139 个 IP 尝试连接。
这哪里是 AI 创新?这分明是割韭菜。
真正在做底层研究的,没几家。
愿意沉下心来,培养像郭达雅这样的人才的,更少。
最后想说的话
郭达雅的离开,不只是 DeepSeek 的损失,更是整个中国大模型行业的缩影。
我们总说要追赶 OpenAI,要实现 AI 自主可控。
但如果连自己培养的顶尖人才都留不住,怎么追赶?
创业公司不容易,拿着有限的资源,跟财大气粗的大厂抢人,太难了。
而那些跟风做应用的企业,看似热闹,实则是在浪费资源。
没有底层技术的突破,没有顶尖人才的积累,
再热闹的 “小龙虾” 热潮,也只是昙花一现。
我们需要更多像郭达雅这样的研究者,
沉下心来做基础研究。
我们也需要更多能留住这些研究者的环境,
让他们不用为了钱,为了资源,而离开自己奋斗的地方。
不然,中国的大模型,永远只能跟在别人后面跑。
希望有一天,我们能骄傲地说,中国的大模型,不仅有应用,更有自己的核心技术,自己的顶尖人才。
而不是每次提起,都是 “谁谁谁又被挖走了” 。
阿斯麦高管:中国EUV原型机仅有我们20年前(2006年)的水平!白春礼院士:中国做光刻机时还没有阿斯麦!
高志凯教授:西方抹黑中国的“总指挥”,被特朗普抖出来了
孙逢春院士直言:国产车技术已经超越特斯拉,规模全球第一!网友:基本盘的专家
国际电池开发商:美国在芯片上全力制裁中国,但中国已经在下一个技术时代开始称霸了
黄仁勋说,“如果你的父母是中国人,那么你一定经受过很多痛苦和磨难,我祝福你,一生都充满「痛苦和磨难」”
美国要求台积电在美追加投资3.15兆台币,合千亿美金,因未满足DEI合规(缺乏盲人和跨性别、女同性恋工程师)
“在看”的永远年轻~
热门跟贴