32岁，全球第一开源模型掌舵人，说了声bye就走了|埃隆_马斯克|大模型|开源模型|林俊|模态|算法

3月2日，阿里千问发布了Qwen3.5小尺寸模型系列。马斯克在X上点了赞，评价说「令人惊叹的智能密度」。

林俊旸感谢了马斯克的关注。

第二天下午，他向阿里提交了辞职申请。

3月4日凌晨，他发了一条推文：

"me stepping down. bye my beloved qwen."

24小时。从全球瞩目到转身离场。

一个语言学学生的意外路线

其实在所有标签里面，我觉得最有意思的一个，大多数报道反而没怎么展开。

林俊旸是北大计算机本科，这没什么稀奇。但他的硕士，读的是语言学——正儿八经的外国语学院语言学与应用语言学，不是CS方向的NLP。

一个学语言学的人，后来成了全球使用量最大的开源大语言模型的技术负责人。

这个路径倒过来想就很有趣了。大语言模型的本质是什么？是对人类语言的建模。绝大多数做LLM的人从计算机科学出发，先懂算法再学语言规律。林俊旸反过来——他同时理解语言本身的结构，又有计算机的工程能力。

2020年GPT-3发布后，阿里达摩院内部调兵遣将。恰恰是因为他这个「语言学+技术」的复合背景，被分配到了周靖人领导的智能计算实验室，成为M6模型团队的核心开发者。

这个分配决定了后面所有的事情。

93年出生，2019年硕士毕业直接进阿里达摩院。没有读博，没有海外经历，纯粹的本土培养路线。然后一路狂飙——M6（共同一作）、OFA（One-For-All）、Chinese CLIP，在多模态预训练领域都是里程碑式的工作。Google Scholar被引量超过4万次。

2022年底，达摩院AI团队并入阿里云成立通义实验室，林俊旸被任命为通义千问的技术负责人。

那年他29岁，成了阿里巴巴最年轻的P10级技术专家。阿里的技术体系里，很多工程师干了十几年也到不了P10。他用了3年。

去年的AGI-Next峰会上，他和杨植麟、姚顺雨、唐杰同台，被媒体称为「基模四强」。四个人代表了中国基础大模型的主要力量。那个场景现在回看，多少有些唏嘘。

全球第一，但全球第一的另一面

从2022年底接手到2026年初离开，林俊旸带着千问走了大概3年。

这3年的成绩单，数字说得比人清楚：在HuggingFace上，Qwen的衍生模型数量突破了20万个，总下载量超过3亿次，超越了Meta的Llama，成为全球被使用最多的开源模型。旗舰版Qwen3-Max超万亿参数，在多个权威评测中跻身全球前三，和GPT-5、Claude掰手腕。

注意，这里说的「全球第一」是指生态第一。全世界最多人下载、最多团队基于它做二次开发的开源模型。某种意义上，这个「第一」的含金量比跑分更高。

而且产品侧也终于打起来了。千问APP在2026年初经历了爆发式增长。1月月活突破1亿，春节期间DAU峰值飙到7352万，到2月月活已经达到2.03亿，增速552%全球第一，总量排全球第三。

我去年11月写过一篇「横扫硅谷的千问，杀回国内了」，当时Airbnb的CEO说他们大量依赖千问模型，「比OpenAI更好更便宜」。一个中国团队做的开源模型，被硅谷公司当核心基础设施在用。

但如果你从2024年一直跟到现在，会发现「全球第一」这个头衔，其实藏着一些微妙的东西。

2024年的时候，Qwen确实是开源世界的领头羊，没什么争议。但2025年DeepSeek爆发之后，整个格局变了。Kimi K2开源了，GLM-5开源了，MiniMax M2.5也开源了。开源不再是Qwen的独家优势，国内大模型的竞争格局变成了「一超三强」——DeepSeek一骑绝尘，Qwen、GLM、Kimi各有强项。

Qwen的位置变得有点微妙。它依然是全球下载量最大的开源模型，衍生模型数量也是全球第一。很多团队拿Qwen当基座来做进一步训练——Cursor的Composer模型被发现思考过程会输出中文，有国产模型微调的痕迹；DeepSeek-R1也有基于Qwen的蒸馏版本。

某种意义上，Qwen成了AI世界的「Android」——底层无处不在，但品牌感知反而不那么强烈。

在具体赛道上也是这样。Qwen采取的是「饱和式发布」策略——各种尺寸、各种模态不断往外放，从0.6B到235B，从文本到视觉到语音，全覆盖。开发者生态的优势确实大，但也给人一种什么都做、什么都不够极致的感觉。AI Coding领域Kimi K2的声量更大，多模态世界模型方向Gemini 3系列走得更远。Qwen什么都有，但没有一个赛道是让人第一时间联想到它的。

产品侧的问题更明显。模型叫Qwen，产品叫通义，C端APP又叫通义千问——三个名字指向同一个东西但侧重不同，品牌认知一直是割裂的。直到2025年11月APP才改名「千问」，而阿里正式把所有AI品牌统一为「千问」，是2026年3月2日的事——对，就是林俊旸提辞职的前一天。

开发者生态和消费者市场之间的鸿沟，千问一直没有完全填上。APP月活突破2亿是这个春节靠30亿补贴砸出来的，留存率还是个问号。晚点小数据做过一张春节期间AI应用对比图，很能说明问题：千问DAU在2月6日开始砸30亿补贴后冲到高点，但不发红包的DeepSeek反而用户黏性最强——日均使用时长16分钟，远超其他三家。补贴能买来用户，但买不来习惯。

Qwen在开发者圈子里的口碑确实好，但把模型优势转化成产品优势，阿里走了很长一段弯路。

这种「模型很强但产品化一直差口气」的状态，可能是理解后面发生的事情的一个入口。

「团队没有跑路，我们还在」

在所有报道里，我翻到一个细节，挺能说明林俊旸是什么样的人。

之前千问的代码仓库因为GitHub的标注问题被误下架，网上一片恐慌，各种猜测满天飞。林俊旸直接出来回应：「团队没有跑路，我们还在。」

就这么一句话，没有官方声明模板，没有公关辞令，直接把事情说清楚了。

他的管理理念也挺有意思。他说过，做负责人「ego要小」——不要觉得自己无敌、能把所有事情做完。每个小团队负责人最重要的事就是「招比自己更强的人」，如果做不到这一点，「是很失败的」。

在AGI峰会上，当其他人聊模型能力的时候，他更关注客观限制：「美国的算力可能整体比我们大1到2个数量级。」他说国内企业的算力主要用于交付，而美国公司在用算力做下一代的研究。这不是一个喜欢报喜不报忧的人。

他团队里有很多00后。他说过，随着这代年轻人进来，中国AI领域的冒险精神在增强。

这些细节拼在一起，你大概能感觉到这是一个什么样的人——技术出身、性格直接、不太讲客套、更信逻辑而不是关系。这种人适合从0到1地搭东西，但未必适合在复杂的组织架构里做政治博弈。

不是他自己的选择

如果只看成绩单，你很难理解林俊旸为什么要走。

千问刚发了新模型，马斯克刚点了赞，全球第一的位置还坐着——按正常剧本，应该庆功、加薪、继续冲。

但千问的核心贡献者Chen Cheng在X上说了一句话：「离开似乎不是林俊旸自己的选择。」

似乎不是自己的选择。这句话的分量比什么分析都重。据晚点LatePost报道，有Qwen同事得知他将离职的消息后难掩情绪，「伤心地哭了」。

背后的直接原因，是通义实验室正在进行的一场组织调整。

简单说，阿里打算把Qwen团队从「垂直整合」改成「水平分工」。原来的千问团队是一个统一体，从预训练到后训练，从文本到多模态，一个团队端到端负责。现在要拆——预训练一个组，后训练一个组，文本一个组，多模态一个组。

林俊旸的管理范围，被缩小了。

这种拆法和他的技术理念直接冲突。他多次公开表达过，预训练、后训练和Infra团队应该「更紧密地结合和沟通」，而不是拆开各自为战。做大模型，他认为厨师得全程把控——从选材到烹饪到摆盘。公司觉得不行，选材的归选材，烹饪的归烹饪，流水线效率更高。

与此同时，阿里从外部引入了前DeepMind高级资深研究员周浩来接替后训练负责人的位置。据晚点报道，周浩是Gemini 3.0、DeepResearch等项目的关键贡献者，曾领导针对Gemini 3.0的多步骤强化学习——这恰恰是千问当前最需要补强的方向。一个从零搭建团队的人，看着外来的人带着更前沿的方法论接管自己搭建的东西——这种感受不难想象。

V2EX上有人说得挺扎心：「业务发展期强行提的P10，业务稳定后就守不住位置了。」

这话听着刺耳，但确实点到了一个结构性的问题。大厂在「攻城」阶段和「守城」阶段需要的人是不一样的。攻城的人被推到最高位，守城的时候就容易成为被优化的对象。不是能力不行，是公司进入了不同的阶段。

而且林俊旸不是一个人走的。同一天，后训练负责人郁博文也正式离职。Qwen Code负责人惠彬原早在1月就离开了，去了Meta。核心贡献者Kaixin Li发文告别。Binyuan Hui也跟着说了句「bye qwen, me too」。

不是一个人的离开，是一群人的散场。

一代人的命运

把视角拉远一点看，这不是千问一个团队的故事。

字节跳动的Seed团队，2025年走了7个研究骨干。乔思远去了Meta，姜璐去了Apple，冯佳时成了腾讯多模态团队的负责人。智谱AI半年内4名高管离职，包括副总裁和首席战略官。阿里通义实验室自己的NLP负责人、视觉负责人、语音负责人，也都先后离开了。

这一波人有个共同特征：大多是2019到2022年间加入公司的，赶上了大模型从零起步的黄金期。他们是亲手搭地基的人。

林俊旸、郁博文、惠彬原——还有个更具体的共同点：都是应届毕业直接进的阿里。据晚点报道，林俊旸2019年北大硕士毕业，郁博文2022年中科院博士毕业、当年的「阿里星」，99年出生的惠彬原2022年天津大学硕士毕业。三个人从零开始搭建，一路做到核心。不是空降的高管，不是挖来的大佬，是阿里自己培养出来的。

然后，阿里自己做了一轮组织调整，这批人就散了。

这不是谁对谁错的问题。大模型赛道从「技术叙事」进入了「商业化」阶段。公司开始算ROI了，开始问「开源到底能赚多少钱」了。千问的APP虽然春节期间靠补贴冲到了2亿月活，但开源模型本身几乎不产生授权收入，品牌认知也是刚刚才理顺。公司自然会想：是不是该换个打法了？

我之前写Dario Amodei那篇文章时说过一句话：「当信仰和生意完美对齐的时候，你无法分辨一个人到底是在坚持原则，还是在做精明的品牌定位。」放到这里也一样——当技术理想和公司战略对齐的时候，一切和谐美好。一旦出现分歧，走人往往是唯一的选项。

区别在于，AI行业的人才不愁去处。据晚点报道，在这次变动之前，已有多位投资人和大公司在接触林俊旸，有人期待他创业，有人给出工作offer。

所以「bye my beloved qwen」这句话，读起来有一种复杂的味道。不是悲情。更像是一个建造者对自己作品的告别——你倾注了3年心血做出的东西还在，还会继续跑，全球第一的位置大概率能保持一阵子。但你已经不是开它的人了。

留下的问题

千问不会因此垮掉。模型在那里，代码在那里，20万个衍生模型在全世界的服务器上跑着。3800亿砸下去，总会有新的人补上来。

但有些东西确实不一样了。

去年他们花了将近一年时间攻克Qwen3的三个核心难题：让强化学习框架稳定支撑长时序推理、平衡跨领域数据分布、强化多语言能力。这种过程靠的不是组织架构图上的汇报线，而是一群人真的相信同一件事。

现在这群人散了。千问可能在新的架构下反而跑得更快。水平分工在规模化阶段有它的道理。建造者和维护者本来就是两种角色，没有高下之分。

而林俊旸他们带走的东西——经验、直觉、踩过的坑——不管去了哪儿，都会继续发挥作用。人散了，能力不会消失，只是换了个地方生长。

32岁，全球第一，说走就走。