3月2日,阿里千问发布了Qwen3.5小尺寸模型系列。马斯克在X上点了赞,评价说「令人惊叹的智能密度」。
林俊旸感谢了马斯克的关注。
第二天下午,他向阿里提交了辞职申请。
3月4日凌晨,他发了一条推文:
"me stepping down. bye my beloved qwen."
24小时。从全球瞩目到转身离场。
一个语言学学生的意外路线
其实在所有标签里面,我觉得最有意思的一个,大多数报道反而没怎么展开。
林俊旸是北大计算机本科,这没什么稀奇。但他的硕士,读的是语言学——正儿八经的外国语学院语言学与应用语言学,不是CS方向的NLP。
一个学语言学的人,后来成了全球使用量最大的开源大语言模型的技术负责人。
这个路径倒过来想就很有趣了。大语言模型的本质是什么?是对人类语言的建模。绝大多数做LLM的人从计算机科学出发,先懂算法再学语言规律。林俊旸反过来——他同时理解语言本身的结构,又有计算机的工程能力。
2020年GPT-3发布后,阿里达摩院内部调兵遣将。恰恰是因为他这个「语言学+技术」的复合背景,被分配到了周靖人领导的智能计算实验室,成为M6模型团队的核心开发者。
这个分配决定了后面所有的事情。
93年出生,2019年硕士毕业直接进阿里达摩院。没有读博,没有海外经历,纯粹的本土培养路线。然后一路狂飙——M6(共同一作)、OFA(One-For-All)、Chinese CLIP,在多模态预训练领域都是里程碑式的工作。Google Scholar被引量超过4万次。
2022年底,达摩院AI团队并入阿里云成立通义实验室,林俊旸被任命为通义千问的技术负责人。
那年他29岁,成了阿里巴巴最年轻的P10级技术专家。阿里的技术体系里,很多工程师干了十几年也到不了P10。他用了3年。
去年的AGI-Next峰会上,他和杨植麟、姚顺雨、唐杰同台,被媒体称为「基模四强」。四个人代表了中国基础大模型的主要力量。那个场景现在回看,多少有些唏嘘。
全球第一,但全球第一的另一面
从2022年底接手到2026年初离开,林俊旸带着千问走了大概3年。
这3年的成绩单,数字说得比人清楚:在HuggingFace上,Qwen的衍生模型数量突破了20万个,总下载量超过3亿次,超越了Meta的Llama,成为全球被使用最多的开源模型。旗舰版Qwen3-Max超万亿参数,在多个权威评测中跻身全球前三,和GPT-5、Claude掰手腕。
注意,这里说的「全球第一」是指生态第一。全世界最多人下载、最多团队基于它做二次开发的开源模型。某种意义上,这个「第一」的含金量比跑分更高。
而且产品侧也终于打起来了。千问APP在2026年初经历了爆发式增长。1月月活突破1亿,春节期间DAU峰值飙到7352万,到2月月活已经达到2.03亿,增速552%全球第一,总量排全球第三。
我去年11月写过一篇「横扫硅谷的千问,杀回国内了」,当时Airbnb的CEO说他们大量依赖千问模型,「比OpenAI更好更便宜」。一个中国团队做的开源模型,被硅谷公司当核心基础设施在用。
但如果你从2024年一直跟到现在,会发现「全球第一」这个头衔,其实藏着一些微妙的东西。
2024年的时候,Qwen确实是开源世界的领头羊,没什么争议。但2025年DeepSeek爆发之后,整个格局变了。Kimi K2开源了,GLM-5开源了,MiniMax M2.5也开源了。开源不再是Qwen的独家优势,国内大模型的竞争格局变成了「一超三强」——DeepSeek一骑绝尘,Qwen、GLM、Kimi各有强项。
Qwen的位置变得有点微妙。它依然是全球下载量最大的开源模型,衍生模型数量也是全球第一。很多团队拿Qwen当基座来做进一步训练——Cursor的Composer模型被发现思考过程会输出中文,有国产模型微调的痕迹;DeepSeek-R1也有基于Qwen的蒸馏版本。
某种意义上,Qwen成了AI世界的「Android」——底层无处不在,但品牌感知反而不那么强烈。
在具体赛道上也是这样。Qwen采取的是「饱和式发布」策略——各种尺寸、各种模态不断往外放,从0.6B到235B,从文本到视觉到语音,全覆盖。开发者生态的优势确实大,但也给人一种什么都做、什么都不够极致的感觉。AI Coding领域Kimi K2的声量更大,多模态世界模型方向Gemini 3系列走得更远。Qwen什么都有,但没有一个赛道是让人第一时间联想到它的。
产品侧的问题更明显。模型叫Qwen,产品叫通义,C端APP又叫通义千问——三个名字指向同一个东西但侧重不同,品牌认知一直是割裂的。直到2025年11月APP才改名「千问」,而阿里正式把所有AI品牌统一为「千问」,是2026年3月2日的事——对,就是林俊旸提辞职的前一天。
开发者生态和消费者市场之间的鸿沟,千问一直没有完全填上。APP月活突破2亿是这个春节靠30亿补贴砸出来的,留存率还是个问号。晚点小数据做过一张春节期间AI应用对比图,很能说明问题:千问DAU在2月6日开始砸30亿补贴后冲到高点,但不发红包的DeepSeek反而用户黏性最强——日均使用时长16分钟,远超其他三家。补贴能买来用户,但买不来习惯。
Qwen在开发者圈子里的口碑确实好,但把模型优势转化成产品优势,阿里走了很长一段弯路。
这种「模型很强但产品化一直差口气」的状态,可能是理解后面发生的事情的一个入口。
「团队没有跑路,我们还在」
在所有报道里,我翻到一个细节,挺能说明林俊旸是什么样的人。
之前千问的代码仓库因为GitHub的标注问题被误下架,网上一片恐慌,各种猜测满天飞。林俊旸直接出来回应:「团队没有跑路,我们还在。」
就这么一句话,没有官方声明模板,没有公关辞令,直接把事情说清楚了。
他的管理理念也挺有意思。他说过,做负责人「ego要小」——不要觉得自己无敌、能把所有事情做完。每个小团队负责人最重要的事就是「招比自己更强的人」,如果做不到这一点,「是很失败的」。
在AGI峰会上,当其他人聊模型能力的时候,他更关注客观限制:「美国的算力可能整体比我们大1到2个数量级。」他说国内企业的算力主要用于交付,而美国公司在用算力做下一代的研究。这不是一个喜欢报喜不报忧的人。
他团队里有很多00后。他说过,随着这代年轻人进来,中国AI领域的冒险精神在增强。
这些细节拼在一起,你大概能感觉到这是一个什么样的人——技术出身、性格直接、不太讲客套、更信逻辑而不是关系。这种人适合从0到1地搭东西,但未必适合在复杂的组织架构里做政治博弈。
不是他自己的选择
如果只看成绩单,你很难理解林俊旸为什么要走。
千问刚发了新模型,马斯克刚点了赞,全球第一的位置还坐着——按正常剧本,应该庆功、加薪、继续冲。
但千问的核心贡献者Chen Cheng在X上说了一句话:「离开似乎不是林俊旸自己的选择。」
似乎不是自己的选择。这句话的分量比什么分析都重。据晚点LatePost报道,有Qwen同事得知他将离职的消息后难掩情绪,「伤心地哭了」。
背后的直接原因,是通义实验室正在进行的一场组织调整。
简单说,阿里打算把Qwen团队从「垂直整合」改成「水平分工」。原来的千问团队是一个统一体,从预训练到后训练,从文本到多模态,一个团队端到端负责。现在要拆——预训练一个组,后训练一个组,文本一个组,多模态一个组。
林俊旸的管理范围,被缩小了。
这种拆法和他的技术理念直接冲突。他多次公开表达过,预训练、后训练和Infra团队应该「更紧密地结合和沟通」,而不是拆开各自为战。做大模型,他认为厨师得全程把控——从选材到烹饪到摆盘。公司觉得不行,选材的归选材,烹饪的归烹饪,流水线效率更高。
与此同时,阿里从外部引入了前DeepMind高级资深研究员周浩来接替后训练负责人的位置。据晚点报道,周浩是Gemini 3.0、DeepResearch等项目的关键贡献者,曾领导针对Gemini 3.0的多步骤强化学习——这恰恰是千问当前最需要补强的方向。一个从零搭建团队的人,看着外来的人带着更前沿的方法论接管自己搭建的东西——这种感受不难想象。
V2EX上有人说得挺扎心:「业务发展期强行提的P10,业务稳定后就守不住位置了。」
这话听着刺耳,但确实点到了一个结构性的问题。大厂在「攻城」阶段和「守城」阶段需要的人是不一样的。攻城的人被推到最高位,守城的时候就容易成为被优化的对象。不是能力不行,是公司进入了不同的阶段。
而且林俊旸不是一个人走的。同一天,后训练负责人郁博文也正式离职。Qwen Code负责人惠彬原早在1月就离开了,去了Meta。核心贡献者Kaixin Li发文告别。Binyuan Hui也跟着说了句「bye qwen, me too」。
不是一个人的离开,是一群人的散场。
一代人的命运
把视角拉远一点看,这不是千问一个团队的故事。
字节跳动的Seed团队,2025年走了7个研究骨干。乔思远去了Meta,姜璐去了Apple,冯佳时成了腾讯多模态团队的负责人。智谱AI半年内4名高管离职,包括副总裁和首席战略官。阿里通义实验室自己的NLP负责人、视觉负责人、语音负责人,也都先后离开了。
这一波人有个共同特征:大多是2019到2022年间加入公司的,赶上了大模型从零起步的黄金期。他们是亲手搭地基的人。
林俊旸、郁博文、惠彬原——还有个更具体的共同点:都是应届毕业直接进的阿里。据晚点报道,林俊旸2019年北大硕士毕业,郁博文2022年中科院博士毕业、当年的「阿里星」,99年出生的惠彬原2022年天津大学硕士毕业。三个人从零开始搭建,一路做到核心。不是空降的高管,不是挖来的大佬,是阿里自己培养出来的。
然后,阿里自己做了一轮组织调整,这批人就散了。
这不是谁对谁错的问题。大模型赛道从「技术叙事」进入了「商业化」阶段。公司开始算ROI了,开始问「开源到底能赚多少钱」了。千问的APP虽然春节期间靠补贴冲到了2亿月活,但开源模型本身几乎不产生授权收入,品牌认知也是刚刚才理顺。公司自然会想:是不是该换个打法了?
我之前写Dario Amodei那篇文章时说过一句话:「当信仰和生意完美对齐的时候,你无法分辨一个人到底是在坚持原则,还是在做精明的品牌定位。」放到这里也一样——当技术理想和公司战略对齐的时候,一切和谐美好。一旦出现分歧,走人往往是唯一的选项。
区别在于,AI行业的人才不愁去处。据晚点报道,在这次变动之前,已有多位投资人和大公司在接触林俊旸,有人期待他创业,有人给出工作offer。
所以「bye my beloved qwen」这句话,读起来有一种复杂的味道。不是悲情。更像是一个建造者对自己作品的告别——你倾注了3年心血做出的东西还在,还会继续跑,全球第一的位置大概率能保持一阵子。但你已经不是开它的人了。
留下的问题
千问不会因此垮掉。模型在那里,代码在那里,20万个衍生模型在全世界的服务器上跑着。3800亿砸下去,总会有新的人补上来。
但有些东西确实不一样了。
去年他们花了将近一年时间攻克Qwen3的三个核心难题:让强化学习框架稳定支撑长时序推理、平衡跨领域数据分布、强化多语言能力。这种过程靠的不是组织架构图上的汇报线,而是一群人真的相信同一件事。
现在这群人散了。千问可能在新的架构下反而跑得更快。水平分工在规模化阶段有它的道理。建造者和维护者本来就是两种角色,没有高下之分。
而林俊旸他们带走的东西——经验、直觉、踩过的坑——不管去了哪儿,都会继续发挥作用。人散了,能力不会消失,只是换了个地方生长。
32岁,全球第一,说走就走。
在AI这个行业里,也许这就是某种正常。
热门跟贴