出品 | 网易智能

作者 | 辰辰

编辑 | 王凤枝

硅谷把AI科学家捧成明星,而中国把开发大模型做成了流水线。

近日,艾伦人工智能研究所研究员内森·兰伯特(Nathan Lambert)结束了一场36小时的中国AI连轴访问,智谱AI、月之暗面、清华、美团、小米、零一万物,一口气跑了六七家机构。他最后得出的结论并不是"中国AI有什么神秘捷径",而是它把大模型这件事做得更像一条高度协作的工程流水线。

在他看来,今天的大模型竞争,已经不只是比谁能提出一个天才想法,而是比谁能把数据清洗、架构微调、强化学习这些不性感的细节,一轮轮磨到极限。

打开网易新闻 查看精彩图片

一、拒绝"神化":把AI从神坛拉回流水线

在硅谷的叙事里,AI开发带有浓厚的"精英主义"色彩,顶级科学家被视为改变世界的先知。但兰伯特发现,中国实验室正在把这层"神性"剥掉,让AI开发回归严谨的系统工程。

· 执行力胜过自我意识: 硅谷的科研文化强调个人成名,这往往导致内耗。例如Meta的Llama团队曾因内部利益冲突而动荡,甚至有实验室需要支付重金才能平息研究员对技术路径的怨言。

· 集体主义的优势: 相比之下,中国研究者更愿意为了模型整体性能的"多目标优化"而搁置个人创意。这种甘于幕后打磨的特质,使得中国实验室在数据清洗、算法实现等琐碎但关键的环节上,展现出了极高的工程质量。

二、"去精英化"的奇迹:学生军与工程师红利

令这位硅谷研究员最震撼的,是中国实验室里那一张张年轻的面孔。跟OpenAI、Anthropic等拒绝实习生或将其边缘化的硅谷巨头不同,中国AI实验室的进步正由一支庞大的"学生军"深度驱动。

· 无负担的进化: 年轻学生没经历过往昔AI泡沫的洗礼,反而能更快吸收智能体、强化学习等前沿技术。

· "空杯"心态: 他们愿意舍弃固有假设,全身心投入模型的每一次微小提升。这种大规模、高素质的"人才红利",让中国在大语言模型的追赶赛中拥有了取之不尽的人力资源。

三、极致的实用主义:不谈哲学,只谈"所有权"与"商业终局"

在深度交流中,兰伯特发现了一个有趣的文化差异:当硅谷在为AI的长期社会风险和道德哲学争论不休时,中国研究员只是表现出一种"简单的困惑"。

在他眼中,中国的AI研究员更倾向于把自己定位为"建造者"而非"哲学家"。他们极少参与关于AGI能力的道德辩论,而是专注于如何造出更强的工具。

兰伯特还发现,业内正展开一场关于商业终局的博弈:AI究竟会重蹈SaaS的覆辙(止步于小众应用),还是会效仿"云模式"(成为通用的底层基础设施)?目前共识正向后者倾斜。这意味着AI将不再是可有可无的订阅工具,而是像电力一样不可或缺的生产要素,通过规模化的推理需求来重塑商业闭环。

这种对"云化"未来的预判,也解释了为何美团、蚂蚁集团等应用型巨头会亲自下场造模型。他们清醒地意识到LLM将是未来技术栈的核心,必须拥有"自主所有权"。

不同于部分西方实验室的封闭策略,中国实验室倾向于"开源优先"。这本质上也是实用主义的体现:通过开源迅速换取社区反馈、积累推理规模,在实战中快速反哺模型进化,强化自身的技术护城河。

四、起重机下的中国速度:算力约束下的生存最优解

短短36小时内,兰伯特连续走访了智谱AI、月之暗面、零一万物等多家明星独角兽。在北京的五道口和中关村,他感受到了不亚于旧金山湾区的竞争烈度,更洞察到了中国AI生态在硬件困境下的韧性。

· 对英伟达的"渴求"与华为的"突围": 兰伯特观察到一个有趣的现象,英伟达芯片仍是训练端无可争议的"金标准",各家实验室都在不计代价地通过各种渠道扫货储备算力。然而在推理端,华为等国产加速器却获得了出人意料的正面评价。许多顶尖实验室已大规模部署国产芯片处理推理任务,这种"训练靠外援、推理靠自给"的混合算力模式,正成为中国大模型维持迭代速度的底层支撑。

· 流动的生态系统: 这里的AI圈更像一个共生的生态系统,而非敌对的部落。尽管人才争夺激烈,同行之间保持着高度的尊重。

· 敏锐的开发者: 中国开发者展现出了极强的适应性。尽管环境受限,他们依然是Claude等前沿工具的深度使用者,并对DeepSeek等展现出极高工程品味的本土实验室推崇备至。

五、结语:全球均衡下的"建设者文化"

兰伯特在笔记的最后流露出一种深切的谦卑。他意识到,虽然硅谷依然在"从0到1"的领域引领风骚,但中国凭借对工程细节的极致磨练、极高的实用主义以及深度嵌入核心的年轻人才梯队,已经形成了一套西方决策模式极难模拟的运行逻辑。

在他看来,中国AI的崛起不应被简单视为"模仿",而是一场扎根于本土基建能量的工程进化。那种"必须掌控技术命脉"的渴望,正与中国宏大的建设文化交织在一起。兰伯特直言,作为美国人,他自然希望美国能捍卫其在开源与前沿领域的领导地位,但他也由衷担忧各种因素造成的隔阂会割裂这个全球化的技术共同体。

他最后感叹,中国实验室展现出的真诚与温情,让他意识到技术竞争之外更深层的连接。当硅谷继续追问星空深处,大洋彼岸脚踏实地的"建造者",也正在以自己的方式,为全球AI生态的未来书写不可或缺的一章。

打开网易新闻 查看精彩图片

以下为文章正文:

中国AI实验室实地见闻:走访头部厂商后的几点启示

当我疾驰在杭沪高铁上,窗外落日的余晖正勾勒出壮丽的山脊轮廓,风力发电机的剪影在天际线上错落有致;远方的群山、绵延的农田与拔地而起的摩天大楼群交相辉映。

这次中国之行令我深感谦卑。置身于一个如此陌生的国度,却能收获如此诚挚而热烈的欢迎,这种扑面而来的温情令我深受触动。我有幸结识了许多此前仅在屏幕另一端关注的AI圈同仁,他们的热情让我深刻意识到:无论是我的日常工作,还是整个AI生态系统,其本质早已是全球化的共同体。

一、中国研究者的心态

中国的大模型企业常被冠以技术"极致追随者"的称号。这一标签既植根于其深厚的教育与职场文化传统,也源自构建科技企业时那些细微却关键的路径抉择。从产出端(如支持智能体工作流的顶尖大模型)和投入端(如顶尖人才、海量数据、算力加速)来看,中美实验室在宏观上已极为接近。而真正持久的差异,实则隐藏在这些要素的组织范式与所面临的约束条件之中。

长期以来,我始终认为中国实验室之所以能如此迅速地跻身并紧跟全球技术前沿,很大程度上源于其文化特质与这项任务的高度契合。但在未与真人面对面交流之前,我一直持谨慎态度,不愿轻易将这种直觉定性为核心驱动力。而此次通过与中国顶尖实验室中许多卓越、谦虚且心态开放的科学家深度对话,我的诸多预判终于得到了印证。

如今,打造顶尖大语言模型(LLM)已在很大程度上演变为一场对极致细节的角力,从数据清洗、架构微调到强化学习(RL)算法的落地,整个技术栈都需经过丝丝入扣的打磨。模型性能的每一次微增都离不开对各环节的极限榨取,而将这些变量整合为一个有机整体,则是一项极其复杂的系统工程。在这个过程中,为了追求模型整体在多目标优化下的全局最优解,一些才华横溢的个体研究成果往往不得不做出牺牲,甚至被无限期搁置。

尽管美国研究者在攻克单点技术难题上同样出类拔萃,但美国文化更推崇"自我彰显"。这种环境下,科学家往往需要通过博取话语权来赢得成功;而当代大模型浪潮,也确实为"顶级AI科学家"开辟了一条通往名利双收的新路径。然而,这种文化也带来了直接的冲突。传闻中Llama团队的"分崩离析",很大程度上便是因为个人利益在层级体系中相互博弈,导致了沉重的内耗。我甚至听说过,某些实验室为了让顶尖研究员不再抱怨其个人想法被主模型舍弃,不得不支付一笔变相的"封口费"。无论传言真实性几何,其核心逻辑清晰可见:过强的自我意识和对个人晋升的执念,确实会成为打造顶尖模型的绊脚石。中美之间在这一文化倾向上的毫厘之差,最终会对结果产生显著影响。

这在某种程度上也源于中国AI研发团队的人才构成。一个显著的共性是:中国各大实验室的核心贡献者中,有着极高比例的在校生。这种极度年轻化的团队架构,让我想起了艾伦人工智能研究所(Ai2)的模式,学生被视为并肩作战的队友,并直接深度嵌入到大模型的核心研发链中。

这与美国顶尖实验室的氛围截然不同。像OpenAI、Anthropic甚至Cursor这样的公司,几乎不提供实习机会。而像谷歌等巨头虽然名义上设有与Gemini相关的实习岗位,但实习生普遍面临被边缘化的尴尬,他们很难触及核心技术,更像是游离于核心业务之外的旁观者。总结而言,这些细微的文化差异通过以下维度显著提升了模型构建能力:

· 甘于"幕后打磨": 研发人员更愿意为了追求模型最终性能的极致,去承担那些琐碎、枯燥且难以彰显个人名望的底层工作。

· 摆脱"历史包袱": 刚入行的研发新人未受过往AI炒作周期的思维束缚,能够更纯粹、更快速地拥抱现代新技术范式(对此,一位中国科学家深有共鸣)。

· 组织扩容的高效性: 较弱的个人英雄主义色彩降低了内部损耗,由于鲜有人执迷于钻营规则或博取私利,组织架构在快速扩张时更具协同效应。

· 强大的"确定性攻坚"能力: 拥有海量的工程人才储备,他们极度擅长将"已被证明可行"的技术路径,通过高强度的工程实践转化为确定性的成果。

这种更倾向于实用技能的特质,与长期以来外界对中国研究者的刻板印象形成了鲜明对比,即认为他们缺乏创造力,难以做出"从0到1"的开创性学术研究。在我们走访的一些偏学术性质的实验室中,许多负责人都谈到了要培养更具雄心的科研文化。但与此同时,也有一些技术领军人物对此持怀疑态度,他们认为短期内很难重塑这种科研范式,因为这涉及对教育和激励体制的彻底革新,而在当前的经济环境下,这种变革的代价过于沉重。因此,现有的文化似乎正源源不断地培养出大批极其擅长"大模型构建竞赛"的在校生和工程师。

这些在校生还向我透露,中国也正经历着与美国类似的"人才流失":许多原本志在学术道路的人,现在都转身投向了工业界的怀抱。最风趣的一段对话来自一位研究员,他曾渴望成为教授,以此深耕教育事业,但他随后感叹道,大模型似乎已经把教育问题给"解决"了。他自嘲说:"既然大模型什么都知道,学生们干嘛还来找我聊呢!"在校生的优势在于能以全新的视角看待LLM。在过去几年里,LLM的核心范式从扩展MoE(混合专家模型)转向扩展强化学习(RL),再到实现智能体(Agents)。要做好其中任何一项,都需要迅速从海量文献和公司的技术栈中吸收背景知识。学生们习惯于这样做,并且乐于放下所有关于"什么应该有效"的成见。他们全身心投入,为获得改进模型的一线机会而努力拼搏。

这些在校生还表现出一种神奇的直率,没有那些让科学家分心的"哲学清谈"。当问及对模型经济学或长期社会风险的看法时,很少有中国研究者对此有复杂的见解或施加影响的冲动。他们的角色就是构建最好的模型。

这种差异极为微妙,也极易被忽视或否认。但当你与一位谈吐优雅、英语流利且才华横溢的研究者进行深度长谈时,你会最真切地感受到:那些在西方被反复咀嚼的AI哲学命题,在这里往往会被一种"纯粹的困惑"所取代。对他们而言,去纠结那些形而上的哲学危机更像是一种"范畴错误"(Category error)。在探讨这些领域时,一位研究者甚至引用了斯坦福研究员王旦(Dan Wang)那个著名的论断:中国是工程师治国,而美国则是律师治国。这有力地佐证了他们内心深处那种构建技术的纯粹渴望。此外,中国并没有像Dwarkesh或Lex Fridman这种具备全球影响力的顶级播客,去系统性地为科学家们加冕"明星光环"。

当我试着引导中国科学家去谈论AI引发的经济动荡、超越通用人工智能(AGI)的终极命题,或是关于模型行为的道德辩论时,他们的反应折射出了其成长背景与教育经历的深刻烙印。他们对技术研究极度专注,因为成长环境并不鼓励对"社会结构应如何调整"这类宏大议题发表见解或展开辩论。

放大视角来看,北京的氛围与硅谷湾区如出一辙:竞争对手的实验室近在咫尺,步行或打车片刻即达。我刚下飞机,就在去酒店的途中顺道拜访了阿里巴巴北京总部。随后在短短36小时内,我们密集走访了生数科技、月之暗面、清华大学、美团、小米以及零一万物。在这里,叫一辆滴滴非常方便,如果你选了商务车,接你的往往是一辆配备了按摩座椅的纯电MPV。当我们向研究人员打听"人才战"时,他们表示这里的情况与美国惊人地相似:跳槽如同家常便饭,而大家最终选择投奔哪家实验室,很大程度上看哪里的"气场"最对味。

在中国,LLM社区给人的感觉更像是一个生态系统,而不是相互征伐的部落。在许多不具名的交流中,大家对同行充满尊重。所有的中国实验室都对字节跳动及其大火的"豆包"模型抱有敬畏,那是中国唯一的顶尖闭源模型。与此同时,大家也对深度求索(DeepSeek)充满敬意,认为它是执行中极具"研究品味"的实验室。相比之下,在美国非正式会面时,同行间的火药味往往更浓。

中国研究者谦逊感最显著的体现是,他们对业务端往往表现出"事不关己"的态度,认为这不是他们的问题;而美国人似乎对各种生态层级的产业趋势,从数据供应商到算力或融资,都表现得极度痴迷。

二、中国AI产业与西方实验室的异同

如今构建AI模型之所以有趣,是因为它不再只是把一群优秀的研究员关在楼里搞出个工程奇迹。过去或许如此,但为了维持AI商业模式,LLM正成为构建、部署、融资和获取用户这几者的混合体。领先的AI公司存在于复杂的生态系统中,由资金、算力、数据等要素供养,以持续推向前沿。

以Anthropic和OpenAI为代表的西方生态系统对于如何整合这些要素已有了一套清晰的范式。因此,中国实验室在思维定式上展现出的巨大差异,预示着中美企业可能在未来做出截然不同的战略押注。当然,这些愿景最终能在多大程度上实现,很大程度仍受限于资金红利与算力供给。

与这些实验室交流后,我在"AI产业"层面最大的几点收获如下:

1. AI需求的早期迹象: 坊间盛行一种假设,由于中国公司不习惯为软件付费,这会导致中国AI市场的天花板较低,进而无法支撑起实验室所需的庞大推理市场。但这种看法仅适用于SaaS生态,中国的SaaS市场确实历来微不足道。然而,硬币的另一面是中国拥有规模惊人的云服务市场。当前一个悬而未决、且令中国实验室反复争论的关键点在于:企业的AI支出究竟会重蹈SaaS的覆辙(止步于小众应用),还是会效仿云模式(成为底层的通用基础设施)?目前看来,AI的发展势头更趋近于云模式,业内并无多少人担心市场会因为新技术工具的涌现而出现萎缩。

2. 大多数开发者是"Claude粉": 尽管Claude在名义上并未对中国开放,但国内绝大多数AI开发者都对其推崇备至,甚至陷入了某种"痴迷",他们惊叹于Claude彻底重塑了软件开发的工作流。虽然中国市场在软件付费上向来谨慎,但我并不认为这会阻碍推理需求的爆发式增长。中国技术人员那种务实、谦逊且充满干劲的状态,足以打破任何不愿消费的陈旧惯例。

有些研究者提到会使用本土工具(如Kimi或GLM的命令行界面),但几乎所有人在谈到实际开发工作时,都会首选Claude。令人意外的是,在硅谷湾区正大红大紫的Codex,在这里却鲜有人提及。

3. "技术自主权"至上的心态: 中国的文化基因与轰鸣的经济引擎交织,催生出了一系列不可预知的成果。我有一种强烈的预感:中国大模型层出不穷的现状,其实反映了本土科技企业在务实驱动下达成的一种动态平衡。这里并没有所谓的"宏伟蓝图",整个行业的格局主要取决于对字节跳动和阿里巴巴的敬畏,人们普遍预测,这两家巨头将凭借碾压级的资源收割大部分市场份额。而DeepSeek是公认的技术风向标,却远非市场霸主:他们指引了技术方向,但在商业变现上并非赢家。

正因如此,美团或蚂蚁集团等公司的加入显得格外有趣,西方观察者或许会惊讶于这类应用型企业竟然也在亲自下场造模型。实际上,他们深知LLM将是未来所有科技产品的内核,因此必须掌握坚实的底层技术。通过打磨自有的强大通用模型,他们不仅巩固了自身的技术护城河,还避免了受制于外部开源社区的演进节奏,并能针对核心业务保留独家的内测版本。这种"开源优先"的行业心态本质上是实用主义的体现,它既能让模型通过社区反馈快速进化,又能回馈生态,从而更好地完成企业自身的技术使命。

4. 政府支持确实存在,但具体边界模糊: 外界普遍认为中国政府正在全力助推开源大模型竞赛。然而,各级政府之间其实并没有一份统一的"行动剧本"。以北京为例,各个区甚至在互相竞争,抢夺优质科技公司入驻。政府提供的"助力"几乎可以肯定包含扫清审批门槛、打破壁垒等软性支持,但其介入深度究竟如何?政府在多大程度上能左右人才流向?能否在芯片困境上出奇招?在走访过程中,政府的关注与扶持被反复提及,但由于缺乏具体细节,目前尚难定论政府究竟在多大程度上改写了中国AI的发展轨迹。

当然,目前没有任何迹象表明政府干预了模型的具体技术路径或决策。

5. 数据产业尚处起步阶段: 早前听说Anthropic或OpenAI会为单个训练环境斥资千万美元,每年在强化学习(RL)前沿领域的投入更是累计高达数亿美金。因此,我们非常好奇中国实验室究竟是直接购买美国的成熟环境,还是由国内类似的生态系统提供支持。得到的答案是:中国国内并非没有数据产业,但研究者普遍认为现有第三方服务的质量堪忧。相比之下,他们更倾向于在内部自建环境或处理数据。研究人员会投入大量精力亲自打造RL训练环境,而像字节跳动和阿里巴巴这样的大厂,则通常依赖内部的标注团队。这再次印证了前文提到的那种"自力更生,拒绝外包"的务实心态。

6. 对英伟达芯片的极度渴求: 英伟达的算力是模型训练当之无愧的"金标准",各家的研发进度无一不受限于手头的芯片储备。只要渠道通畅,这些实验室显然会不惜代价地全盘扫货。相比之下,以华为芯片为代表的国产加速器在推理端获得了不少正面评价,许多实验室也已经大规模部署了华为芯片。

三、结语:全球均衡

在开启这次旅程之前,我对中国知之甚少;而此行结束,我发现自己才刚刚叩开了解她的大门。中国并非一个可以用既定规则或公式来定义的模板,这里有着截然不同的运行逻辑与内在张力。这片土地的文化如此底蕴深厚,且早已深深植根于本土技术的构建逻辑之中。前路漫漫,我尚需虚心求教。

当前,美国许多决策机构都将他们对中国的固有认知,视为制定决策的核心思维工具。然而,在亲自走访并深度交流了中国几乎所有顶尖AI实验室后,我意识到:中国拥有的许多特质与直觉,是西方决策模式极难模拟的。即便我开诚布公地询问这些实验室为何选择开源其顶尖模型,我依然难以完全理解那种"技术自主权意识"与"对生态系统的真诚支持"是如何完美融合在一起的。

这里的实验室表现得极为务实,也并不是每个模型都会公之于众。但在扶持开发者、构建生态系统,并借此深度复盘以反哺模型研发方面,他们展现出了极具前瞻性的战略定力。

几乎每一家中国科技巨头都在自研通用大模型,正如我们所见,连生活服务平台美团和综合性消费电子巨头小米都发布了开源权重模型。换作是美国的同类企业,多半只会选择购买现成的服务。这些公司之所以亲自下场搞LLM,并非为了盲目跟风,而是源于一种骨子里的渴望,即必须绝对掌控自己的技术栈,将时代最核心的技术命脉握在自己手中。每当我从电脑前抬头,望向地平线上成群结队的塔吊,我便深切感受到:这种"死磕"底层技术的狂热,正契合了中国那种更为宏大的建设文化与基建能量。

中国研究者展现出的人格魅力、真诚与温情,具有极强的感染力。在个人交往中,我发现美国那种剑拔弩张的地缘政治叙事,并未在他们身上留下痕迹。这个世界需要更多这样纯粹的正能量。作为AI共同体的一员,相比于技术竞争,我如今更担心的是由于国籍标签而在不同成员与团体之间造成的隔阂与裂痕。

若是声称我不希望美国实验室在AI技术栈的各个领域(尤其是开源模型)保持绝对领先,那我纯属虚伪,毕竟我是美国人,这是我最直率的立场。但与此同时,我也由衷希望全球开源生态能蓬勃发展,因为唯有如此,才能为全世界创造更安全、更普惠、更有价值的AI。而当下的悬念在于,美国实验室是否会真正采取行动,去捍卫这份领导地位。

就在我收笔之际,关于限制开源模型的美国行政命令正传得沸沸扬扬。这可能会进一步割裂美国领导力与全球生态系统之间的协同效应,实话说,这并没能给我多少信心。

衷心感谢月之暗面、智谱、美团、小米、通义千问、蚂蚁灵境、零一万物等机构中与我交流的诸位同仁。感谢每一位的热情接待,以及你们慷慨分享的时间。随着我对中国文化与AI产业的思考日益清晰,我将继续分享我的见解。毋庸置疑,这些观察与见解将与正处在AI前沿风口浪尖的时代巨变息息相关。