整理 | 屠敏
出品 | CSDN(ID:CSDNnews)
“所有中国实验室都忌惮字节跳动及其热门模型豆包,因为它是中国唯一一家处于前沿的闭源实验室;几乎所有实验室都对 DeepSeek 怀有高度敬意,认为其在工程落地与研究品味方面表现出色。”
“中国技术人员务实、谦逊、有冲劲。”
“在中国接触到的几乎每一位 AI 研究员,都提到了同一个痛点:企业缺乏训练和运行 AI 模型所需的高端算力资源。”
“应对这一困境的办法,是极度努力地工作,还有就是更早、更快推进产品化。”
“中国的大模型社区,更像一个协同生态,而非互相敌对的阵营。”
这些评价,并非来自行业内部的自我总结,而是一次高密度中国 AI 实地走访后的真实观察。
近日,艾伦人工智能研究所(AI2)研究员 Nathan Lambert,联合 ChinaTalk 执行编辑 Lily Ottinger、Understanding AI 记者 Kai Williams 以及 ChinaTalk 创始人 Jordan Schneider 等人,用 10 天时间密集走访了北京、杭州、上海、深圳等地的十余家中国头部 AI 实验室与科技机构,包括 DeepSeek、字节跳动、月之暗面(Moonshot AI)、智谱AI(Z.ai)、美团、小米、01.ai、通义千问、蚂蚁灵犀、宇树等。
而在这趟走访结束后,他们得出了一个鲜明判断:在算力仍受限制的背景下,中国 AI 公司正在依靠高强度工程投入、极快的产品迭代速度,以及高度务实的落地思维,迅速缩小与全球顶尖模型之间的差距。
以下内容整理自 Lily Ottinger 和 Nathan Lambert 观察实录。
外部观察:中国 AI 研究者的困境与突围
“在中国接触到的几乎每一位 AI 研究员,都提到了同一个痛点:企业缺乏训练和运行 AI 模型所需的高端算力资源。”Lily Ottinger 在文章中写道。
在走访团队看来,中国并不缺顶尖 AI 人才,也不缺大规模数据,真正稀缺的,是能够持续支撑前沿模型训练的高端 GPU 资源。
尽管英伟达 CEO 黄仁勋曾,中国企业已经拥有足够算力,但 Lily Ottinger 提到,“我们接触的中国研究员,没有一个人真正相信这件事。”
不过,比“缺 GPU”本身更让走访团队印象深刻的,是中国 AI 团队面对这一现实后的工作状态。
Lily Ottinger 表示,即便算力受限,但像月之暗面、MiniMax、智谱 AI 等实验室依然笃信 AGI 愿景。对于许多研究员而言,AGI 更像是一种长期信仰。
而应对资源限制,中国研究者也采用了自己的方式方法:
一是“极度努力地工作”。在五一假期和周末期间,Lily Ottinger 直言道,在多家实验室看到,大量研究员依然留在工位上:站立式办公桌前坐满人,各类含糖、含咖啡因饮料堆满桌面。
二是中国大模型公司还比西方同行更早推进产品化。许多中国企业推出编码方案,用慷慨的 token 额度吸引用户从 Claude Code 转向自家产品;同时也在探索更细分的产品方向。如 MiniMax 打造了高营收的 AI 陪伴产品;智谱 AI 则与社交媒体、中国商飞等企业达成 B 端合作;阿里旗下的蚂蚁集团深耕 AI 医疗服务。
不过,一个颇具反差感的细节是:即便商业化已经成为现实压力,许多实验室更愿意谈研究、谈 AGI、谈智能体编码。Lily Ottinger 称,在 MiniMax 的演示中,占据其最大收入来源的 AI 陪伴业务,也只是被轻描淡写地带过。
而在共同追赶 AGI 的氛围之外,竞争同样异常激烈。
Lily Ottinger 提到,她对中国 AI 行业的感受,与 Nathan Lambert 略有不同。“中国 AI 实验室之间,确实存在非常强烈的竞争氛围。”
在走访团队看来,中国 AI 行业接下来很可能会像中国新能源汽车行业一样,经历长期、高强度的洗牌与淘汰。只是对于仍留在牌桌上的团队来说,AGI 依旧是那个被反复提起、也被反复相信的终点。
加入 AMD AI 开发者计划,免费领 50 小时云算力券
进群月月抽显卡、AIPC,好运不停!
中国实验室的优势是什么?
相比 Lily Ottinger 对“高强度投入”与“快速产品化”的直观感受,艾伦人工智能研究所(AI2)研究员 Nathan Lambert 则给出了另一视角的观察结果。
Nathan Lambert 在博客中写道,打造大语言模型的中国企业,堪称这一技术领域“完美的快速跟进者”。
“单看产出——支撑智能体工作流的最新、最大规模模型,再看核心要素——顶尖科学家、海量数据、加速计算,中美实验室看上去大体相似。真正持久的差异,体现在组织方式与运行逻辑上。”Nathan Lambert 坦言,他过去一直认为,中国实验室擅长追赶前沿,很大程度上源于文化与这一目标高度契合。但在真正与一线研究人员长时间交流之前,他并不愿意轻易下结论。而与中国头部实验室那些“优秀、谦逊、开放的科学家”交流后,他的许多想法得到了印证。
Nathan Lambert 表示,如今打造顶尖大模型,高度依赖全栈式精细化工作——从数据、架构细节到强化学习算法实现,每一环都能带来提升,而将这些环节整合在一起是一个复杂过程,“为了让模型实现多目标优化的整体最大化,一些才华横溢的个人成果甚至需要被暂时搁置”。
相比之下,他认为美国研究者在解决单个模块问题上同样非常优秀,但美国文化更强调“为自己发声”。作为科学家,主动为自己的工作争取关注,更容易获得成功;而当前行业环境,也在不断强化“AI 顶尖研究员”这种成名路径,而这这直接引发一些内部冲突。
他甚至提到,有传言称 Meta 的 Llama 团队,正因为个人利益与层级化组织之间的内耗而面临问题。“我还听说,有些实验室甚至需要花钱安抚顶尖研究员,才能让他们不再抱怨自己的想法没被纳入最终模型。无论传言是否完全属实,核心逻辑很清晰:自我意识与职业晋升欲,会阻碍打造最优模型。中美在这种文化上的细微差异,足以对最终成果产生显著影响。”
而中国实验室的另一大特点,是团队极度年轻化。
Nathan Lambert 观察到,中国许多大模型团队的核心贡献者中,都有相当比例是在读学生。“这些团队非常年轻,让我想起了 AI2 机构的模式 —— 学生被视为平等伙伴,直接融入大模型团队。这与美国顶尖实验室截然不同:OpenAI、Anthropic、Cursor 等机构基本不提供实习岗位;谷歌等公司虽名义上有与 Gemini 相关的实习,但实习生普遍担心自己被隔离在核心工作之外,无法接触真实项目。”
在 Nathan Lambert 看来,这种文化差异,让中国团队在模型打造上形成了几项独特优势:
第一,更愿意为了最终模型效果,去做那些“不够亮眼但极其关键”的基础工作;
第二,刚进入 AI 领域的新人没有过往 AI 热潮周期的思维包袱,能更快适应现代新技术;
第三,自我意识相对更弱,组织架构更容易扩张,减少了钻制度空子的内耗;
第四,人才储备极其庞大,且非常擅长基于已有验证方案快速解决问题。
这种能力倾向,也与“中国研究者缺乏 0 到 1 原始创新”的刻板印象形成了反差。
Nathan Lambert 提到,一些偏研究导向的中国实验室,已经开始主动培养更具野心的科研文化。但不少技术负责人也坦言,短时间内想完成这种转型并不容易,因为这意味着要重构整个教育与激励体系。
“把模型做到最好”,是很多人的唯一目标
该走访团队还发现,中国 AI 研究者普遍展现出一种极度务实的工程师气质。
过去几年,大模型的发展路径已经从混合专家模型(MoE)规模化,转向强化学习(RL)规模化,再到智能体能力落地。做好任何一环,都需要快速吸收大量论文、实验结果与内部技术栈知识。
Nathan Lambert 认为,许多学生研究员恰恰非常适应这种节奏。“他们愿意放下所有预设,全身心、竭尽所能投入优化模型。”
与此同时,中国研究者普遍对宏大叙事、哲学争论或 AI 道德讨论兴趣不高。
当他们被问及模型对经济、社会与长期风险的影响时,大多数研究者并不会给出复杂观点,也没有强烈意愿介入这些议题。
“他们的定位很清晰:把模型做到最好。”Nathan Lambert 写道。
他还提到,当话题转向 AI 哲学层面的问题时,不少中国研究者甚至会显得有些困惑,因为他们更习惯将 AI 看作工程问题,而不是思想实验。
有研究者引用了科技评论人 Dan Wang 的一句话:“中国由工程师治理,而美国由律师治理。”这也体现在整个行业氛围之中。
Nathan Lambert 发现,中国的大模型社区,更像一个协同生态,而非彼此敌对的阵营。
“在多次非公开交流中,研究者们对同行只有尊重。”他写道。
Nathan Lambert 还特别对比了中美实验室的差异:“在美国,非公开场合聊起同行时,往往火药味十足。”
此外,「中国研究者谦逊最突出的一点,是他们普遍不关心商业层面,直言 “这不是我的问题”;而美国从业者几乎都痴迷于各种生态级产业趋势 —— 从数据供应商、算力到融资。」Nathan Lambert 表示。
不同赛道的中国 AI 力量
字节跳动:所有人都忌惮豆包
在走访多家中国 AI 实验室后,Lily Ottinger 与 Nathan Lambert 都认为,字节跳动的综合实力,是其他实验室暂时难以企及的。
Lily Ottinger 提到,字节跳动的大模型豆包是中国最受欢迎的聊天机器人,月活近 3.5 亿。豆包支持多种方言,这需要强大的语音模型 —— 因为普通话、粤语之外的中国方言大多没有文字形式(对比之下,GPT 的语音模式仍由 GPT-4o 驱动)。
相比单纯追求模型智力水平,字节跳动更强调用户留存与产品体验。
一位模型创业者甚至直言:“和字节比,我们全是中型玩家。”
而 Nathan Lambert 对字节的评价则更加直接,「所有中国实验室都对字节跳动及其热门模型豆包保持警惕——它是中国唯一一家处于前沿的闭源实验室。与此同时,所有实验室都对 DeepSeek 极度敬重,认为其在工程落地与研究品味方面表现出色。」
宇树科技与银河通用:机器人赛道的两面
机器人,被走访团队视为中国 AI 野心进入物理世界的重要载体。
Lily Ottinger 提到,在中国“AI+”战略推进之前,很多地方长期认为“只有硬件才算真正科技”,这也导致大量大模型公司纷纷成立机器人部门。
但在她看来,真正的例外是宇树科技。宇树总部位于杭州,创始人并无海外名校背景,却依靠硬件创新快速崛起,并以极低成本实现了机器人产品的量产与盈利。
她发现,宇树研究员同样在高强度工作,但相比 AGI 实验室,他们并没有那种被“通用人工智能愿景”驱动的强烈氛围。“对于宇树来说,AGI 的定义就像鱼需要自行车一样无关紧要。”Lily Ottinger 在文中这样形容。
另一家机器人企业银河通用,则向该走访团队展示了其自动化仓储系统:机器人能够根据 App 订单,自动分拣感冒药、隐形眼镜并完成打包。银河通用称,其在 2025 年已完成超过 100 万单配送,其中约 20% 来自夜间传统药店关闭后的即时需求。而这些场景,并不需要所谓“超人类智能”,更多依赖的是工程集成能力与产业落地能力。
小米:年轻且务实的团队
小米给这群西方研究者团队留下的印象,是“年轻且务实”。
Lily Ottinger 提到,他们接触的小米研究员几乎全部是博士生。据介绍,小米 LLM 团队约 80% 为在读博士,平均年龄只有 25 岁。
她还观察到,小米研究员几乎都穿着黑色衣服,整个办公环境也保持着极简的黑色风格。
甚至连卫生间采用的都是蹲便器,“显然公司内部有人对此非常坚持”。
ModelScope:中国版 Hugging Face
开源,被走访团队认为是中国 AI 生态的重要底色。Lily Ottinger 表示,阿里旗下的 ModelScope,则被视作“中国版 Hugging Face”。
Lily Ottinger 形容,这里有懒人沙发、潮流公告板与开放式交流空间,是整个走访过程中“最酷的办公室”。
中国 AI 产业与西方实验室的异同
在 Nathan Lambert 看来,如今打造 AI 模型,已经不再只是“把一群聪明研究员关进一栋楼里,造出工程奇迹”。
AI 公司正逐渐演变成一个融合研发、部署、融资、推广与生态协同的复杂系统。而这也让中国 AI 产业与西方实验室之间,出现了越来越明显的差异。
Nathan Lambert 根据自己的观察以及与中国 AI 实验室的交流,总结出了最核心的几点:
1. 国内 AI 需求已现早期迹象
外界常有一种说法:中国企业不习惯为软件付费,因此 AI 市场规模会很小,无法支撑起庞大的推理市场。但这只适用于 SaaS 模式 —— 中国 SaaS 市场历来很小,而云计算市场体量巨大。一个关键且尚无答案的问题(中国实验室内部也在争论):企业 AI 支出会追随小众的 SaaS 市场,还是刚需的云计算市场?
总体来看,AI 更倾向于贴近云计算,没有人真正担心新工具的市场增长。
2. 绝大多数开发者都是 Claude 忠实用户
尽管 Claude 在中国被限制使用,但中国 AI 开发者几乎都痴迷于它,深受其开发模式影响。中国历来对购买软件谨慎,但这并不代表推理需求不会爆发。中国技术人员务实、谦逊、有冲劲—— 这种特质,比不付费的旧习惯更有力量。
部分中国研究者会使用 Kimi、GLM 等自研工具,但所有人都在用 Claude 开发。他们极少提及 Codex,而这款工具在硅谷正快速流行。
3. 中国企业拥有强烈的技术自主心态
中国文化与强劲的经济动力结合,产生了难以预测的结果。Nathan Lambert 表示,自己深刻感受到,众多 AI 模型,是当下中国科技企业务实选择的平衡结果。行业没有统一的 “总体规划”,但普遍敬重字节跳动、阿里这类巨头 —— 它们手握充足资源,有望在各大市场占据大量份额。DeepSeek 是受敬重的技术标杆,但远非市场领导者,它定义方向,却没有商业化取胜的架构。
这也解释了为何美团、蚂蚁集团这类企业会让西方意外 —— 它们居然在自研大模型。事实上,它们深知大模型是未来技术产品的核心,必须掌握在自己手中。通过微调强大的通用模型,它们能加固技术栈,获取开源社区反馈,同时保留内部微调版本用于自身产品。行业内的「开源优先」心态,本质是务实:既能让模型获得优质反馈,又能反哺开源社区,还能助力自身使命。
4. 数据产业成熟度远低于西方
听闻 Anthropic、OpenAI 等机构为单个训练环境花费超千万美元,每年累计投入数亿美元推进强化学习前沿,我们很好奇:中国实验室是从美国公司购买同类环境,还是有成熟的国内生态支撑?
答案并非完全没有数据产业,而是国内数据产业质量偏低,企业往往选择自建训练环境与数据体系。研究员会花大量时间亲自搭建强化学习训练环境;字节、阿里等大型企业则有内部数据标注团队支持。这完全契合上文 “自研而非外购” 的心态。
6. 极度渴求更多英伟达芯片
英伟达算力是训练的黄金标准,几乎所有实验室都因芯片不足而受限。只要供应充足,它们一定会采购。
这些观察,勾勒出一个与西方截然不同的 AI 生态。
结语
这场为期 10 天的密集走访,没有给出“中国 AI 是否会超越美国”的简单答案。
但它至少揭示了一个越来越清晰的现实:在算力受限、资源不对称的背景下,中国 AI 行业更强调工程效率、更强调组织协同、更强调快速落地。
它未必总能率先定义下一代 AI 范式,但却正在以极强的执行能力,将前沿技术迅速转化为真实产品、真实市场与真实产业能力。
而真正值得关注的问题,或许已经不再只是“中国模型距离美国还有几个月”。而是当两种完全不同的 AI 生态,开始沿着不同逻辑持续演化,它们最终会不会走向两种截然不同的 AI 未来。
https://blog.readsail.com/p/we-spent-10-days-touring-chinese
https://www.interconnects.ai/p/notes-from-inside-chinas-ai-labs
加入AMD AI 开发者计划与全球极客共筑开源
加入即领 50 小时免费云算力
进群抽显卡、AIPC,好运不停
活动与工作坊,早鸟名额优先锁定
AMD Al Academy 官方课程,加速
热门跟贴