6月23日,全球领先的物理AI公司Momenta在港交所刊发聆讯后资料集(PHIP),正式进入IPO冲刺阶段。

打开网易新闻 查看精彩图片

招股书显示,2023年至2025年,Momenta营业收入由7.43亿元增长至24.13亿元,三年翻三倍;截至目前,搭载其智能驾驶系统的量产车辆已超90万辆,累计交付车型超过100款。据CIC灼识咨询数据,2025年3月至2026年2月,Momenta以65%的销量市占率位居中国第三方城市NOA供应商首位。

从量产规模到市场份额,Momenta已经完成了自动驾驶商业化能力的阶段性验证。而随着人工智能竞争从数字世界逐步走向物理世界,行业关注的焦点也正在发生变化。

今年4月,Momenta R7世界模型实现量产首发,标志着物理AI正式从技术理念走向规模化量产落地。对于整个行业而言,这不仅意味着一代自动驾驶技术的升级,更意味着物理AI开始拥有属于自己的基础模型。

物理AI时代的Foundation Model 为何被视为“GPT时刻”的钥匙?

过去三年,ChatGPT掀起的大模型浪潮重塑了全球科技产业,也让“Foundation Model(基座模型)”成为人工智能时代重要的竞争高地。从搜索引擎到办公软件,从内容创作到代码生成,大模型正在重新定义数字世界的生产方式。但在不少行业人士看来,这场变革或许只是开始。

当人工智能逐渐从数字世界走向现实世界,一个新的命题开始浮现:AI能否真正理解并参与物理世界的运行?与数字AI不同,物理AI面对的不再是文字、图片和代码,而是车辆、机器人、人以及复杂环境之间持续发生的交互。它不仅需要知道“发生了什么”,更需要理解“为什么会发生”,以及“接下来会发生什么”。这也是为什么行业普遍认为,物理AI时代同样需要属于自己的基座模型。

如果说ChatGPT学习的是语言规律,那么世界模型(World Model)学习的则是物理规律。它通过理解现实世界中的因果关系、运动规律以及多主体行为模式,让AI逐步建立起对真实世界的认知能力。从某种意义上说,大模型解决的是“理解语言”的问题,而世界模型解决的是“理解世界”的问题。

在这一背景下,世界模型正被越来越多企业视为物理AI时代的关键突破口。无论是自动驾驶、机器人,还是具身智能,其最终目标都不是简单完成某项任务,而是让系统拥有对现实世界的持续理解与推理能力。而自动驾驶,被认为是最有机会率先验证世界模型价值的场景。

原因在于,自动驾驶是目前少数同时具备海量真实数据、复杂交互环境以及持续商业化能力的产业领域。每一辆搭载智能驾驶系统的汽车,本质上都在不断为模型提供新的现实世界样本,使其具备持续进化的基础。

正是在这样的背景下,Momenta发布R7世界模型。从技术路径来看,R7世界模型构建了一套完整的世界模型能力体系。首先,通过World Model Pre-Training(世界模型预训练),利用海量真实驾驶数据学习现实世界中的物理规律和因果关系,让模型建立基础认知能力;随后,World Model Simulation(世界模型仿真),构建高保真的闭环仿真环境,对海量长尾场景进行推演与验证;最终,通过World Model Reinforcement Learning(世界模型强化学习),不断优化决策能力,使系统形成更加安全、高效且符合人类驾驶习惯的行为模式。

如果说预训练阶段是在让模型“懂世界”,仿真阶段是在让模型“练世界”,那么强化学习阶段则是在让模型“用世界”。这也意味着,世界模型不再只是自动驾驶系统中的辅助工具,而是开始向物理AI时代的Foundation Model演进。

为什么是Momenta?R7世界模型背后的双重Scaling

如果说世界模型正在成为物理AI时代的Foundation Model,那么下一个问题自然是:谁最有机会构建这套基座模型?

回顾数字AI的发展历程,无论是OpenAI还是Anthropic,最终胜出的企业都具备一个共同特征,拥有持续获取数据、训练模型并不断迭代的能力。Foundation Model的竞争从来不是一次性的技术突破,而是一场关于规模效应的长期竞争。

物理AI同样如此。相比数字AI,物理AI面对的是更加复杂的现实世界,其数据获取成本更高、验证周期更长、研发投入也更大。因此,决定竞争格局的关键,不仅是谁率先提出世界模型概念,更是谁能够持续推动世界模型进化。在Momenta CEO曹旭东看来,物理AI的核心是数据Scaling与商业Scaling。

首先是数据Scaling。对于物理AI而言,真实世界交互数据的重要性,相当于互联网数据对于大模型的重要性。但与互联网数据不同,物理世界的数据无法通过简单抓取获得,而必须通过车辆、机器人等载体与现实环境长期交互才能积累,自动驾驶恰恰是目前最具备这一条件的产业。

依托量产辅助驾驶业务,Momenta已积累超120亿公里真实驾驶里程,并从中提炼出上亿段高价值场景数据。随着量产规模持续扩大,其数据积累能力还在不断加速。公开数据显示,Momenta完成首个10万辆量产交付用了24个月,而如今最快仅需不到40天即可完成10万辆交付。目前,搭载Momenta系统的量产车辆规模已超90万辆,已成功交付超100款量产车型,累计定点车型数超210款。

每新增一辆车,就意味着多了一个持续运行的数据采集终端;每新增一次真实道路交互,都会成为模型理解物理世界的新样本。真实世界驾驶数据越多,数据越丰富;数据越丰富,模型迭代空间越大;模型能力提升后,又进一步推动更多真实驾驶数据的生成,最终形成“数据—模型—数据”的正向循环。

打开网易新闻 查看精彩图片

但数据规模并不直接等同于模型能力。真正的关键在于,如何将海量真实世界交互转化为对物理规律的理解能力。Momenta R7世界模型采用“世界模型预训练—世界模型仿真—世界模型强化学习”的三层架构,通过对真实驾驶场景进行预测、推演与反馈学习,将数据积累进一步转化为模型认知能力。换句话说,数据Scaling提供了燃料,而世界模型架构决定了这些燃料能否最终转化为智能。

而这恰恰是物理AI最难复制的护城河之一。如果说数据Scaling决定模型成长速度,那么商业Scaling则决定企业能否长期留在牌桌。

从本质上看,商业化并不只是收入问题,而是决定一家公司能否持续参与基础模型竞争的“供血系统”。尤其是在物理AI领域,模型训练不仅周期长、成本高,而且往往需要跨越长期技术验证与真实场景迭代的双重门槛。在曹旭东看来,“要实现通用物理AI,一定要有大量现金流业务。”

这一逻辑在Momenta的财务结构中得到了直接体现。招股书显示,2025年Momenta研发投入达到18.69亿元,占全年收入的77.5%。持续高强度的研发投入,使其能够不断推进世界模型等底层能力的迭代与升级。

换句话说,真正能够参与终局竞争的企业,不仅需要技术突破能力,更需要持续将商业成果转化为研发投入的能力。这也是Momenta“一个飞轮两条腿”战略能够成立的基础:一方面,L2++量产业务持续提供收入与真实道路数据;另一方面,L4自动驾驶业务不断验证技术上限,并反哺量产体系升级。两条业务线在数据与技术之间形成闭环,使模型迭代不再依赖单一业务驱动,而是进入系统性自增强阶段。

从数据获取、模型训练到商业反哺,Momenta正在形成一套物理AI时代少见的双重Scaling体系。数据Scaling决定模型成长速度,商业Scaling决定模型进化持续性,两者共同构成了R7世界模型持续迭代的底层飞轮

从自动驾驶到通用物理AI “一个模型打通全场景”打开万亿市场空间

双重Scaling构成了世界模型持续进化的底层机制,而其更深层的意义在于,世界模型正在重新定义Momenta的成长边界,这一逻辑已在全球范围内得到初步验证。

打开网易新闻 查看精彩图片

以特斯拉为例,其FSD能力的持续跃升,并非依赖单点算法突破,而是依托大规模量产车队持续回传的真实世界数据,通过统一模型架构完成能力的系统性迭代。这是行业头部玩家正在形成的共同方法论:以真实数据为燃料,以统一模型为引擎,推动自动驾驶向高阶演进。

然而,在“如何利用世界模型”这一关键问题上,Momenta走出了与多数企业截然不同的路径。行业内普遍将世界模型视为仿真工具,用于生成训练数据或测试主模型,本质上是“帮助模型学习”。而Momenta R7世界模型则将世界模型直接应用于端到端基座模型的预训练,从“帮助学习”到“塑造模型本身”,世界模型的角色完成了本质跃迁。

从这个角度看,R7世界模型的意义已不局限于一次自动驾驶技术升级,而是在争夺物理AI时代Foundation Model的构建权。而这一判断,也正在获得产业与资本市场的广泛认可。

真格基金创始合伙人方爱之表示:“作为相伴Momenta较久的老股东之一,我们一路见证了团队如何跨越自动驾驶的产业周期,在行业里率先跑通数据和商业的规模化闭环。极强的战略定力和顶尖的研发实力和执行力,是Momenta最宝贵的资产。随着R7世界模型规模化落地,不仅将打开Momenta估值天花板,还将推动物理AI的‘GPT时刻’加速到来。期待团队继续在物理AI时代,创造属于中国科技企业的全球奇迹。”

此外,Momenta的股东阵容极其豪华,汇聚了全球核心的产业和科技战略投资人,以及全球顶级财务投资人。

产业资本囊括了全球汽车产业链的核心玩家,包括:上汽、通用、奔驰、丰田、比亚迪、现代、奇瑞7家全球顶级车企,以及博世、德赛西威、立讯精密等头部产业链合作伙伴,和Uber、Grab、Stone Venture等Robo合作伙伴。科技巨头则包括腾讯、阿里云、蚂蚁集团、京东等。

打开网易新闻 查看精彩图片

财务投资人更是覆盖了淡马锡、IDG、阿曼投资局、亦庄国投、Granite Asia、顺为、蔚来资本、凯辉基金、云锋基金、蓝湖资本、创新工场、真格基金、鼎晖投资、高榕创投、高成资本、众为资本、愉悦资本、钟鼎资本、盈峰资本、招银国际、华泰创新资本、混沌资本、春华资本、大湾区基金、国新基金、光合创投、九合创投、锦秋基金等全球顶尖投资机构。

超豪华、多元化的股东阵营,不仅为Momenta提供了战略和资本支持,还从业务协同、用户增长和全球化布局等方面助力了Momenta高速增长。

资本市场所看重的,并不仅仅是自动驾驶业务本身,而是世界模型所具备的跨场景泛化能力。长期以来,不同自动驾驶场景往往对应不同技术体系。乘用车、Robotaxi、Robovan以及Robotruck通常需要独立开发、独立验证和独立部署。

而世界模型的出现,正在改变这一逻辑。因为其学习的是物理规律,而非某一种具体场景规则。因此,同一套基础模型理论上能够适配不同载体和应用场景,其底层所需要的环境理解、运动预测和决策规划能力本质上高度一致。

基于这一判断,Momenta提出“一个模型打通全场景”构想,希望通过统一技术底座同时赋能乘用车、Robotaxi、Robovan和Robotruck四大业务形态。这意味着,未来不同业务不再是各自独立演进,而是共享同一个数据飞轮与模型飞轮。每新增一个应用场景,都在为同一个世界模型提供新的训练数据;而每一次模型进化,也能够同步反馈到所有业务体系之中。

这种平台化能力不仅提升了研发效率,也显著降低了跨场景扩张的边际成本。更重要的是,它打开了自动驾驶之外的想象空间。

从长期来看,如果世界模型真正掌握了现实世界的通用规律,那么其能力不仅能够应用于车辆,也有机会进一步延伸至物流机器人、工业机器人乃至更广泛的具身智能领域。届时,自动驾驶或许只是物理AI最先落地的产业入口,而不是最终边界。

在这一进程中,Momenta通过120亿公里真实数据、R7世界模型量产落地,以及90万辆规模化部署,正在形成一套贯通数据、模型与商业化的闭环体系。对于资本市场而言,其意义已不止于一家自动驾驶公司,而是物理AI基础模型的早期构建者。

(文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。)

文/刘雨