Momenta冲刺港股IPO，营收三年翻三倍，世界模型打开物理AI万亿新周期|momenta|世界模型|人工智能|机器人|飞轮

6月23日，全球领先的物理AI公司Momenta在港交所刊发聆讯后资料集（PHIP），正式进入IPO冲刺阶段。

招股书显示，2023年至2025年，Momenta营业收入由7.43亿元增长至24.13亿元，三年翻三倍；截至目前，搭载其智能驾驶系统的量产车辆已超90万辆，累计交付车型超过100款。据CIC灼识咨询数据，2025年3月至2026年2月，Momenta以65%的销量市占率位居中国第三方城市NOA供应商首位。

从量产规模到市场份额，Momenta已经完成了自动驾驶商业化能力的阶段性验证。而随着人工智能竞争从数字世界逐步走向物理世界，行业关注的焦点也正在发生变化。

今年4月，Momenta R7世界模型实现量产首发，标志着物理AI正式从技术理念走向规模化量产落地。对于整个行业而言，这不仅意味着一代自动驾驶技术的升级，更意味着物理AI开始拥有属于自己的基础模型。

物理AI时代的Foundation Model 为何被视为“GPT时刻”的钥匙？

过去三年，ChatGPT掀起的大模型浪潮重塑了全球科技产业，也让“Foundation Model（基座模型）”成为人工智能时代重要的竞争高地。从搜索引擎到办公软件，从内容创作到代码生成，大模型正在重新定义数字世界的生产方式。但在不少行业人士看来，这场变革或许只是开始。

当人工智能逐渐从数字世界走向现实世界，一个新的命题开始浮现：AI能否真正理解并参与物理世界的运行？与数字AI不同，物理AI面对的不再是文字、图片和代码，而是车辆、机器人、人以及复杂环境之间持续发生的交互。它不仅需要知道“发生了什么”，更需要理解“为什么会发生”，以及“接下来会发生什么”。这也是为什么行业普遍认为，物理AI时代同样需要属于自己的基座模型。

如果说ChatGPT学习的是语言规律，那么世界模型（World Model）学习的则是物理规律。它通过理解现实世界中的因果关系、运动规律以及多主体行为模式，让AI逐步建立起对真实世界的认知能力。从某种意义上说，大模型解决的是“理解语言”的问题，而世界模型解决的是“理解世界”的问题。

在这一背景下，世界模型正被越来越多企业视为物理AI时代的关键突破口。无论是自动驾驶、机器人，还是具身智能，其最终目标都不是简单完成某项任务，而是让系统拥有对现实世界的持续理解与推理能力。而自动驾驶，被认为是最有机会率先验证世界模型价值的场景。

原因在于，自动驾驶是目前少数同时具备海量真实数据、复杂交互环境以及持续商业化能力的产业领域。每一辆搭载智能驾驶系统的汽车，本质上都在不断为模型提供新的现实世界样本，使其具备持续进化的基础。

正是在这样的背景下，Momenta发布R7世界模型。从技术路径来看，R7世界模型构建了一套完整的世界模型能力体系。首先，通过World Model Pre-Training（世界模型预训练），利用海量真实驾驶数据学习现实世界中的物理规律和因果关系，让模型建立基础认知能力；随后，World Model Simulation（世界模型仿真），构建高保真的闭环仿真环境，对海量长尾场景进行推演与验证；最终，通过World Model Reinforcement Learning（世界模型强化学习），不断优化决策能力，使系统形成更加安全、高效且符合人类驾驶习惯的行为模式。

如果说预训练阶段是在让模型“懂世界”，仿真阶段是在让模型“练世界”，那么强化学习阶段则是在让模型“用世界”。这也意味着，世界模型不再只是自动驾驶系统中的辅助工具，而是开始向物理AI时代的Foundation Model演进。

为什么是Momenta？R7世界模型背后的双重Scaling

如果说世界模型正在成为物理AI时代的Foundation Model，那么下一个问题自然是：谁最有机会构建这套基座模型？

回顾数字AI的发展历程，无论是OpenAI还是Anthropic，最终胜出的企业都具备一个共同特征，拥有持续获取数据、训练模型并不断迭代的能力。Foundation Model的竞争从来不是一次性的技术突破，而是一场关于规模效应的长期竞争。

物理AI同样如此。相比数字AI，物理AI面对的是更加复杂的现实世界，其数据获取成本更高、验证周期更长、研发投入也更大。因此，决定竞争格局的关键，不仅是谁率先提出世界模型概念，更是谁能够持续推动世界模型进化。在Momenta CEO曹旭东看来，物理AI的核心是数据Scaling与商业Scaling。

首先是数据Scaling。对于物理AI而言，真实世界交互数据的重要性，相当于互联网数据对于大模型的重要性。但与互联网数据不同，物理世界的数据无法通过简单抓取获得，而必须通过车辆、机器人等载体与现实环境长期交互才能积累，自动驾驶恰恰是目前最具备这一条件的产业。

依托量产辅助驾驶业务，Momenta已积累超120亿公里真实驾驶里程，并从中提炼出上亿段高价值场景数据。随着量产规模持续扩大，其数据积累能力还在不断加速。公开数据显示，Momenta完成首个10万辆量产交付用了24个月，而如今最快仅需不到40天即可完成10万辆交付。目前，搭载Momenta系统的量产车辆规模已超90万辆，已成功交付超100款量产车型，累计定点车型数超210款。

每新增一辆车，就意味着多了一个持续运行的数据采集终端；每新增一次真实道路交互，都会成为模型理解物理世界的新样本。真实世界驾驶数据越多，数据越丰富；数据越丰富，模型迭代空间越大；模型能力提升后，又进一步推动更多真实驾驶数据的生成，最终形成“数据—模型—数据”的正向循环。

但数据规模并不直接等同于模型能力。真正的关键在于，如何将海量真实世界交互转化为对物理规律的理解能力。Momenta R7世界模型采用“世界模型预训练—世界模型仿真—世界模型强化学习”的三层架构，通过对真实驾驶场景进行预测、推演与反馈学习，将数据积累进一步转化为模型认知能力。换句话说，数据Scaling提供了燃料，而世界模型架构决定了这些燃料能否最终转化为智能。

而这恰恰是物理AI最难复制的护城河之一。如果说数据Scaling决定模型成长速度，那么商业Scaling则决定企业能否长期留在牌桌。

从本质上看，商业化并不只是收入问题，而是决定一家公司能否持续参与基础模型竞争的“供血系统”。尤其是在物理AI领域，模型训练不仅周期长、成本高，而且往往需要跨越长期技术验证与真实场景迭代的双重门槛。在曹旭东看来，“要实现通用物理AI，一定要有大量现金流业务。”

这一逻辑在Momenta的财务结构中得到了直接体现。招股书显示，2025年Momenta研发投入达到18.69亿元，占全年收入的77.5%。持续高强度的研发投入，使其能够不断推进世界模型等底层能力的迭代与升级。

换句话说，真正能够参与终局竞争的企业，不仅需要技术突破能力，更需要持续将商业成果转化为研发投入的能力。这也是Momenta“一个飞轮两条腿”战略能够成立的基础：一方面，L2++量产业务持续提供收入与真实道路数据；另一方面，L4自动驾驶业务不断验证技术上限，并反哺量产体系升级。两条业务线在数据与技术之间形成闭环，使模型迭代不再依赖单一业务驱动，而是进入系统性自增强阶段。

从数据获取、模型训练到商业反哺，Momenta正在形成一套物理AI时代少见的双重Scaling体系。数据Scaling决定模型成长速度，商业Scaling决定模型进化持续性，两者共同构成了R7世界模型持续迭代的底层飞轮。

从自动驾驶到通用物理AI “一个模型打通全场景”打开万亿市场空间

双重Scaling构成了世界模型持续进化的底层机制，而其更深层的意义在于，世界模型正在重新定义Momenta的成长边界，这一逻辑已在全球范围内得到初步验证。

以特斯拉为例，其FSD能力的持续跃升，并非依赖单点算法突破，而是依托大规模量产车队持续回传的真实世界数据，通过统一模型架构完成能力的系统性迭代。这是行业头部玩家正在形成的共同方法论：以真实数据为燃料，以统一模型为引擎，推动自动驾驶向高阶演进。

然而，在“如何利用世界模型”这一关键问题上，Momenta走出了与多数企业截然不同的路径。行业内普遍将世界模型视为仿真工具，用于生成训练数据或测试主模型，本质上是“帮助模型学习”。而Momenta R7世界模型则将世界模型直接应用于端到端基座模型的预训练，从“帮助学习”到“塑造模型本身”，世界模型的角色完成了本质跃迁。

从这个角度看，R7世界模型的意义已不局限于一次自动驾驶技术升级，而是在争夺物理AI时代Foundation Model的构建权。而这一判断，也正在获得产业与资本市场的广泛认可。

真格基金创始合伙人方爱之表示：“作为相伴Momenta较久的老股东之一，我们一路见证了团队如何跨越自动驾驶的产业周期，在行业里率先跑通数据和商业的规模化闭环。极强的战略定力和顶尖的研发实力和执行力，是Momenta最宝贵的资产。随着R7世界模型规模化落地，不仅将打开Momenta估值天花板，还将推动物理AI的‘GPT时刻’加速到来。期待团队继续在物理AI时代，创造属于中国科技企业的全球奇迹。”

此外，Momenta的股东阵容极其豪华，汇聚了全球核心的产业和科技战略投资人，以及全球顶级财务投资人。

产业资本囊括了全球汽车产业链的核心玩家，包括：上汽、通用、奔驰、丰田、比亚迪、现代、奇瑞7家全球顶级车企，以及博世、德赛西威、立讯精密等头部产业链合作伙伴，和Uber、Grab、Stone Venture等Robo合作伙伴。科技巨头则包括腾讯、阿里云、蚂蚁集团、京东等。

财务投资人更是覆盖了淡马锡、IDG、阿曼投资局、亦庄国投、Granite Asia、顺为、蔚来资本、凯辉基金、云锋基金、蓝湖资本、创新工场、真格基金、鼎晖投资、高榕创投、高成资本、众为资本、愉悦资本、钟鼎资本、盈峰资本、招银国际、华泰创新资本、混沌资本、春华资本、大湾区基金、国新基金、光合创投、九合创投、锦秋基金等全球顶尖投资机构。

超豪华、多元化的股东阵营，不仅为Momenta提供了战略和资本支持，还从业务协同、用户增长和全球化布局等方面助力了Momenta高速增长。

资本市场所看重的，并不仅仅是自动驾驶业务本身，而是世界模型所具备的跨场景泛化能力。长期以来，不同自动驾驶场景往往对应不同技术体系。乘用车、Robotaxi、Robovan以及Robotruck通常需要独立开发、独立验证和独立部署。

而世界模型的出现，正在改变这一逻辑。因为其学习的是物理规律，而非某一种具体场景规则。因此，同一套基础模型理论上能够适配不同载体和应用场景，其底层所需要的环境理解、运动预测和决策规划能力本质上高度一致。

基于这一判断，Momenta提出“一个模型打通全场景”构想，希望通过统一技术底座同时赋能乘用车、Robotaxi、Robovan和Robotruck四大业务形态。这意味着，未来不同业务不再是各自独立演进，而是共享同一个数据飞轮与模型飞轮。每新增一个应用场景，都在为同一个世界模型提供新的训练数据；而每一次模型进化，也能够同步反馈到所有业务体系之中。

这种平台化能力不仅提升了研发效率，也显著降低了跨场景扩张的边际成本。更重要的是，它打开了自动驾驶之外的想象空间。

从长期来看，如果世界模型真正掌握了现实世界的通用规律，那么其能力不仅能够应用于车辆，也有机会进一步延伸至物流机器人、工业机器人乃至更广泛的具身智能领域。届时，自动驾驶或许只是物理AI最先落地的产业入口，而不是最终边界。

在这一进程中，Momenta通过120亿公里真实数据、R7世界模型量产落地，以及90万辆规模化部署，正在形成一套贯通数据、模型与商业化的闭环体系。对于资本市场而言，其意义已不止于一家自动驾驶公司，而是物理AI基础模型的早期构建者。

（文章内容仅供参考，不构成投资建议。投资者据此操作，风险自担。）

文/刘雨