港股新贵押注物理AI，乐动机器人打造万亿市场空间的核心基础设施|乐动|机器人|真实世界|真实场景|算法|量子

田晏林发自凹非寺
量子位 | 公众号 QbitAI

物理AI发展到现在，所有玩家都奔着同一个方向使劲：

让机器人「读懂」所处的物理环境。

这不仅是具身智能玩家拉开身位的关键，也决定了机器人未来能否进入真实场景，创造商业价值。

人类看到一张桌子，会知道它在哪里、是什么材质、能不能移动；看到一个门把手，会自然判断它可以被旋转；面对突然出现的人，会马上调整自己的动作。

但对机器人来说，做出这些看似简单的判断，并不容易。

因为它面对的不是一张图片，而是一个不断变化的三维世界。

想要让机器人真正长出能理解物理世界的「脑子」，不能只依靠参数量更大的基础模型。

机器人大脑需要海量真实物理交互数据做训练燃料。

而高质量视觉感知，正是把现实环境转化为模型可读信息、持续产出训练数据的核心入口。

更强的视觉感知持续供给真实世界数据，不断迭代升级机器人的物理世界大脑。

最近登陆港交所主板的乐动机器人，过去十年押注的，就是这样一条路线。

从扫地机器人、物流仓储机器人，到无接触式酒店和餐厅的服务机器人，再到如今的人形机器人、机器狗等新赛道爆发，乐动持续围绕一个底层问题布局：

机器人如何感知空间，并理解环境。

这也让其在多轮机器人产业发展中，逐渐积累了「空间感知技术」的先发优势。

但上市之后，市场关注的不只是这家企业过去的成绩。

大家更想知道，在人人都要机器人「读懂世界」的物理AI时代，智能化的底层地基该怎么打？

机器人竞赛，焦点变了

论机器人行业未来的通用底层刚需，答案离不开一个：环境感知能力。

背后逻辑很好理解。

无论机器人最终落在哪个场景，家庭、酒店、餐厅、仓储、工厂，包括未来要规模化商业落地的人形机器人，它首先要会回答：

我在哪里？
我看到了什么？
眼前的东西意味着什么？
我下一步应该怎么行动？

如果没有对环境的理解，机器人就只能停留在固定场景、固定动作的自动化设备阶段。

就像传统工业机械臂，可以精准完成焊接、搬运等重复任务，但它并不真正「知道」自己面对的是什么。

过去，机器人行业的竞争叙事一直围绕一个词展开：运动能力。

谁能走路、谁能避障、谁能抓取、谁能完成复杂动作。

但随着具身智能进入真实应用阶段，这套评价体系开始失效。

下一代机器人要进入真实世界，面对的是大量开放环境和长尾情况：

一个随意摆放的物品、一扇半开的门、一个突然移动的人，甚至是光线变化都可能让系统崩溃。

空间变化带来的不确定性，要求机器人具备对世界持续理解的能力。

而理解世界的前提，是感知。

特别是进入物理AI时代，「感知」更是连接现实世界与AI模型的必要入口

它负责把复杂的物理世界转化为AI能理解的数据，再交由模型完成认知、决策。

某种程度上，机器人的智能上限，取决于它感知世界的深度。

所有空间智能，本质上都依赖同一件事：真实世界数据的持续供给。

没有数据，再强的模型也只是静态能力。

数据一旦断供，所谓泛化能力就会迅速塌缩。

也正因此，行业的竞争焦点正在发生迁移：从「谁的模型更聪明」，变成「谁能持续生产真实世界」。

而这本质上就是一件更工业化的事情：把物理世界变成数据流。

这也是感知能力被重新定义的地方。

它不再只是机器人的一个模块，而是整个系统的入口。

一个决定后续所有智能上限的入口。

从传感器到「数据精炼厂」

但想把物理世界变成AI能理解的数据，并没有那么简单。

现实世界的数据，天然就是混乱的。

就像刚从矿井里开采出来的原油。有价值，但不能直接用。

真正决定机器人智能水平的，不只是有没有传感器，而是有没有能力把这些原始信息加工成模型可以理解的「燃料」。

这也是乐动机器人过去十年持续投入的方向。

在公司成立之初，团队就做了一个判断：

机器人未来无论进入家庭、酒店、餐厅、仓库还是工厂，最底层的共性需求一定是理解环境。

乐动机器人董事长周伟告诉量子位，「感知」可分为两层：

第一层是感，负责通过传感器采集环境数据；
第二层是知，通过算法和模型把数据变成机器人对环境、空间和物体的认知。

这意味着，感知从来不是一个单独硬件问题。传感器只是入口。

真正的竞争，在于谁能把入口采集的数据，进一步加工成空间智能。

这也是乐动没有停留在硬件公司的原因。

这些年，机器人产业经历过多轮周期：

2017年～2018年，扫地机器人快速普及；
2019年，物流仓储机器人兴起；
2020年～2021年，无接触服务机器人进入酒店、餐厅；
2023年～2024年，割草机器人开始爆发。

到如今，人形机器人、机器狗、无人小车等新方向集中出现。

每一轮机器人浪潮，最终都会回到同一个问题：机器人如何理解自己所在的世界。

乐动踩中的，正是这个长期不变的底层需求。

为了让机器人拥有理解真实世界的最佳能力，乐动的「感知产品」经历过多轮技术迭代。

先说传感器

过去单一传感器时代，视觉解决语义问题，激光雷达解决空间定位问题。

但单一能力始终存在缺陷。

激光雷达知道距离，却不知道那是什么；视觉知道物体，却不一定精准知道空间位置。

而物理世界中的机器人，需要同时回答：这是一个什么东西？它在哪里？我能不能移动它？我应该如何行动？

所以，周伟认为，未来传感器硬件的趋势，必然走向多模态融合。

视觉、激光、深度信息、IMU（惯性测量单元）等不同数据源，需要被统一理解。

再看算法模型。

乐动早期也是依靠工程师人工编写代码。

但这种方式的问题很明显，不仅效率低，而且工程师可以写出100个规则，却很难覆盖真实世界里的第101种情况。

变化发生在AI进入机器人之后。公司完成了从人工规则算法到端到端AI模型的范式革新，依靠AI自主学习、自主认知环境。

在周伟看来，硬件负责收集世界，模型负责理解世界。

只有两者结合，才能形成真正的空间智能。

如何把这些不同来源的数据，变成机器人可以学习的语言呢？

乐动自研了LD-SenseWorld灵境物理空间交互大模型。

它不是通用大模型，而是聚焦物理空间智能。核心目标只有一个：让机器人真正理解空间。

它的第一项能力是数据预处理与多模态融合。

现实世界的数据来自视觉、激光雷达、IMU等多个通道，但这些信息天然不同步、不同结构。

如果不做统一处理，本质就是噪声叠加。

LD-SenseWorld通过对齐、清洗与融合，把多源数据拉回同一时间与空间基准，形成可用的世界输入。

第二项能力是特征提取与空间Token化。

连续变化的物理世界，必须被转化为机器可学习的离散表达。

系统将位置、距离、物体关系与运动状态等信息压缩为“空间Token”。

相当于为机器人建立一套描述现实的基础语言，让空间本身变得可读、可计算。

第三项能力是语义化与物理一致性注入。

机器人最终不是为了识别，而是为了行动。

仅有结构还不够，机器人还需要理解规则：什么能移动、什么会坠落、人在何种情况下会改变路径。

通过引入物理约束与语义理解，数据不再只是坐标与点云，而是具备因果与行为逻辑的认知输入。

本质上，LD-SenseWorld做的不是建模，而是把混乱无序的数据，加工成可学习的世界「燃料」。

这也是乐动作为「数据精炼厂」的核心所在。

百万台设备，撑起物理AI的数据飞轮

对于物理AI来说，模型只是开始。

真正决定机器人能不能进入现实世界的，是模型背后的数据供给能力。

这也是当前机器人行业最大的挑战。

周伟提到，行业数据来源主要有三类：

仿真数据、实验室或数据工厂数据，以及真实场景落地数据。

这里最大的问题，是前两者很难覆盖真实世界里的大量未知情况。

这也是为什么，越来越多机器人公司开始意识到，真正稀缺的不是训练模型的方法，而是训练模型的原料。

特斯拉FSD的优势，本质上来自大量真实道路数据积累。

机器人也一样。

没有真实设备持续运行，就没有持续进化的数据来源。

乐动的路径，是通过构建「物理AI三层核心架构」，给模型落地做底层支撑。

硬件感知层：负责用多模态传感器采集真实世界海量原始数据。
模型层：空间交互大模型负责让机器人理解真实世界，打造真实物理世界的数据精炼厂。
数据层：区别于仿真数据，基于真实设备持续采集，自研大模型持续加工，输出源源不断的结构化、语义化、物理一致性的空间Token，可直接输入世界模型训练。

最终形成从硬件采集数据，到数据训练模型，再到模型反向定义硬件的「数据飞轮」。

这也是乐动和传统硬件公司的区别。

传统硬件公司的逻辑是生产设备——销售设备——结束交易。

但乐动在物理AI时代，通过更多的设备，采集丰富的数据。

“数据越丰富，模型越强。模型越强，产品体验越好。体验越好，又容易推动更多设备进入真实场景。”周伟说。

这是一个不断加速的循环。

乐动已经在这条路上积累了规模化基础

2025年，其核心产品DTOF激光雷达出货量超过400万台。

但乐动拥有的不只是传感器出货量，而是一个持续运行的真实世界数据入口。

据悉，搭载乐动视觉感知技术的设备量已突破2000万台。

在乐动的财报里，割草机器人是该公司第二增长引擎。产品目前主要销往欧美、澳洲等高潜力智能花园养护市场。

第三方机构统计，到2030年，全球智能割草机器人市场规模预计将增至62.5亿～100亿美元。

什么概念？这意味着，将有更多源源不断的真实场景数据，等待被乐动收集。

这是「数据精炼厂」成立的基础，也是数据飞轮能够快速起飞的前提。

20年机器人长跑，周伟的「直觉」

回看乐动的发展路径，会发现这并不是一次突然押中的风口，而是一场持续二十年的积累。

1986年的周伟，是机器人行业典型的“少壮派”。

早在大学时期，他就获得了中国机器人足球锦标赛冠军。

2012年毕业后，周伟与华科的学长郭盖华在深圳共同创立乐行天下。

最初选择体感车行业时，二人的目标就不仅仅是做交通工具，而是想做出更便捷、更张扬个性自由的智能出行机器人。

2013年秋，第一款乐行智能平衡车发布，也让乐行成为国内平衡车领域的开创者之一。

2014年，乐行天下完成1亿元的B轮融资。周伟也于2015年入选“福布斯中国30位30岁以下创业者”榜单并成为封面人物。

2017年，周伟和郭盖华两人再次踏上创业征程，乐动机器人成立了。

从乐行天下再到乐动机器人，周伟积累了大量机器人产业经验。

以至于创业多年后，公司遇到难关时，他还能保持技术者的敏锐直觉。

2022年那段时间，国内外宏观环境与资本市场低迷，乐动机器人的经营状况并不乐观。

高研发投入、商业化周期长、订单规模受限，投资者都开始劝周伟降低研发投入，优先保证业务。

但究竟是要短期现金流，还是积累长期技术壁垒？这是科技创业公司常见的典型试题。

顶着投资人的压力，周伟决定all in感知技术。

原因很简单。他认为感知不是一个阶段性需求，而是所有机器人未来都会需要的底层能力。

事实证明，这个判断最终迎来了行业回报。

2024年至2025年，机器人产业进入新一轮爆发期，乐动早期的技术投入开始释放价值。

对外，周伟常半开玩笑说，当初的决定源于一时直觉。

所谓直觉，其实都是长期认知形成的本能。没有二十年机器人领域的功力，恐怕很难做出这般取舍。

One more thing

传统AI和物理AI最大的不同，是后者在面对一个复杂、连续、不断变化的现实空间。

谁能把这个空间高质量地数字化，谁就掌握了下一阶段机器智能的入口。

从这个角度看，乐动正在做的事情，已经不只是提供感知硬件，它更像是在建设一套物理世界的数据加工体系。

让机器人看懂世界，让模型理解世界，再让机器人基于真实世界不断进化。

从传感器产品公司，到物理AI的「感知基础设施平台」，乐动正在完成身份重塑。