田晏林 发自 凹非寺
量子位 | 公众号 QbitAI
物理AI发展到现在,所有玩家都奔着同一个方向使劲:
让机器人「读懂」所处的物理环境。
这不仅是具身智能玩家拉开身位的关键,也决定了机器人未来能否进入真实场景,创造商业价值。
人类看到一张桌子,会知道它在哪里、是什么材质、能不能移动;看到一个门把手,会自然判断它可以被旋转;面对突然出现的人,会马上调整自己的动作。
但对机器人来说,做出这些看似简单的判断,并不容易。
因为它面对的不是一张图片,而是一个不断变化的三维世界。
想要让机器人真正长出能理解物理世界的「脑子」,不能只依靠参数量更大的基础模型。
机器人大脑需要海量真实物理交互数据做训练燃料。
而高质量视觉感知,正是把现实环境转化为模型可读信息、持续产出训练数据的核心入口。
更强的视觉感知持续供给真实世界数据,不断迭代升级机器人的物理世界大脑。
最近登陆港交所主板的乐动机器人,过去十年押注的,就是这样一条路线。
从扫地机器人、物流仓储机器人,到无接触式酒店和餐厅的服务机器人,再到如今的人形机器人、机器狗等新赛道爆发,乐动持续围绕一个底层问题布局:
机器人如何感知空间,并理解环境。
这也让其在多轮机器人产业发展中,逐渐积累了「空间感知技术」的先发优势。
但上市之后,市场关注的不只是这家企业过去的成绩。
大家更想知道,在人人都要机器人「读懂世界」的物理AI时代,智能化的底层地基该怎么打?
机器人竞赛,焦点变了
论机器人行业未来的通用底层刚需,答案离不开一个:环境感知能力。
背后逻辑很好理解。
无论机器人最终落在哪个场景,家庭、酒店、餐厅、仓储、工厂,包括未来要规模化商业落地的人形机器人,它首先要会回答:
- 我在哪里?
- 我看到了什么?
- 眼前的东西意味着什么?
- 我下一步应该怎么行动?
如果没有对环境的理解,机器人就只能停留在固定场景、固定动作的自动化设备阶段。
就像传统工业机械臂,可以精准完成焊接、搬运等重复任务,但它并不真正「知道」自己面对的是什么。
过去,机器人行业的竞争叙事一直围绕一个词展开:运动能力。
谁能走路、谁能避障、谁能抓取、谁能完成复杂动作。
但随着具身智能进入真实应用阶段,这套评价体系开始失效。
下一代机器人要进入真实世界,面对的是大量开放环境和长尾情况:
一个随意摆放的物品、一扇半开的门、一个突然移动的人,甚至是光线变化都可能让系统崩溃。
空间变化带来的不确定性,要求机器人具备对世界持续理解的能力。
而理解世界的前提,是感知。
特别是进入物理AI时代,「感知」更是连接现实世界与AI模型的必要入口
它负责把复杂的物理世界转化为AI能理解的数据,再交由模型完成认知、决策。
某种程度上,机器人的智能上限,取决于它感知世界的深度。
所有空间智能,本质上都依赖同一件事:真实世界数据的持续供给。
没有数据,再强的模型也只是静态能力。
数据一旦断供,所谓泛化能力就会迅速塌缩。
也正因此,行业的竞争焦点正在发生迁移:从「谁的模型更聪明」,变成「谁能持续生产真实世界」。
而这本质上就是一件更工业化的事情:把物理世界变成数据流。
这也是感知能力被重新定义的地方。
它不再只是机器人的一个模块,而是整个系统的入口。
一个决定后续所有智能上限的入口。
从传感器到「数据精炼厂」
但想把物理世界变成AI能理解的数据,并没有那么简单。
现实世界的数据,天然就是混乱的。
就像刚从矿井里开采出来的原油。有价值,但不能直接用。
真正决定机器人智能水平的,不只是有没有传感器,而是有没有能力把这些原始信息加工成模型可以理解的「燃料」。
这也是乐动机器人过去十年持续投入的方向。
在公司成立之初,团队就做了一个判断:
机器人未来无论进入家庭、酒店、餐厅、仓库还是工厂,最底层的共性需求一定是理解环境。
乐动机器人董事长周伟告诉量子位,「感知」可分为两层:
第一层是感,负责通过传感器采集环境数据;
第二层是知,通过算法和模型把数据变成机器人对环境、空间和物体的认知。
这意味着,感知从来不是一个单独硬件问题。传感器只是入口。
真正的竞争,在于谁能把入口采集的数据,进一步加工成空间智能。
这也是乐动没有停留在硬件公司的原因。
这些年,机器人产业经历过多轮周期:
- 2017年~2018年,扫地机器人快速普及;
- 2019年,物流仓储机器人兴起;
- 2020年~2021年,无接触服务机器人进入酒店、餐厅;
- 2023年~2024年,割草机器人开始爆发。
到如今,人形机器人、机器狗、无人小车等新方向集中出现。
每一轮机器人浪潮,最终都会回到同一个问题:机器人如何理解自己所在的世界。
乐动踩中的,正是这个长期不变的底层需求。
为了让机器人拥有理解真实世界的最佳能力,乐动的「感知产品」经历过多轮技术迭代。
先说传感器
过去单一传感器时代,视觉解决语义问题,激光雷达解决空间定位问题。
但单一能力始终存在缺陷。
激光雷达知道距离,却不知道那是什么;视觉知道物体,却不一定精准知道空间位置。
而物理世界中的机器人,需要同时回答:这是一个什么东西?它在哪里?我能不能移动它?我应该如何行动?
所以,周伟认为,未来传感器硬件的趋势,必然走向多模态融合。
视觉、激光、深度信息、IMU(惯性测量单元)等不同数据源,需要被统一理解。
再看算法模型。
乐动早期也是依靠工程师人工编写代码。
但这种方式的问题很明显,不仅效率低,而且工程师可以写出100个规则,却很难覆盖真实世界里的第101种情况。
变化发生在AI进入机器人之后。公司完成了从人工规则算法到端到端AI模型的范式革新,依靠AI自主学习、自主认知环境。
在周伟看来,硬件负责收集世界,模型负责理解世界。
只有两者结合,才能形成真正的空间智能。
如何把这些不同来源的数据,变成机器人可以学习的语言呢?
乐动自研了LD-SenseWorld灵境物理空间交互大模型。
它不是通用大模型,而是聚焦物理空间智能。核心目标只有一个:让机器人真正理解空间。
它的第一项能力是数据预处理与多模态融合。
现实世界的数据来自视觉、激光雷达、IMU等多个通道,但这些信息天然不同步、不同结构。
如果不做统一处理,本质就是噪声叠加。
LD-SenseWorld通过对齐、清洗与融合,把多源数据拉回同一时间与空间基准,形成可用的世界输入。
第二项能力是特征提取与空间Token化。
连续变化的物理世界,必须被转化为机器可学习的离散表达。
系统将位置、距离、物体关系与运动状态等信息压缩为“空间Token”。
相当于为机器人建立一套描述现实的基础语言,让空间本身变得可读、可计算。
第三项能力是语义化与物理一致性注入。
机器人最终不是为了识别,而是为了行动。
仅有结构还不够,机器人还需要理解规则:什么能移动、什么会坠落、人在何种情况下会改变路径。
通过引入物理约束与语义理解,数据不再只是坐标与点云,而是具备因果与行为逻辑的认知输入。
本质上,LD-SenseWorld做的不是建模,而是把混乱无序的数据,加工成可学习的世界「燃料」。
这也是乐动作为「数据精炼厂」的核心所在。
百万台设备,撑起物理AI的数据飞轮
对于物理AI来说,模型只是开始。
真正决定机器人能不能进入现实世界的,是模型背后的数据供给能力。
这也是当前机器人行业最大的挑战。
周伟提到,行业数据来源主要有三类:
仿真数据、实验室或数据工厂数据,以及真实场景落地数据。
这里最大的问题,是前两者很难覆盖真实世界里的大量未知情况。
这也是为什么,越来越多机器人公司开始意识到,真正稀缺的不是训练模型的方法,而是训练模型的原料。
特斯拉FSD的优势,本质上来自大量真实道路数据积累。
机器人也一样。
没有真实设备持续运行,就没有持续进化的数据来源。
乐动的路径,是通过构建「物理AI三层核心架构」,给模型落地做底层支撑。
- 硬件感知层:负责用多模态传感器采集真实世界海量原始数据。
- 模型层:空间交互大模型负责让机器人理解真实世界,打造真实物理世界的数据精炼厂。
- 数据层:区别于仿真数据,基于真实设备持续采集,自研大模型持续加工,输出源源不断的结构化、语义化、物理一致性的空间Token,可直接输入世界模型训练。
最终形成从硬件采集数据,到数据训练模型,再到模型反向定义硬件的「数据飞轮」。
这也是乐动和传统硬件公司的区别。
传统硬件公司的逻辑是生产设备——销售设备——结束交易。
但乐动在物理AI时代,通过更多的设备,采集丰富的数据。
“数据越丰富,模型越强。模型越强,产品体验越好。体验越好,又容易推动更多设备进入真实场景。”周伟说。
这是一个不断加速的循环。
乐动已经在这条路上积累了规模化基础
2025年,其核心产品DTOF激光雷达出货量超过400万台。
但乐动拥有的不只是传感器出货量,而是一个持续运行的真实世界数据入口。
据悉,搭载乐动视觉感知技术的设备量已突破2000万台。
在乐动的财报里,割草机器人是该公司第二增长引擎。产品目前主要销往欧美、澳洲等高潜力智能花园养护市场。
第三方机构统计,到2030年,全球智能割草机器人市场规模预计将增至62.5亿~100亿美元。
什么概念?这意味着,将有更多源源不断的真实场景数据,等待被乐动收集。
这是「数据精炼厂」成立的基础,也是数据飞轮能够快速起飞的前提。
20年机器人长跑,周伟的「直觉」
回看乐动的发展路径,会发现这并不是一次突然押中的风口,而是一场持续二十年的积累。
1986年的周伟,是机器人行业典型的“少壮派”。
早在大学时期,他就获得了中国机器人足球锦标赛冠军。
2012年毕业后,周伟与华科的学长郭盖华在深圳共同创立乐行天下。
最初选择体感车行业时,二人的目标就不仅仅是做交通工具,而是想做出更便捷、更张扬个性自由的智能出行机器人。
2013年秋,第一款乐行智能平衡车发布,也让乐行成为国内平衡车领域的开创者之一。
2014年,乐行天下完成1亿元的B轮融资。周伟也于2015年入选“福布斯中国30位30岁以下创业者”榜单并成为封面人物。
2017年,周伟和郭盖华两人再次踏上创业征程,乐动机器人成立了。
从乐行天下再到乐动机器人,周伟积累了大量机器人产业经验。
以至于创业多年后,公司遇到难关时,他还能保持技术者的敏锐直觉。
2022年那段时间,国内外宏观环境与资本市场低迷,乐动机器人的经营状况并不乐观。
高研发投入、商业化周期长、订单规模受限,投资者都开始劝周伟降低研发投入,优先保证业务。
但究竟是要短期现金流,还是积累长期技术壁垒?这是科技创业公司常见的典型试题。
顶着投资人的压力,周伟决定all in感知技术。
原因很简单。他认为感知不是一个阶段性需求,而是所有机器人未来都会需要的底层能力。
事实证明,这个判断最终迎来了行业回报。
2024年至2025年,机器人产业进入新一轮爆发期,乐动早期的技术投入开始释放价值。
对外,周伟常半开玩笑说,当初的决定源于一时直觉。
所谓直觉,其实都是长期认知形成的本能。没有二十年机器人领域的功力,恐怕很难做出这般取舍。
One more thing
传统AI和物理AI最大的不同,是后者在面对一个复杂、连续、不断变化的现实空间。
谁能把这个空间高质量地数字化,谁就掌握了下一阶段机器智能的入口。
从这个角度看,乐动正在做的事情,已经不只是提供感知硬件,它更像是在建设一套物理世界的数据加工体系。
让机器人看懂世界,让模型理解世界,再让机器人基于真实世界不断进化。
从传感器产品公司,到物理AI的「感知基础设施平台」,乐动正在完成身份重塑。
热门跟贴