出品|网易科技《态度AGI》对话第47期

作者|崔玉贤

编辑|丁广胜

“2026年我们要建成100万小时的具身真机数据产能,我们目标是建成全球最大的具身真机数据集。”鹿明创始人喻超表示。

从2025年的10万小时数据集采产能到2026年100万小时,这不是大跃进,而是鹿明机器人独有技术优势下的绝对自信。

2026年开年,鹿明机器人召开了一场沟通会,带来了其自主研发的FastUMI Pro(无本体模仿学习)数据采集系统。UMI是一种通过便携式设备在真实环境中采集人类操作数据的技术,用于训练具身智能机器人,具有低成本、高兼容性和高效率等核心优势。

曾经这是一种比较冷门的具身智能集采方式,而现在却逐渐成为主流。鹿明机器人联席CTO丁琰是国内最早研究和推动UMI这种数据采集方式的从业者,从2024年博士毕业后就开始从事相关研究工作。如今,终于成为具身智能主流的数据集采方式。

据介绍,与传统遥操作采集方式相比,FastUMI Pro通过创新的硬件架构与软件算法,将单条数据采集时间从50秒缩短至10秒,效率提升5倍,同时将综合成本降至传统方法的五分之一。更重要的是,该系统实现了数据与机器人本体的解耦,可快速适配市场上数十种不同的机械臂和夹爪,有效打破了数据孤岛。

在丁琰看来,数据、算法、硬件是非常强耦合的系统,任何单点的失效都会导致一个优秀的模型不可能诞生。“数据决定模型的性能,硬件决定数据的质量,数据又会决定算法的性能,算法又反向约束硬件的执行和数据的设计。所以说这三环息息相关。”

这也是为什么有些公司采用UMI的数据集采方式产生了很多“废数据”,模型训练不好的原因。但鹿明机器人的FastUMI Pro从一开始就是为了模型的成功去做。

FastUMI Pro集成了为UMI场景定制的高性能传感器,能稳定实现60Hz高频记录,确保多模态信息的毫秒级同步。配合鹿明独创的8道工业级数据质量评估体系,从采集源头淬炼出“高纯度黄金数据”,使数据有效率从行业普遍的70%提升至95%。

据了解,鹿明机器人的数据集采标准不仅高于行业标准,而且高于个别企业提出的高要求。目前,全球具身智能圈内,有超过三分之二的顶尖团队,正在使用FastUMI Pro。

据悉,鹿明机器人的数据采集业务海内外客户已有几十家,包括全球最领先的具身智能算法公司和顶尖大学实验室等,目前公司数据采集与交付能力已接近满载。

在谈到营收时,鹿明机器人创始人兼CEO喻超认为2026年的目标将是9位数。

打开网易新闻 查看精彩图片

以下为网易科技等与鹿明机器人创始人兼CEO喻超、鹿明机器人联合创始人赵广智以及鹿明机器人CTO丁琰沟通的部分内容:

提问:鹿明的数据质量标准与行业标准的差异?

丁琰:其实我们已经陆陆续续收到好多家不同类型客户的标准,我们在给客户交付的时候,数据质量都能够符合、甚至远高于客户的标准。

提问:PPT演示中有非常完整UMI这种数据采集平台,也有很多本体的落地,在模型层面似乎没有看到太多的展示,鹿明在模型这块的规划是什么?

丁博:做任何事都会有自己的timeline。我就是做模型出身的,我之前一直在训模型,当时我们在做的时候就发现一个很大的问题——要想训一个非常好的模型,必须要有一个很好的数据管线,包括数据生产、数据评估、数据筛选,建立的过程本身就需要时间。

我们团队当时就决定,二选一的话肯定先选数据,不能上来就干模型,还希望把数据做到最极致。

因为模型架构拼到最后,大家拼的不是模型架构,而是模型数据的质量,这是一个行业公共的认知。到目前为止我们的数据管线已经完全搭建成功了,可以源源不断产生非常好的数据,目前阶段我们不会去训模型。

提问:具身智能企业采用了UMI的方式训练了之后,他们本身的模型能力,包括泛化性有哪些比较显著的提升?

丁琰:因为UMI本身最近才热起来的一个词,我虽然做的很早,但是整个行业做的其实挺晚的。应该是在2025年9月份左右。 之前用的更多是遥操作,或者是一些数据去训自己的模型,现在大家逐步的才去买我们的设备,用我们的数据,可能未来三个月也会陆陆续续看到用我们的数据训出的模型,马上就要开源或者是发布一些新闻。

提问:从投资的角度展望一下2026年具身智能的融资热会热到哪些环节?

赵广智:坦率的说,虽然我做投资出身,但是现在已经不做投资了。我们目前思考问题的方式,其实不太按照这个方式去思考,我们更多的考虑到是在终局的时候这个行业需要什么。那毫无疑问一定是需要通用的具身智能体,那一定是数据。

数据、硬件和场景这三方面的能力是都要具备的。如果达到这样的未来,对我们来说其实很清晰,那就是数据是现在最重要的基础设施,我们把数据去夯实,然后在场景里面把通过数据基础设施的夯实,再去做场景的结合和落地。落地的时候自然结合我们的硬件,带动我们硬件的规模化,这个路线我们内部是非常清楚的。 提问:各家机器人公司在本体模型,数据、场景等能力都在布局,但是各家的侧重点可能是不太一样的。您认为说当下最重要的能力是什么?这几个能力的优先级是什么?

喻超:这三个要素里面,从原则来看肯定都是足够重要的,只是说各家卡位点不完全一样。对我们来说,早期的时候一定是数据,然后再加上跟场景,然后适配硬件。

提问:未来一年鹿明要做到多少营收?什么时候做到一个盈亏平衡?或者说我们要做多大的利润?

喻超:我们内部肯定是有关于这样的规划。但是我坦诚说一点整个行业包括我们在内眼光要放的更长线一点,应该锚定怎么去实现最终的通用智能。

营收的事我们很有信心的,今年我们的营收目标肯定是九位数。

提问:鹿明在To C方面产品的构想是什么?

喻超:团队有做 To C 产品的这种经验的,但当前不是公司的战略重点。

提问:鹿明成立到现在到未来的终局,目前正处于哪个阶段呢?

喻超:蓬勃发展的早期。

提问:数据库的话,采集过程中最难的是什么?是人还是流程?

丁琰:人,人还是人,流程只是为了人去设计的。建素材场的时候就会意识到很大的问题,人是最难管理的,非常非常难管理,他会有很多噪声。就举个例子,当时在给智元做数采顾问的时候,他们有一个任务,说机器人把门把手抓起来,然后推过去关上门,然后有些人他就会直接一推。结果达到了,但不是我们规定设计的任务,这种数据就很难训。