现阶段,人工智能显然离不开“人工”。
01
数十万的机器人只是大号遥控玩具?
“宇树科技做得很好,但他是在一个很基础 leve! 做了一个很好的集成,把它放到工厂、家庭,都不可能,而且它是全遥控的可以认为它只是比汽车的骡车还早一期的形态。”小鹏汽车董事长兼CEO何小鹏谈及当下爆火的人形机器人时,“全遥控”一词点出了不少人心中的疑惑。
在科幻片持续十余年甚至几十年的熏陶下,大多数人心中的人形机器人应该是可全自主运行的,最起码应该是语音控制的,可谁承想花几十万买到的人形机器人却是需要用遥控器控制的。
前不久,来自长沙的雷先生在网络平台发布视频,“全国第一台!喜提30万的大玩具:宇树G1人形机器人。”不过其在视频中表示,“该机器人目前只能使用遥控操作,因为之前看过它的视频是可以跳舞的,但是现在的话只能遥控,还不能跳舞,有一点小失望。但是它后期如果OTA能更新,一两个月后能跳舞的话,我觉得还是可以的。现在它的功能相对简单,就像一个两三岁的小孩,只能做出伸手、握手、挥手、转头一些基本的动作。”
事实上,不仅仅是宇树机器人需要操控让不少粉丝失望,去年底特斯拉TeslaBot机器人亮相时,同样因涉嫌真人遥控引发争议。去过发布会现场的科技投资博主 CyberCat 在《硅谷 101》播客中也谈到,他曾经问过现场的特斯拉工作人员,这些机器人是否是远程控制的。 对方的回答是“一定程度上是的”。
02
人形机器人为何离不开遥控器?
人形机器人要实现全自主运行,需要从环境感知、决策算法到多模态交互的多系统融合,但当前的人形机器人无法实现对陌生环境的感知,更谈不上自主决策与交互。
以宇树机器人为例,其在春晚舞台上成功实现梅花桩行走,得益于之前不断地针对舞台这一特定场景的持续训练实现的。机器人操控员通过定场景的自主训练不断采集环境数据,并模拟各种可能发生的情况对机器人反应进行预先训练,从而实现观众眼中的“机器人自主表演”。
同时, 现有 AI模型对开放性任务的语义解析与动作分解存在延迟(如自然语言指令响应需 5 秒以上),导致实际应用中需通过遥控器输入精确指令以弥补算法决策的滞后性。
再加上硬件成本限制(如核心芯片性能、传感器精度)迫使厂商在算力分配上权衡自主功能与实时控制的需求,现阶段更倾向后者以保证基础稳定性。
从技术路径看,宇树G1的遥控需求与其数据驱动的发展策略密切相关。机器人上肢的抓取、叠衣服等日常动作需要极高的环境感知与微调能力。由于物理世界中的摩擦力、物体形状等变量复杂,单纯依靠算法预编程难以覆盖所有场景。因此,通过“人肉遥控”采集真实人类动作数据,成为解决这一问题的关键途径。
03
点评
人形机器人的“数据饥渴”
当前人形机器人的训练高度依赖模仿学习(Imitation Learning),即通过大量人类动作数据优化模型。
特斯拉、宇树等企业通过招募数据采集员,穿戴动作捕捉设备执行日常任务(如叠衣服、系鞋带),生成机器人的训练数据集,而这种数据采集分为遥操作数据和虚拟环境数据两类,前者操作员通过动作捕捉服实时控制机器人,记录其关节转角和环境反馈,生成高精度、可直接复用的数据,后者则是由操作员在模拟场景中操控虚拟机械臂,结合物理引擎生成半合成数据,降低实际硬件损耗风险。
宇树科技在动作捕捉领域的合作伙伴诺亦腾指出,2023年后机器人企业对动捕设备的需求激增,订单量增长超6倍,印证了数据采集的规模化需求。因此,这种“人肉遥控”的本质,其实是通过人类示范填补机器人动作库的空白,尤其在复杂场景中实现泛化能力。
尽管当前依赖人类示范,宇树科技创始人王兴兴认为,机器人AI模型的突破将逐步减少对“人肉遥控”的依赖。他预测,通用型机器人AI模型可能在2025年后出现,结合大语言模型的多模态能力,最终实现自主决策与动作生成。
欢迎通过邮局渠道订阅2025年《电脑报》
邮发代号:77-19
单价:8元,年价:400元
编辑|张毅
主编|黎坤
总编辑|吴新
爆料联系:cpcfan1874(微信)
壹零社:用图文、视频记录科技互联网新鲜事、电商生活、云计算、ICT领域、消费电子,商业故事。《中国知网》每周全文收录;中国科技报刊100强;2021年微博百万粉丝俱乐部成员;2022年抖音优质科技内容创作者
热门跟贴