Helix,驱动Figure人形机器人的AI大脑,已升级到迄今为止最先进的全身控制系统。

与早期仅限于上半身任务的模型不同,Helix 02使用单一神经网络直接从原始传感器数据控制行走、操作和保持平衡。

在一次重要的演示中,这款人形机器人自主地在整个厨房里卸下和重新装上洗碗机,无需重置或人工输入。

根据Figure的说法,该系统用学习到的类人运动取代了复杂的手动编码控制,开启了新的灵活性。

在2025年2月,总部位于加利福尼亚的公司发布了Helix,这是一种通用的视觉-语言-行动(VLA)模型,结合了感知、语言和控制,以推动机器人技术的进步。

统一的人形机器人自主控制

统一的人形机器人自主控制

几十年来,运动与操控——机器人以一种连续的方式移动和操控物体的能力——一直是机器人技术中最困难的挑战之一。行走和操控在孤立状态下表现良好,但将它们结合起来会引入持续的相互影响:抬起物体会影响平衡,迈步会改变可达范围,手臂和腿部会相互制约。

虽然人形机器人展示了令人印象深刻的短暂预演,但大多数缺乏真正的适应能力。它们的动作通常是在离线状态下规划的,在现实世界条件变化时就会出现问题。

传统机器人技术通过将运动(locomotion)和操作(manipulation)分离为由状态机连接的不同控制器来解决这个问题,导致了缓慢、脆弱和不自然的行为。真正的自主性需要一种根本不同的方法——一个能够同时感知、决策和行动的统一系统。

因此,Helix 02 的动机是一个统一的全身运动-操作 VLA 系统。Helix 02 引入了系统 0,这是在 Figure 现有的系统 1 和系统 2 层次结构上新增的基础层。系统 2 处理高层次的推理和语言,系统 1 将感知转化为高频率的全身运动,而系统 0 以千赫兹的速度执行类人平衡和协调。

根据 Figure 的说法,该系统经过超过 1,000 小时的人类运动数据和大规模仿真的训练,系统 0 用学习到的先验替代了手工设计的控制,实现稳定、自然的运动。三个系统共同实现了连续、自适应的全身自主性——让类人机器人能够实时行走、搬运、伸展和恢复。

端到端的人形控制

端到端的人形控制

图中显示 Helix 02 在人形自主性方面迈出了重要一步,能够执行需要紧密整合运动、灵巧性和感知的连续多分钟任务。

在完全自主的评估中,该系统能够完成长时间的运动和操作,而无需遥控或重置。一项旗舰演示中,Helix 02 在一个全尺寸厨房内,完成了四分钟的端到端任务,装载和卸载洗碗机——这是迄今为止最复杂的自主操作序列,也是人形机器人首次实现的长时间“像素到全身”控制。

这个任务展示了几个能力:在保持精细抓握的同时还能行走,使用整个身体与环境互动,以及在复杂物体转移和放置过程中协调双臂。同一个神经网络控制着从毫米级的手指运动到房间级的运动,在几分钟的执行过程中,顺序执行了超过60个动作,并进行了隐式错误恢复。

Helix 02 还通过触觉传感和掌上摄像头提升灵巧操作能力。在自主测试中,机器人能够拧开瓶盖,从整理器中提取单个药丸,尽管有遮挡,在可变阻力下精确分配注射器的体积,并从杂乱的容器中选择小金属零件。

根据这家机器人公司的说法,这些结果综合起来显示了 Helix 02 如何结合全身控制、触觉和手中视觉,在复杂现实任务中实现连续自适应的自主性。

“这些结果虽然还很初步,但已经展示了连续全身自主性所能实现的可能性。在一个4分钟的自主任务中,机器人流畅地执行了61个操作,灵巧行为得益于触觉传感和掌上摄像头,同时全身协调利用了臀部、脚、手和手臂,”Figure 在一份声明中说道。