具身智能的浪潮,正将灵巧手推向一个新的十字路口。
一面是高涨的产业预期,作为人形机器人实现精细化操作、打开通用场景大门的“钥匙”,灵巧手迅速成为资本与技术的汇聚点。
另一面则是混沌的行业现状。指标定义模糊、技术路线纷争、商业化路径尚未明晰。在“有”和“能用”之间,在“演示”和“落地”之间,仍横亘着一条巨大的鸿沟。
近期,星动纪元产品副总裁王乐天的一次演讲与深度访谈,恰好为我们提供了一个切入这场争论的绝佳样本。
这家脱胎于清华大学交叉信息研究院的明星具身智能企业,凭借其XHand系列灵巧手累计销量超千台的市场表现,已经成为了该领域一个绕不开的关键玩家。
但如果我们对其手的审视,仅停留在“全直驱”、“高自由度”等差异化参数上,或许还远远不够。在机器人大讲堂看来,星动纪元的逻辑内核,并非单纯地制造一只“好手”,而是试图诠释一种全新的具身智能需求范式:灵巧手的真正价值,在于其能否成为与AI算法“共生进化”的物理载体。
简而言之,手和脑,必须一起变聪明。
01.
硬件要为“算法”而生
行业惯常的思路,是先打造一款机械性能强悍的手,再让算法去适配硬件。但星动纪元的灵巧手设计起点截然不同。
软件定义硬件——这是星动纪元内部的说法。
王乐天解释了这个逻辑:为了强化学习能work,必须全驱;为了模仿学习数据干净,必须全驱;为了量产一致性,必须全驱。硬件的选择,是由软件的需求倒推出来的。
因为硬件的选型,要为软件的目标服务。王乐天在接受机器人大讲堂采访时直言,“你的目标是什么,决定了你需要什么样的硬件。如果你笃定学习算法是未来,你就必须选能最好支持学习算法的硬件架构。”
2024年,市场上已有的灵巧手方案有限。要么是庞大、无法实际部署的整只手,要么是自由度极低、能力天花板上限明显的欠驱方案。这些都无法满足下一代AI训练的需求。
“我们一直寻找的,其实并非一只今天看上去更强的手,而是一个能让智能持续生长、最终在真实世界里真正作业的物理起点。”他说。因此AI时代的最优硬件,或许不是性能最强的硬件,而是与算法互动最“自然”的硬件。
这句话绝非空谈。强化学习需要的是一个“自由探索”的空间,要让AI智能体在物理世界自由探索策略,它需要一个完全解耦、可控、可逆的物理环境,而非一个处处限位的机械结构。这也解释了为何星动纪元从一开始便坚定地选择了“全直驱”这条技术门槛和成本都更高的路线。原因很纯粹,就是为了算法训练的“友好性”。
想要训练算法,全驱是必要前提。因为每个手指关节都有独立电机驱动,数据之间相互正交,没有复杂的耦合关系需要算法消耗额外算力去解算。这避免了像连杆或腱绳方案那样,需要算法额外消耗算力去解算复杂的非线性传动关系。
直驱则带来了线性的电流-力矩关系和关节角度关系,这为基于电流环的力控和精准的运动控制铺就了一条没有障碍的高速路。用他的话来说,“强化学习的策略,在非独立不耦合的系统中是很难训练。”星动纪元选择全直驱,本质是为了降低算法的认知负担,让AI能够“轻装上阵”。
如果说全驱和直驱是让手更好“听脑指挥”,那么直驱方案原生的“反驱”能力,则是让手“懂脑包容”。这种能力让手指可以被外部力量自由推回,能在多个环节扮演不可或缺的角色。
例如在数据采集端,它能基于主端遥操作示教更好记录下最贴近人手的自然运动,实现高保真的数据灌注。理想的灵巧手一定是最优的数据采集平台。因为全直驱方案每个关节都自带角度编码器,天然就是一个最贴近人手运动学结构的“外骨骼”遥操作采集器。
这意味着,从数据采集、模型训练到最终部署执行,整个流程可以在同一套硬件架构上无缝完成,Scale和gap得以最小化,从而解释了为什么“XHand”能被全球超过20篇强化学习、VLA等前沿领域的顶会论文作为基础平台。因为它恰恰提供了一条Sim2Real最短的迁移路径,实现了采集-训练-部署的数据闭环。
而在模型推理端,“反驱”特性成为一道宝贵的物理缓冲阀。例如当VLA大模型给出的宏观抓取指令存在厘米级误差时,灵巧手可以通过被动的柔顺性去“适应”物体,而不是硬碰硬地撞击,从而避免了“不是任务失败,就是硬件损坏”的双输局面。这一特性也就是王乐天所提到的“弥补宏观指令微观不足”关键能力。
可以发现,这种硬件主动为算法“赋权”的设计哲学在业内依然有些“反直觉”,但这个区分,实则反而成就了其灵巧手在算法层面更强大的“鲁棒性”,从而成为其灵巧手方案能快速用于研究和走向规模化落地的关键。
02.
工程化落地的“真实测试”
如果说AI友好性决定了灵巧手的“上限”,那么工程化可靠性则决定了其“下限”。星动纪元的独特之处还在于,在具身智能落地过程中,它基于大量客户反馈,构建了一套区别于实验室标准的灵巧手真实世界标准。
王乐天的演讲中最具冲击力的一个观点,在于对灵巧手寿命的祛魅。当行业普遍吹嘘“空载寿命”可达百万次时,他尖锐地指出:“就像开车你不能一直开在高速公路上,灵巧手也从来不是在空载状态下使用。”
他指出,因为在真实的抓取、转运、装配场景中,灵巧手面临的是全方位的“物理虐待”:外壳的意外撞击、抓取瞬间的冲击负载、持物等待时的电机堵转。这三种工况,构成了考验寿命的“真实魔鬼三角”。基于此,星动纪元一直试图将参数战的焦点从“空载寿命”转向“负载寿命和冲击寿命”,这不仅是对自身全直驱方案天然对冲击负载有较高耐受的自信,更像是一种重塑行业评价标准的尝试。
同样,对于产品精度,他们也试图建立更严谨的定义。在其XHand系列产品上,他们同时标定了“单关节背隙”与“指尖重复定位精度”这两项在工业自动化领域非常成熟,但在灵巧手圈却语焉不详的指标。
机器人大讲堂还注意到,在“重复定位精度”指标上,星动纪元也罕见明确区分了“受力”和“不受力”两种测试状态。这种对细节近乎偏执的披露,其意图指向一个更宏大的目标:为灵巧手建立一套可量化、可复现的行业接口标准,从而更好推动其“科研演示样机”走向“可信赖的生产力工具”。
星动纪元灵巧手的工程化思维,也体现在其对物流场景的思考上。近期顺丰领投星动纪元最新一轮融资的原因在业界被传得沸沸扬扬。在采访中,王乐天解释了一部分原因。在物流领域星动纪元早就观察到,欠驱手在抓取不规则包裹时,由于角度固定,常常需要以非理想的姿态、用超额的夹持力“凑过去”抓取。但这既损伤包裹,也降低了节拍。而全驱手的多自由度调节能力,天然适配这类非结构化、要求柔性抓取的场景。为此,星动纪元针对该类场景,进行了更进一步的深度开发,目前基本能够满足这类场景的真实需求。
从“能抓”到“会抓”、“智抓”,这其中所需的能力代差,或许正是其商业价值的基石。客户多次复购,物流单笔订单达5000万,这些数字背后,不是一个零部件供应商的胜利,而是一套能持续进化、解决实际问题的“手-脑协同”方案的真实价值正在体现。
当然,全驱和参数领先的代价是工程上的。星动纪元目前量产的灵巧手,重量880克。这个数字在灵巧手里不算最轻。全驱手不需要绳驱的传动机构,但需要更多的电机,通常一只手需要12到18个电机,每个电机加上减速器,再加上驱动和控制电路,这些重量是刚性的。因此,880克的重量背后,是一整套工程取舍:电机选型、减速比匹配、壳体材料、散热设计,每一个环节都在重量和性能之间找平衡,也是值得继续优化的方向。
值得一提的是,在灵巧手客户为科研客户为主导的当下,星动纪元的灵巧手已经走向工业界真正干活——在探索物流、制造场景的海内外具身企业,多选用星动纪元的全驱手。星动纪元灵巧手去年已实现千台级别年产量,从利好大脑研究的「科研手」到经得起工厂作业试炼的「干活手」,也带给了业界关于星动纪元灵巧手更多的想象空间。
03.
结语与未来
回望星动纪元的案例,它的全部实践都在回答一个朴素而深刻的问题:在具身智能时代,什么才是一只真正的、有用的“灵巧手”?
在王乐天的演讲和叙述中,可以清晰看到一条贯穿始终的线索,即用AI的需求定义硬件,用真实场景的反馈迭代硬件,最终让硬件成为AI能力无缝释放的物理根基。这种“系统思维”,或许正是其获得众多模型公司、整机厂,乃至顺丰这种产业巨头认可的核心原因。
因为星动纪元的故事,并非关于一只“万能手”的独角戏。对于整个具身智能产业而言,星动纪元的成功,或许也意味着灵巧手的竞争早已超出机械结构的范畴。未来的赢家,不会是那些仅仅在参数表上“我有而别人无”的厂商,而是那些能深刻理解“AI想要什么”,并能将其工程化为一只“可靠、可测、可控、可进化”的物理手的企业。
从“有”到“做到”,再从“做到”到“做得好”,这不仅是星动纪元的自我要求,更是整个行业从噱头走向价值所必须跨越的三重门。
只有真正能满足这些要求的手,才能真正重新定义什么才是真正的“灵巧”。
热门跟贴