具身机器人,终于能干“细活”了。
作者丨高景辉
编辑丨马晓宁
今年上海AWE展会的现场,最火的关键词莫过于“机器人”。无论是人形机器人跳舞、搏击,还是四足机器人爬坡、越障,都赚足了现场观众的目光。
但与一众靠表演出圈的机器人展位不同,它石智航在展台现场有一场别开生面的仪式——3月12日上午,吉尼斯世界纪录认证官在它石智航展位,为其颁发了“机器人在一小时内装配亚毫米级线束最多次数”的吉尼斯世界纪录证书。
在3月10日,它石A1机器人在1小时内,完成了超百次0.5mm²的精细柔性线束完整装配任务,最终以超过挑战要求次数50%以上的最终成绩,拿下了这项中国具身智能在工业精密操作领域的首个吉尼斯世界纪录。
这项挑战,素来被称作工业自动化界的 “哥德巴赫猜想”,需要攻克柔性线束易变形难建模、亚毫米级接口对位精度要求严苛、插拔力控容错率极低、长时重复作业稳定性难保障等多个长期困扰行业的难题。
而它石智航之所以能挑战成功,主要归功于它石自研的通用具身大模型「AWE3.0」。该模型的能力具有“走出温室、落地干活、通用泛化”的特点,在亚毫米级精度操作、柔性物体感知控制、长程任务稳定执行、跨场景迁移等方面都实现了突破。
这意味着,这项世界纪录的诞生不是一次偶然,而是技术进步下的必然,同时也揭示了一项令人兴奋的事实:具身机器人面向真实产业场景的 “干活” 能力,终于迎来了里程碑式的突破。
01
工业自动化界哥德巴赫猜想,被它石解决了
过去几年,大众对机器人的认知,大多来自各类出圈的名场面:能完成高难度跑酷、整齐舞蹈的人形机器人,能爬楼梯、翻越障碍的四足机器人……这些令人惊叹的表现,本质上考验的都是机器人的“locomotion(运动)”能力。
运动能力的核心,是机器人对自身硬件结构的精准控制,哪怕是动态环境下的避障与动作调整,本质上也是对自身运动轨迹的优化,大多基于预设的动作模型与场景边界完成优化。但对工业场景而言,真正能转化为生产力的,是“manipulation(操作)”能力。
这两种能力的难度有着本质区别。如果说运动能力是机器人“管好自己的身体”,那操作能力就是让机器人“改变外部世界”,后者需要的技术远比前者复杂,就像行走对于绝大多数动物都很简单,但能使用工具的只有灵长类等少数几个物种。
这也是为什么,当前已经实现规模化落地的工业机器人,大多只能完成码垛、上下料等简单的刚性物体操作,面对需要精细控制、柔性适配的复杂工序,始终难以突破。而线束装配,正是工业自动化领域公认最难啃的硬骨头之一,甚至被称作工业自动化界的 “哥德巴赫猜想”。
什么是线束装配?通俗来说,就是工业场景里的“极限穿针引线”。机器人需要拿取极易变形的柔性线束,将插头精准穿过端子,再插入间隙同样为亚毫米级的对应接口中,全程必须满足严苛的精度与力控要求,才算一次有效装配。
对工业生产而言,这是一道绕不开的刚需工序——小到手机、电脑等 3C 产品,大到汽车、飞机、高铁,几乎所有带电的工业产品,都离不开线束装配。
但就是这道基础工序,长期以来几乎完全依赖人工,因为其背后的技术难点,几乎戳中了传统工业机器人的所有能力盲区。
首先是柔性物体的不可控性,线束没有固定形态,拿取、移动过程中随时会发生弯曲、扭转,无法像刚性零件一样精准建模,传统机器人根本无法预判和应对这种随机形变。其次是亚毫米级的极致精度要求,接口间隙达到亚毫米级,需要视觉定位、力觉感知、轨迹规划实现微米级的协同,稍有偏差就会导致装配失败,甚至损坏元器件。
同时,这项工序对力控的平衡要求极高,插拔过程中,力度过小无法完成装配,力度过大则会撞坏端子,必须在极窄的范围内实现力度的精准控制。更重要的是,工业生产需要的不是一次两次的成功,而是长周期重复作业的稳定性,一小时内上百次重复操作,如何控制误差累积、避免动作卡顿抖动,对机器人的控制系统是极致考验。
也正因如此,线束装配行业长期面临着招工难、人力成本高、人员流失快的困境 —— 即便是熟练工人,也需要经过 3-6 个月的专业培训才能上岗,而高强度、高重复度的工作属性,让行业年轻工人的流失率居高不下。
它石 A1 机器人这次的挑战,证明了这个困扰行业多年的难题,终于迎来了可落地的智能解法。更关键的是,本次挑战的场景是对真实工业线束场景的1:1复刻,而非为了冲纪录定制的特殊环境,这意味着这项技术能力,具备直接走进工厂生产线的落地基础。
02
它石细活背后,是AWE模型持续进化
要完成这样高难度的连续精密操作,从来不是靠单一硬件的升级,而是需要一套完整的、能适配真实工业场景的具身智能体系。它石智航的核心底气,正是由首席科学家丁文超博士日前正式发布的全球首个能干活的通用具身大模型AWE3.0。
机器人要完成精准操作,第一步是要真正 “看懂” 并 “预判” 所处的世界,而不是像传统视觉方案一样,一帧一帧地重新理解画面。AWE3.0 继承并优化了兼顾实时性与精度的世界表征能力,通过自研的世界分词器,将视觉、触觉、本体感觉等多模态传感器输入,转化为结构化的紧凑世界状态,为机器人构建了一个持续更新的4D “数字化世界沙盘”。这个沙盘不会随着画面帧的切换重置认知,而是能持续保留对场景的理解,不仅能精准感知物体的位置与形态,更能预测其运动和相互作用的结果,提前规划动作路径。
在线束装配的过程中,这意味着机器人能实时预判线束的形变,同步调整动作,而非等偏差出现后再被动修正。数据显示,AWE的空间描述精度超过行业基准21%,推理速度达到行业基准的2.21倍,有效解决了工业场景对精度与实时性的双重刚需。
看懂了物体的位置,还需要理解交互的逻辑。线束装配的核心难点,从来不止是 “看得准”,更是 “控得住力”。传统的机器人方案里,视觉定位和力控往往是分离的模块,很难实现深度协同,而AWE3.0在统一的模型架构内,实现了空间理解与物理推理的深度融合。
一方面,凭借持久、视角一致的世界表征,系统能在视角变化下保持稳定的空间理解,精准锁定接口的三维位置;另一方面,世界状态集成了触觉与接触信息,使模型能精准推理接触动力学,基于预测的接触结果生成动作,而非依赖被动的反应式控制。就像熟练的产业工人,眼睛看准位置的同时,手上已经预判了插拔需要的力道,一气呵成完成装配,这正是具身智能感知-推理-行动闭环深度融合的体现。
真实的工厂环境,永远不可能和实验室的训练场景完全一致。生产线的布局、设备的安装角度、工位的光照条件,都会发生变化,传统工业机器人往往需要为每一个工位做定制化调试,落地成本高、周期长,这也是精密操作自动化难以规模化推广的重要原因。
而AWE3.0实现了决策逻辑的重要升级,基于它石全视角通感决策OSD(Omni-Sense Decision),模型推理不再直接依赖有限的相机视角,而是基于构建的世界状态进行决策。哪怕面对训练中从未见过的全新视角,系统也能通过对世界状态的推理,生成稳定的执行动作。在RLBench基准测试中,这种能力让机器人在未见视角下的任务成功率提升了 3倍,大大降低了场景适配的成本,让机器人真正具备了规模化工业应用的泛化能力。
AWE3.0 的精细操作能力,离不开它石WIYH数据集的爆发式增长——目前该数据集已积累超百万小时的具身数据,覆盖了六大类工业操作的接触模式。基于这些数据,它石打造了视觉-触觉世界动作框架 OmniVTA,让AWE3.0能以30Hz的频率产生细粒度动作,实时感知接触状态的变化并快速响应调整。正是这种极致的感知与控制能力,让机器人能驾驭柔性线束的亚毫米级装配,攻克了传统机器人无法突破的精细操作壁垒。
值得一提的是,在成立之初,它石智航就提出了“Human-centric”(以人为中心)的数据采集新范式,填补了具身智能所需的高质量、可泛化、大规模真实世界数据的空白,为具身基座模型实现Scaling Law提供了关键语料。丁文超博士日前在发布AWE模型时也解释,“什么样的数据才能让机器人真正懂物理世界?我们认为Human Centric数据才是唯一解,而不是用遥操或仿真数据得到一个头重脚轻、不能在真实复杂环境用的VLA模型。”
当然,一次装配成功不难,难的是一小时内上百次连续操作都能保持稳定与流畅。工业生产最怕的,就是机器人动作卡顿、轨迹抖动,不仅会影响产品良率,长期作业还会出现严重的误差累积。针对传统机器人异步推理导致的动作不连续问题,AWE3.0提出了隐空间重用再细化动作策略(RTR),通过“预判+微调”的机制,在隐动作空间中保留上一动作的剩余部分,并用新推理的潜在动作进行微调,有效消除了动作块切换时的跳变与卡顿。
测试数据显示,这项技术让机器人的动作轨迹抖动降低超过45%,让动作执行更连续、更丝滑。同时,结合世界对齐的隐动作空间,系统不仅能实现毫米级的执行精度,还具备从接近失败的状态中自动恢复的能力,哪怕线束出现意外形变,也能及时调整修正,保障了长周期作业的稳定性与一致性。
03
它石智航的一小步,具身智能落地的一大步
它石智航这一项吉尼斯世界纪录的背后,并不只是技术参数的突破,而是整个具身智能行业发展方向的重要校准,是中国高端制造业智能化升级的关键一步。
从技术维度看,这次突破重新定义了具身智能的核心价值。长久以来,全球具身智能行业都陷入了“炫技误区”,各家企业纷纷比拼机器人的运动极限,却忽略了具身智能的终极使命——成为能替代人工、创造价值的生产力。
它石这次的挑战,恰恰回归了这个最朴素的本质。超百次有效装配,是可重复、可验证、可交付的工业化能力,标志着中国的通用具身大模型,已经真正实现了从“理解世界”到“改造世界”的跨越,让具身智能的发展,从“比谁更能演”转向了“比谁更能干”。更值得一提的是,这项技术填补了行业的用工缺口。机器人接过这些重复性工作,恰恰能缓解行业用工压力,推动制造业向更高附加值的方向升级。
从产业维度看,这次突破为制造业的共性痛点提供了真实解法。线束装配是制造业的基础共性工序,小到手机、电脑等3C产品,大到汽车、飞机、高铁,每一件工业产品的生产都离不开这道环节。这个千亿级的赛道,长期被人工依赖的痛点困住,自动化率始终处于极低水平。
从宏观维度看,这次突破是中国新质生产力在高端制造领域的具象化体现,更是中国在全球具身智能赛道抢占制高点的重要标志。
从实验室的技术突破,到工厂里的落地实干,从来都是科技产业最难跨越的一道鸿沟。它石智航用一项吉尼斯世界纪录,证明了中国具身智能已经跨过了这道鸿沟。当机器人真正学会了“干细活”,当通用具身大模型真正走进了千行百业,我们终将看到,科技创新如何真正驱动产业变革,为中国制造业的高端化、智能化升级,注入源源不断的新动能。
未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
热门跟贴