ROBOT INDUSTRY
2024年下半年,人形机器人赛道持续火热,却至今未出现“人形机器人第二股”。第一个“吃螃蟹”的深圳市优必选科技股份有限公司(以下简称“优必选”),现阶段经营状况趋于稳健,科研活力持续向好,为国内机器人行业传递出积极信号。
机器“打工人”——Walker S,是优必选钻研人形机器人12年以来向世界交出的答卷。7月初,优必选工业版人形机器人Walker S Lite进入吉利控股集团旗下极氪5G智慧工厂,在CTU入库上料工位协同员工执行搬运任务。截至目前,Walker S Lite已“入职”极氪5G智慧工厂近一个月,成为全流程执行料箱搬运任务的“一把好手”。
为什么汽车制造业是人形机器人的试炼场?蔚来汽车前瞻制造工程人形机器人战队负责人乙鹏曾在公开演讲中这样解释:“一方面,汽车制造业的工业数智化水平高,海量数据利于大模型的构建和具身智能的开发。另一方面,汽车制造可以向下兼容到其他的工业制造场景,人形机器人在汽车制造领域的应用具有天生的泛化优势。”
继蔚来、东风柳汽和一汽-大众青岛分公司后,极氪5G智慧工厂是第四家和优必选达成合作的汽车工厂。优必选官方媒体稳定更新机器人的工作花絮,邀请内行人一同见证人形机器人融入工业生产的过程和突破性进展。
图1 优必选人形机器人Walker S 在东风柳汽总装厂车间
优必选在中国人形机器人行业内,称得上是商业实力、技术潜力和品牌声量兼修的“优等生”。《机器人产业》杂志记者对话优必选副总裁、研究院执行院长焦继超,一同探讨人形机器人的发展之路沿途风景几何。
1
自我造血——人形机器人可持续发展的第一步
截止到2023年底,优必选Walker系列人形机器人一共经历了五次迭代,这背后离不开恒久的资金和技术积累。焦继超回顾优必选创业之初,公司从伺服驱动器入手研发,逐步扩散到运控、感知等技术,这些技术从各行各业带来营收,确保优必选人形机器人项目有稳定的科研资金供给。焦继超透露道,“截至目前,我们已经设计和生产了40多种不同的伺服驱动器,实现了从小扭矩到大扭矩伺服驱动器批量生产,并在不同系列机器人上实现大规模应用。”同时,优必选早期推出的小型人形机器人Alpha,让技术得到市场的检验,为人形机器人项目的研发打下基础。
图2 540台Alpha机器人在2016年中央电视台春节联欢晚会上同时登台表演
大型人形机器人的研发难度与小型人形机器人的研发难度不处于同一量级,大型人形机器人是多学科的集合,看似普普通通的动作,背后可能是研发团队数月的努力。以“直立行走”动作为例。机器人直立行走时,关节处于完全伸展状态,会导致它用于保持平衡的空间变得有限,对规划算法的合理性提出很高的要求。在几代样机的算法迭代优化过程中,优必选总结出一套稳定成熟的步态规划方法,通过虚拟脚模型、倒立摆模型生成身体和脚部的规划数据,同时基于全身丰富的传感器,开发多维力位混合控制器,提高了机器人对复杂地形和外力冲击的适应能力。
除了运控、感知技术外,优必选同时关注定位导航、自主决策、语音互动、手眼协调等技术的研发,是全球极少数具备人形机器人全栈式技术的公司之一。“全栈式”技术包括机器人技术(例如机器人运动规划和控制技术、伺服驱动器)、人工智能技术(例如计算机视觉和语音交互技术)、机器人与人工智能融合技术(例如SLAM、视觉伺服操作和人机交互技术),以及机器人操作系统应用框架。人民网研究院发布的《人形机器人技术专利分析报告》显示,优必选的人形机器人有效专利数、近5年年均专利申请数均居全球第一。
焦继超介绍道,优必选研究院很早就以人形机器人量产落地为目标,从软硬件两方面进行技术拆解、逐步自研,下一步,优必选将在减小体积、外观流畅和提升功率密度三个方面开展新一轮改造升级。
优必选上市已逾半载,依然有人在讨论2023年底港交所的“惊艳一敲”。这是人类历史上第一次由人形机器人敲锣的上市仪式,也是全球人形机器人加速商业化进程中的里程碑事件。
图3 2023年12月29日,优必选科技在港交所主板上市
上市仪式的筹备恍如昨日,焦继超解释道:“当时我们所面对的问题除了时间有限、对现场环境及流程了解程度有限之外,还需要确保人形机器人在从台下走到台上的过程中保持步态稳定,能够准确走到锣边并在上市的一刻准时做出敲锣的动作。”针对这些技术难点,团队在短时间内对人形机器人的步态规划进行了调整,在其腿部引入了类人行走规划,从而提升人形机器人行走的自然性和灵活性,确保步态稳定。同时,优必选对人形机器人的传感、导航、系统调度方案进行新的优化,确保其能够在台上顺利走到指定位置,并在确定的时刻完成敲锣动作。
2
增强泛化——人形机器人头部玩家押注大模型
大模型让人形机器人在实际场景中具备更强的泛化性和适应性。焦继超表示:“在人形机器人几个功能模块中,决策最是抽象,研发难度最大。因为需要综合多维感知信息进行推理,而这正是大模型所擅长的。”大模型提升人形机器人的知识完备性,当涉及到抽象任务拆解和推理,大模型将会发挥类似中枢神经的重要作用,提升人形机器人的泛化性、通用性。
和业内同类企业相似,优必选十分看好端到端强化学习算法研究。优必选定制化研发多模态感知、运动控制、定位导航等模块,将大模型轻量化转化为自研的深度学习小模型,应用到人形机器人上,以形成端到端的AI能力。
焦继超慷慨分享了优必选最近的研究成果:“为训练大模型理解场景,我们利用仿真场景与真实数据构建具身智能数据,将传感器数据与机器人的对应动作对齐,训练多模态规划大模型,以实现输出规划。我们将大语言模型应用于解决机器人在复杂环境中执行精确的运动时泛化性不足和适配困难问题。”相较于纯文本的大模型,多模态大模型具有更强的场景理解能力,能够提取语义信息,并结合场景做出合理推理。此外,将机器人的具体动作加入训练,能够让多模态大模型理解动作指令,并实现泛化性更强的规划能力。
多模态大模型优化了人形机器人决策推理和任务控制的流程,为其泛化性、通用性提供了一条切实可行的路径。今年4月,优必选Walker S在百度AI开发者大会上展示了泛化抓取、物体分拣,以及语音交互等功能,是国际上极少数在真实场景中的“AI大模型+人形机器人”应用展示。
图4 优必选参加百度开发者大会
近几年,优必选一直持续提升人形机器人操作与行走的控制系统表现,以高保真度的仿真环境和多模态感控数据集为基础,开发端到端的学习型控制框架。结合遥操作与模仿学习,人形机器人的双臂实现不同对象的泛化抓取和不同动作的泛化执行。通过强化学习和大规模并行仿真训练,实现轴孔装配精细操作和双足的高性能行走。
3
实践磨刃——人形机器人接受公众检验
未来,人形机器人将具有广泛的应用场景,吸引大量资本涌入,从业者期待人形机器人的产能扩张可以带来规模效应,从而摊平单位成本。但在当前阶段,高昂的研发和生产成本让人望而却步,产能扩张是悖论,大刀阔斧地量产,最终只能落得“叫好不叫卖”的后果。人形机器人商业化前景仍有诸多未定性,需要企业有坐稳“冷板凳”的定力。
有专家预估,人形机器人行业将有千亿级别的发展空间。在2024年世界人工智能大会上,几乎每家机器人公司都宣称已入局具身智能,现场有几十款人形机器人供观众围观。但当被问及“降本增效”或“何时量产”,业内大多企业会选择转移话题。人形机器人的概念越是炙热,研发方的压力就越是重大,成本和市场困境就像人形机器人头顶上的达摩克利斯之剑,随时都可能将其扼杀在摇篮里。
而优必选迈出了这一步,在某种程度上,由人形机器人参与的上市仪式,也延续了优必选以往的作风——敢于为机器人产品创建大舞台。
图5 优必选Walker S人形机器人在蔚来工厂“实训”
其实,优必选的产品很早就闯入了我们的视线。在2016年春晚,540台Alpha机器人在中国中央电视台春节联欢晚会上同时登台表演,入选吉尼斯记录。除此之外,Walker X、熊猫机器人优悠等人形机器人多次应用于全世界广泛关注的盛会,包括迪拜世博会中国馆、北京冬奥会、成都大运会等。“这些展示,让优必选获得大量的关注,也让更多人得以真正认识和了解人形机器人。”焦继超解释说,“这些应用场景难度较高,优必选人形机器人能够代表国家展示最新的科技创新成果,对我们来说是一种肯定。同时,我们的产品和技术也得到了一次非常难得的检验,在短时间内突破多项关键核心技术,积累了丰富的应用经验。”今年以来,优必选聚焦汽车、3C等制造业重点领域,提升人形机器人工具操作与任务执行能力。此外,优必选现阶段正在研发用于家庭陪伴场景的仿生人形机器人。
焦继超分享道,对于人形机器人在工业场景的推广应用,优必选的规划分为三个阶段。2023年至2024年,优必选以新能源汽车制造场景作为人形机器人在工业场景的切入点,实现大型人形机器人在搬运、质量检查等工业场景中的测试。2025年至2027年,优必选大型人形机器人将逐步拓展至中等难度任务,重点打造3~5个专用场景下的应用,逐渐实现规模商业化,横向拓展至消费电子制造业等其他行业及应用场景。2028年至2033年,优必选大型人形机器人将进一步拓展到较为复杂的任务场景,具备技能超过10种以上,成为多任务通用型工业人形机器人。
阅读更多内容,欢迎订购《机器人产业》杂志。
点击跳转!圈内人都在看的专家观点
热门跟贴