1、人形产品:群星璀璨,25 年迎量产元年、26 年有望商业化爆发
随着 AI 时代的到来以及人口老龄化加剧,人形机器人有望成为面向未来的黄金赛道。在 这一波人形机器人浪潮中,以特斯拉、1X、FigureAI 为首的多家科技明星公司及无数初创 团队犹如璀璨星辰,纷纷切入人形机器人新赛道,为人形机器人产业注入了源源不断的活 力与希望。从产业发展节奏看,人形机器人产业 25 年有望进入量产元年,26 年则迎来商 业化爆发。
1.1 产业节奏:24 年原型机元年,25 年量产元年
预计 25 年是人形机器人量产元年、26 年产业商业化爆发。从国内外人形机器人厂商研发 进展上看,国内外厂商进展几乎处于同一起跑线。2024 年是全球人形机器人原型机发布 元年,例如 1XTech 发布双足人形机器人 NEO、开普勒发布先行者 K2、波士顿动力发布电 动版人形机器人进入 atlas 等。2025 年,人形机器人产业有望进入量产、集中功能测试 阶段,马斯克表示,特斯拉 25 年将生产 1 万台 Optimus 机器人,如果一切顺利,特斯拉 可能 26 年中开始量产 1 万台/月机器人。
根据人形机器人的形态,可以将其分为轮式人形机器人、足式人形机器人、通用人形机器 人。人形机器人相比其他机器人,对智能感知、运动控制、智能决策、人机交互的综合能 力要求更高,具体包括: 智能感知方面:需要配备多种传感器,能够感知非结构化场景并根据不同情况做出相 应反应。 运动控制方面:需要人形机器人具备高度的精确性和灵敏度、良好的稳定性和平衡控 制能力,精确地模仿人类的行走、跑步、抓取等动作,实时响应各种传感器的输入和 环境变化。 智能决策方面:可通过人工智能技术,根据环境、任务和目标等信息,自主地做出最 优的决策,以实现自主导航、任务执行、人机交互等功能,需要高效的算法和强大的 计算能力,以处理大量的信息和数据。 人机交互方面:需要对自然语言进行识别与处理,以便机器人能够理解用户的指令、 问题或指导,需要具备情感识别技术,识别用户情感状态,提供更人性化的互动体验。 此外,对手势与动作的识别、多模态交互等方面也有着较高的要求。
场景复杂度决定人形机器人运动控制能力需求,根据运动控制能力需求强弱排序,由弱到 强为工业制造<商用服务<极端作业<家用服务,预计人形机器人率先在工业制造场景应用 训练后,最终实现家庭服务场景应用。 工业制造场景:工业制造场景特点为单一性和重复性工作,工作特性导致其是人形机 器人应用最易实现落地的场景,并且有利于人形机器人实训获取高质量训练数据。目前已有特斯拉 Optimus、优必选 WalkerS、乐聚夸父人形机器人已经开始在汽车工厂 应用,负责搬运、质检等重复性工作。 商用服务:人形机器人商用领域包括餐饮快消、旅游/展馆、教育科研、医疗服务等。 商用服务场景关注在于智能交互和替代人工培训环节,人形机器人能够节约培训时 间直接上岗,在小范围的可控条件下能实现少量复杂任务,在展览讲解、科研场景已 经落地。 极端作业场景:极端作业场景包括能源化工、灾害救援、水下&太空作业、军事作业 等,各细分场景环境特征差异较大,某一特定特种场景下的训练难以泛化到其他场景, 目前在应对环境特点的运动控制能力、高精度操作能力以及复杂任务智慧生成仍有 待攻克。家用服务场景:人形机器人的家用场景需要使用复杂空间环境、灵活控制、多功能人 机交互,多数时间均在非标准化场景,对高随机性、复杂性场景运动控制要求较高。 目前人形机器人暂时未能实现在家用环境应用,未来依靠在工业、商用场景落地后, 经过优化迭代升级,远期有望逐步落地,打开 toC 端需求空间。
人形机器人主要入局者包括元老级公司、初创型公司、跨界公司、原生机器人公司、科技 公司: 元老级公司:这类公司包括优必选、波士顿动力、乐聚机器人、钢铁侠科技、伟景机 器人、Engineered Arts 等,这些公司在成立之初便聚焦机器人领域,拥有专业的研 发团队,具备较多的技术积累,但下游渠道相对跨界巨头公司有所欠缺,整体资金实 力也相对弱势。跨界公司:人形机器人跨界公司主要有两类,第一类为特斯拉、小鹏、小米等汽车整 车公司,第二类为消费电子、家电公司,包括追觅、戴森、三星等。该类公司优势在 于资金实力强、商业化能力强、渠道资源丰富,除了特斯拉以外,其他跨界厂商可能 在技术积累方面略弱于元老级人形机器人公司。 初创型公司:人形机器人初创型公司包括智元机器人、傅利叶、宇树科技等,创始团 队多是院校及研究所出身或科技巨头企业出身,具备机器人控制或算法方面优质禀 赋,均有一定的融资能力,但是创始团队或在企业经营管理和商业化经验较少,整体 商业化能力、渠道资源仍存在一定短板。 原生机器人公司:该类公司在过往的工业机器人、协作机器人、移动机器人等领域有 一定成果,具备多年机器人研发经验和成功的应用案例,在人形机器人方面具备部分 可嫁接、复制的技术积累和研发经验。但原生机器人公司软件开发和技术创新会略弱 于以研发技术为核心的初创型人形机器人公司。 科技公司:该类公司最显著的优势在于人形机器人的“智能化”,并且在数据、算法 和算力等方面有较多的积累,具备具身智能大模型产品,整体软件能力和资金实力较强。但大多科技公司缺乏人形机器人硬件设计和制造经验,目前多选择投资人形机器 人整机公司或通过软件与整机公司合作。
当前,人形机器人本体行业处于产业化发展前期,行业对于人形机器人本体的战略意义已 有共识,但其大规模商业化落地的路径仍未真正走通,从人形机器人重要细分赛道和类型 看,可以主要分为“三类公司”,包括本体+大模型均自研、本体自研+大模型合作以及为 机器人厂商提供大模型的科技公司。 本体+大模型自研公司:该类公司研发实力较强,主要玩家以特斯拉为首的少数海外 公司,其他玩家主要为国内厂商,包括开普勒、小鹏、宇树科技、达闼、星动纪元、 银河通用、帕西尼感知科技等。 机器人公司:该类公司主要聚焦在人形机器人本体研发以及推进量产,大模型主要选 择与外部厂商合作,其中海外公司有 Sanctuary Al、1XTechnologies、Agility Robotics、Apptronik、波士顿动力等,国内公司包括优必选、魔法原子、星尘智能、 乐聚机器人、傅利叶等。 大模型科技公司:该类主要是国内外具有较强研发能力,并有相关大模型产品的知名 科技公司,海外的主要玩家有 OpenAI、微软、英伟达、谷歌、PI 等,国内的主要玩家为字节跳动、百度、华为。
各大模型科技大厂均选择人形机器人作为大模型落地物理世界的载体,开始与人形机器人 公司在具身智能大模型领域合作,如微软与 SanctuaryAl 合作推动大型行为模型(LBM)落 地、GoogleDeepMind 与 Apptronik 合作提升动态环境智能化、英伟达赋能傅利叶 GR-1 进 行技能学习。
1.2 国外公司:特斯拉引领、初创公司跟随
1.2.1 特斯拉:OptimusGEN3 即将发布,计划 25 年小批量部署
全球电动汽车领军企业,人形机器人持续迭代更新。特斯拉成立于 03 年,为全球电动汽 车领域领军企业。Tesla 的机器人项目为 TeslaBot,也叫 Optimus,是 Tesla 在 ElonMusk 领导下开发的一款通用双足人形机器人。21 年 8 月,特斯拉 CEO 马斯克于首届 AIDAY 展 示人形机器人概念机 Tesla Bot。22 年 2 月,特斯拉在提出概念仅 6 个月后成功推出人形 机器人原型机。23 年 12 月,特斯拉发布 Optimus-Gen2,稳定性、灵活度、速度、轻量化 等方面全方位提升。24 年 11 月,特斯拉更新人形机器人视频,展示了机器人单手接球的 运动能力,研发人员指出,还有一些工作需要在年底完成,特别是在扩展触觉传感集成方 面(比以前的手有更多的表面覆盖),通过肌腱进行非常精细的控制,以及减轻前臂的重量。
特斯拉 Optimus 最新方案:共有 30 个躯干执行器(旋转 16+线性 14),单手 22 个手部执 行器。采用了和特斯拉类似自动驾驶技术 FSD 的端到端神经网络控制,这台机器人仅依赖 视觉对物体进行分类,“它的神经网络已经完成了端到端的训练:输入视频,输出控制。” 并配备了全新的双手,能够抓握更重的物体并进行更加精细的操作。根据 TheHumanoidHub 报道,特斯拉即将推出 Optimus-Gen3 人形机器人。
根据特斯拉 Q4 投资者会议,特斯拉计划在 2025 年底累计生产 1 万台人形机器人,2026 年年中提升至 1 万台/月。从开发的角度来看,“Optimus”的“智能”将继续提高,并应 该在某个时候反映出过去一年中 FSD 的快速改进。
1.2.21XTech 公司:采用“无齿轮”设计理念、预计 25 年量产
1XTechnologies 成立于 14 年,原名为 HalodiRobotics,是一家人工智能和机器人公司, 总部位于挪威,致力于生产通用机器人,其主要产品包括工业 EVE 和家用 NEO 两款人形机 器人。
根据 1X 官网,NEO 作为通用双足人形机器人可处理物流、制造、操作机械等工业任务。长 期来看,NEO 未来还可以提供清洁、整理家务以及为行动不便的个人提供支持、获取物品 和陪伴等日常生活服务。 NEO 全身被布料包裹让这款机器人更接近于人类,1X 成功开发出无需使用齿轮就能达到人 体肌肉约 80%力密度的电机,不依赖于传统的刚性执行器(可让 NEO 在执行任务时保持安 静),而是利用了仿生设计和更灵活的组件——其身体采用类似人类肌肉组织的结构设计 和非严格的液压系统,其铝芯上覆盖有一层软层,因此坚固之余也很有柔韧性,能够在人 与人之间安全工作。
NEO 采用多方案提升智能化,将部署于选定的家庭优化人工智能模型,距离家用商业化又 迈近一步。NEO 采用具身学习、世界模型、多模型分工等多方案提升智能化:1)具身学 习:NEO 采用了 VRTeleop 技术,通过操作员在现实场景中的指导,让机器人直观理解任 务难度。当数据量达到一定规模,NEO 便掌握了新技能,实现开箱即用的灵活学习能力。 2)世界模型:自建仿真环境,让机器人学习和测试新的行为,使其不依赖于预设的程序, 还具备了灵活应对新状况的能力;3)多模型分工:通过导航模型、抓取模型等不同模型 分工合作、配合,独立训练不同策略模型来提升性能。在 Beta 测试阶段,1XTechnologies 将 NEO 部署于选定家庭中,以收集关键数据,优化通用人工智能模型。这些数据帮助 NEO 在使用中不断学习,变得更智能。
OpenAI 领投,从默默耕耘到明星初创,预计 2025 年量产千台 NEO 双足机器人。 公司创始人专业性强:1x 公司 CEOBerntBørnich 毕业于挪威奥斯陆大学,专业为机 器人与纳米电子学。AI 副总裁 EricJang,则是布朗大学计算机科学专业的毕业生, 曾在谷歌机器人团队担任高级研究科学家,并于 2022 年加入 1X。资金端:21 年 3 月,公司;23 年 3 月,1X 获 OpenAI 等机构 A2 轮融资,共筹集 2350 万美元。2024 年 1 月,1XTechnologies 完成了由 EQTVentures 领投的 1 亿美元 B 轮 融资。其他投资方还包括三星电子旗下的投资公司三星 NEXT、Nistad 集团、Sandwater 和 SkagerakCapital 等挪威风投公司。 量产计划:目前 1X 已计划在挪威和北美大规模生产其首款商用机器人 EVE,并利用 B 轮融资的资金加大即将推出的双足机器人模型 NEO 的研发力度,预计 2025 年生产 数千台 NEO,2026 年规模化量产,2028 年达到数百万台量产目标。
1.2.3FigureAI 公司:Figure02 执行任务能力大幅提升,商业化进展顺利
巨头加持,产品迭代至 Figure02。FigureAI 公司成立于 22 年,团队包括来自 IHMC、波 士顿动力和特斯拉的机器人专家,目标是设计可以应用于人类环境的通用型机器人,让机 器人可以执行各种不同的任务。融资层面,FigureAI 在 24 年 1 月和宝马合作,机器人进 厂后,商业模式逐渐清晰,吸引了包括亚马逊创始人贝索斯、微软、英伟达、OpenAI 等科 技巨头的投资,筹集了约 6.75 亿美元的资金,公司估值达到了 26 亿美元。24 年 8 月, FigureAI 发布软硬件重新设计的人形机器人 Figure02,产品全面升级。
人形机器人 Figure02 全新设计技术突破,AI 推断能力提升 3 倍。 Figure01:2023 年 10 月,FigureAl 发布的人形机器人 Figure01,利用 OpenAl 的大 型语言模型,可以与人类进行正常的完整对话,并具备分类识别物品的能力。 Figure02:2024 年 8 月,FigureAl 发布的新一代产品 Figure02。相较于 2023 年发 布的首代产品,Figure02 对硬件和软件均进行了革新。 Figure02 相对 01 的提升点:1)灵巧手:Figure02 灵巧手自由度达 16 个,相对上一 代产品增加 10 个自由度,具有较高的灵活性和速度;预计手部集成了触觉传感器, 触觉感知能力和操作灵活性提升;2)算力:Figure02 板载计算和 AI 推理能力也较前 代产品提高了 3 倍。3)感知层:视觉、触觉、激光雷达方面均进行较大升级,Figure02 匹配双目相机(上一代为单目)、手部/脚部多个触觉传感器(上一代无)、360 度激光 雷达(上一代为 2D 激光雷达)。
人形机器人 Figure02 技术架构延续 Figure01,智能化能力升级。 大脑:Figure02 依然集成了 OpenAI 的 GPT-4o 多模态大模型,相比较于 01 使用 GPT4, 可以进一步提升机器人的视觉理解和常识推理能力,实现语音-语音的推理和视觉推 理,能够与人类进行语音交互,听懂并遵循人类指令,机载计算和 AI 推理能力提升 3 倍。 小脑:Figure02 延续使用 01 的机器人技能行为学习,类似 RT-X 机器人控制模型,利 用神经网络学习抓取和放置策略,使用模型预测控制器来确定脚步位置和保持平衡并 遵循所需的机器人轨迹所需的力,结合步态控制以完成机器人的基本运动,确保了机 器人在执行动作时的安全性和平衡性,未来将持续优化提升动作执行能力。
Figure02 商业化路径逐渐跑通,量产奇点渐行渐近。24 年 12 月 Figure02 交付其他商业 客户,并已经执行工作任务,Figure 实现在非宝马客户外的销售,实现创收“0-1”的突 破。随着商业化进程推进,公司量产规划开始提速,25 年预计迁入新生产基地,开始理性 的小批量生产,中远期迭代升级量产版本 Figure03 后,预计将开启大规模生产。1 月 31 日,Figure 创始人 CEO Brett Adcock 发布 Figure 商业化进展:签约了其第二个商业化 客户,且是美国最大的公司之一,并在去年签约的 BMW 和新客户之间,其中一条客户线将 给 Figure 4 年内带来 10 万台 Figure 部署的潜力。
1.2.4SanctuaryAl 公司:PhoenixGen8 改用轮式方案,灵巧手处于行业头部
SanctuaryAl 人形机器人产品已迭代至第八代产品,成熟度较高。SanctuaryAI 公司成立 于 18 年创始团队软件背景强大,包括 D-Wave(量子计算领域的先驱)创始人兼首任 CEOGeordieRose,以及 Kindred(首家在生产机器人中使用强化学习的公司)的核心成员 SuzanneGildert、OliviaNorton 和 AjayAgrawal。SanctuaryAI 在成立不到 8 年的时间, 人形机器人产品已经迭代至第八代产品——PhoenixGen8。
SanctuaryAl 商业化进程顺畅,携手微软推进通用人形机器人大模型落地。融资方面通过 多轮融资已经具备较强资本实力;在商业化落地方面,公司产品将落地麦格纳汽车零部件 工厂;智能化方面,2024 年 5 月,公司与微软合作研发大型行为模型(LBM),进一步推进 通用人形机器人技术的应用。通过这些融资和合作,SanctuaryAI 正在加速推进其人形机 器人技术的研发和商业化应用。
战略调整,PhoenixGeneration8 改做轮式人形机器人。SanctuaryAIPhoenixGen7 是 24 年 4 月发布的双足人形机器人,但 2024 年 12 月 16 日,SanctuaryAI 推出了 PhoenixGen8, 产品形式发生较大变化,从双踏板腿改为轮式底座人形机器人。
PhoenixGen8 注重提升软件和灵巧手能力,灵巧手自由度领先。 自研 CarbonAI+微软合作+英伟达合作加码软件能力。1)自研 CarbonAI:不同于传统 机器人系统用于解决特定的、单一的任务,CarbonAI 系统模仿人脑中的子系统,例如 记忆、视觉、声音和触觉,是使用深度学习、强化学习以及物理世界模拟训练的人形 通用机器人认知架构。2)微软合作:24 年 5 月 SanctuaryAl 与微软合作加强 AI 研发, 并利用微软 Azure 云资源处理人工智能工作负载;3)英伟达合作:英伟达 GR00T、 Isaac 赋能 SanctuaryAl 大模型能力。
灵巧手:根据美国劳工统计局,约 99%的工作需要手指精细操作。PhoenixGen8 灵巧手 采用微型液压阀,功率密度会比机电系统驱动方法高一个数量级,灵巧手速度、可控 性更强,PhoenixGen8 有望在广泛的工业操作任务中逐步落地。 对比市场竞争对手灵巧手自由度:PhoenixGen8 自由度达 21 个,自由度多于 OptimusGen2(11 个)、1XNEO(20 个)、Figure02(16 个)、远征 A2(19 个),SanctuaryAI 灵巧手自由度领先。
SanctuaryAI 新型触觉传感器技术提高通用机器人的速度和成功率,并且集成触觉技术可 为更高性能的具体化 AI 模型提供更大容量和更丰富的数据。
根据 SanctuaryAI 官网,24 年 11 月 SanctuaryAI 联合创始人兼 CEO 在内的近 30 人离职, 后续量产、商业化进展推进或增添一定不确定性。
1.2.5Apptronik 公司:注重执行器和模块化设计,牵手谷歌提升智能化
与 NASA 深度合作,23 年推出人形机器人产品 Apollo。Apptronik 脱胎自得克萨斯大学奥 斯汀分校的人类中心机器人实验室,该公司与 NASA 持续深度合作,团队成员曾参与 2012- 2013 年的 DARPA 机器人挑战赛,赛期间为 NASA 机器人 Valkyrie 工作,此后在 2022 年 9 月也与 NASA 进行深度合作,为太空探索做贡献。2023 年 Apptronik 发布人形机器人 Apollo, 定位为与人类一起工作或在家庭、医院等场景服务人类的通用人形机器人。
Apptronik 首款通用人形机器人 Apollo 模块化设计,灵活性、续航高。Apptronik 公司于 2023 年 8 月推出了其首款通用人形机器人——Apollo,这款机器人身高约 172 厘米,体 重 72.6 公斤,设计初衷是与人类协同工作,适用于工厂、医院、家庭等多种场景。模块 化设计:ApolloApollo 多部件采用模块化设计,如腿部可更换为固定桩,满足多种应用场 景需求;Apollo 电池支持热插拔设计,每块电池续航时间为 4 小时,以解决人形机器人续 航痛点。
人形机器人 Apollo 核心在于执行器和模块化设计,强调物理智能。 执行器:迭代超 35 次,形成强大的“物理智能”。Apollo 模仿人类的肌肉群分布,利 用迭代超 35 次的执行器,构建了其 30 个不同的肌肉群,负责执行基本的动作和活动 能力。 模块化:设计根据不同任务需求灵活调整各个部件,实现高效维护和功能扩展。 头部:可以放置不同的传感器,当被用于户外时可根据需要添加激光雷达。 胸部:躯干可以有效地与腿部分离并安装到轮式底座上。 电池:支持热插拔设计,以方便人形机器人续航。 末端执行器:可用单自由度的手和更简单的末端执行器来完成既定任务。 “制造一个可以做数千种不同事情的机器人”。Apollo 机器人模块化设计使其能够在物流、 制造、建筑、石油和天然气、电子产品生产、零售、送货上门、老年护理等领域灵活应用。
商业化对接奔驰、GXO 物流,大模型牵手 Google。在商业化应用方面,Apptronik 公司依 次与 NASA、梅赛德斯-奔驰、全球物流巨头 GXO 展开深度合作。在技术合作方面,2024 年 12 月,公司与 GoogleDeepMind 达成战略合作,共同研发新一代人形机器人,力图让其能 够胜任更加复杂的任务。
谷歌具身智能大模型迅速迭代,Apptronik 为谷歌入局人形机器人本体赛道的路径,后续 新产品智能化有望加速。24 年 12 月 Apptronik 牵手 GoogleDeepMind 团队,谷歌具身智 能大模型已从 Saycan 迭代到 RT-H,处于行业头部地位,有望推动 Apptronik 产品智能化加速升级。
1.2.6Agility Robotics:Digit 主打物流配送,建设机器人工厂助力量产加速
Agility Robotics 成立于 2015 年,是从俄勒冈州立大学拆分出来的机器人公司。16 年 Agility 发布机器人产品 Cassie,Cassie 为动态行走机器人,可以穿越崎岖的地形并跨 越障碍。19 年 2 月,Agility 在 Cassie 基础上改进并推出人形机器人 Digit,于 20 年上 市。
发布新版 Digit,主要用于物流场景。23 年 3 月,Agility 推出新版 Digit 人形机器人, 该版 Digit 机器人身高 175 厘米,体重小于 65 公斤,最多可承载 16 公斤,采用可充电锂 电池供电,续航能力达 16 小时。相比旧版,新版 Digit 增加了头部和机械手,安装头部 可以提供人机交互(HRI)焦点,手部呈小爪状,可以在保持平衡的状态下搬运和装卸货 物。根据 Agility 官网,新版 Digit 专为物流工作设计,目前主要用于搬运仓库的手提 袋、包裹,未来还计划应用于货物卸载、配送等工作场景。
Digit 开创人形机器人历史上首次投入商业化运作先河。根据 Agility 官网,23 年 10 月, Digit 人形机器人获得亚马逊使用测试,主要用于帮助亚马逊仓库员工拾取和移动空手提 箱。经过巨头的“蹚雷”成功,全球最大的纯合同物流供应商 GXO 与 Agility 签订长期协 议,在物流运营中全面部署 Digit,Digit 开创人形机器人历史上首次投入商业化运作先 河。
打造全球首座人形机器人工厂,Digit 量产加速。根据 Agility 官网,Agility 从 22 年开 始建设 RoboFab 机器人制造工厂,该工厂占地 70000 平方英尺,目前该工厂已经投产一 年,产能达数百台,未来年产能将拓展至 10000+台。随着商业模式跑通、产品迭代以及工 厂产能爬坡,预计 Digit 商业化收入将加速扩张。
1.2.7 波士顿动力:液压转向全电驱动,商业化进程推进
深耕机器人领域三十余年,机器人技术领先。波士顿动力成立于 92 年,为美国著名机器 人公司。1)在四足机器人领域,创始人 Raibert 早在 86 年仍在麻省理工学院任职期间便 开发出第一台能够行走和奔跑且完全动态稳定的四足机器人。05 年,波士顿动力与美国 国防高等研究计划署合作,推出四足机器人 BigDog。其后,波士顿动力持续进行机器人研 究,并推出 LS3、WildCat、Spot 等机器人产品。2)在人形机器人领域,波士顿动力于 09 年推出双足机器人 Petman,主要用于检验美军防护服性能和军事设备。其后,波士顿动力 在 Petman 基础上改进,于 13 年发布人形机器人 Atlas。13 年至今,波士顿动力不断改进 Atlas 性能,现已具备翻越障碍物、空中转体、后空翻,在狭窄地形中自主导航等能力。
人形机器人 Atlas 机动灵活,可完成较多高难度动作。Atlas 人形机器人高 1.5 米、重约 80 千克,自由度 28 个(液压关节),配备 RGB 相机和深度传感器。Atlas 的膝关节扭矩高 达 890N·m,髋关节扭矩达 840N·m,步行速度达 1.5m/s。根据波士顿动力 21 年发布的 Atlas 跑酷视频,Atlas 可以顺利完成跃平衡木、过斜坡、连续后空翻等动作。23 年 1 月, 波士顿动力发布 Atlas 人形机器人最新视频,视频中 Atlas 在工地给人类当助手,并完成 了搭桥、爬楼、飞身旋转、向人类扔工具包、前空翻等灵敏动作。
Atlas 由液压转向全电驱动转型。液压系统零件多、制造复杂,还存在漏油等稳定性问题 (Atlas 曾出现过液压油从双膝喷射而出的状况),并且液压驱动的机器人还需要一整套 液压系统,成本远高于电驱动。2024 年 4 月波士顿动力宣布放弃液压版 Atlas 研发,转 而发布了全电驱动 Atlas。
电动 Atlas 增加旋转关节,助力 Atlas 从研究平台向商业化产品转向。电动 Atlas 增加了 脖子、腰部的旋转关节,可实现 180 度旋转,能够帮助机器人在工厂工作中减少移动,降 低动态平衡需求和提升工作效率。
电动版 Atlas 工厂环境测试成功,商业化进程或将加速。电动版 Atlas2024 年 10 月进厂, 并且在 MPC(模型预测控制)下,实现完全自主地在储物柜之间搬动汽车发动机零件。根 据 BostonDynamics,Atlas 工厂测试较为成功,预计 25 年开始在韩国现代汽车工厂开始 进行试点测试。根据 RobertPlayer,公司计划未来将产品投放于工业、物流等流域,推动 产品商业化进程。
1.3 国内公司:科技、初创、传统车企多领域发力
1.3.1 优必选:全新一代工业人形机器人实训顺利,有望开启规模交付
优必选成立于 12 年,从人形机器人的核心源动力伺服舵机研发起步,逐步推出了消费级 人形机器人、教育智能编程机器人、商用服务机器人、智能巡检机器人等产品。18 年优必 选推出大型机器人 Walker,成为中国首家实现人形机器人商业化的企业。根据弗若斯特 沙利文,在我国教育智能机器人领域,优必选 22 年市占率 22.5%,位居国内第一;在我国 智能服务机器人领域,优必选 22 年市占率 2.8%,位居国内第三。
优必选在机器人领域拥有两大核心技术:伺服驱动器、运动规划和控制技术
伺服驱动器
优必选伺服驱动器技术领先,0.2-200N·m 扭矩领域实现量产。伺服驱动器-机器人关节 是开发机器人控制和运动能力的关键硬件。根据优必选招股说明书援引弗若斯特沙利文信 息,优必选是全球少数将集成多个伺服驱动器为关节的服务机器人商业化的公司之一,是 全球少数实现多系列伺服驱动器量产及实际应用的公司之一,也是全球少数完成小扭矩到 大扭矩(扭矩从 0.2N·m 到 200N·m)伺服驱动器批量生产的公司之一。凭借伺服驱动器 的领先优势,优必选人形机器人的运动更加精准,产品自由度最高达 41 个,可顺利抓取 不同形状和大小的物体。
运动规划和控制技术
机器人运动规划和控制是指实时控制及管理机械移动部件的位置、速度及力量,以实现根 据预期运动轨迹及特定运动参数进行运动,是人形机器人的关键核心技术。优必选在该领 域布局的技术包括步态规划和控制算法、稳定控制算法和柔性控制算法。
步态规划和控制算法:优必选步态规划和控制算法可实现步态规划及平衡控制,实现 机器人的正常行走。步态规划帮助机器人实现行走、上下楼梯、跳跃等功能的规划; 平衡控制使机器人能够在复杂的表面上行走,防止潜在的干扰,提高机器人步行的稳 定性、稳健性及环境自我适应能力。
稳定控制算法:优必选将稳定控制算法应用人形机器人中,使机器人实现稳定控制能 力:1)倾倒恢复能力:受到外力影响时,优必选机器人可在移动过程中纠正步伐频 率及落脚点,提升行走稳定性。2)单腿平衡能力:通过单腿平衡能力,优必选机器 人不会被轻易推倒,稳定性强且能完成一系列不同的动作。3)动态平衡能力:优必 选采用了力位混合控制算法,使机器人能够在不稳定的坡地及地面上保持平衡。
Walker 系列迭代升级,发布 WalkerS1 工业人形机器人。2024 年 10 月优必选发布全新一 代工业人形机器人,WalkerS1 身高 1.72 米,体重 76kg,最大关节扭矩提升至 250Nm;该 产品具备通用任务多模态规划大模型、学习型全身控制、行业首创语义 VSLAM 导航,有望 在汽车等工业领域加速落地。
WalkerS1 已在多个汽车工厂实训,预计 25Q2 开始规模交付。WalkerS1 与多个汽车工厂合 作进行实训,包括比亚迪、东风柳汽、吉利、一汽红旗等,该产品还在富士康、顺丰等 3C、 物流企业开启实训。工厂实训能够推动关节稳定性、结构可靠性、运动控制等迭代更新, 目前 WalkerS1 解决了工业场景中人形机器人算法和软件系统稳定性的技术难题,预计 WalkerS1 在 25Q2 有望开始规模交付。
1.3.2 宇树科技:春晚闪亮登场,市场影响力提升
四足机器人领导者,切入人形机器人领域。宇树科技成立于 16 年,是我国四足机器人领 域领先企业。创始人王兴兴在硕士期间便独立开发了使用低成本外转子无刷电机驱动的全 自由度高性能四足机器人 XDog。16-23 年,宇树在四足机器人领域不断进行产品迭代,其 中,21 年发布的四足机器人 Go1 最高奔跑速度可 17Km/h,打破了近似规格四足机器人最快奔跑世界纪录。23 年 8 月,宇树发布首款人形机器人 H1,顺利切入人形机器人领域。 24 年 5 月公司发布性价比人形机器人 G1,官方定价 9.9 万元起,8 月宇树科技对 G1 进行 量产设计升级,整体更加符合量产要求;25 年 1 月宇树科技围绕 UnitreeG1 行走和奔跑 能力进行升级。
宇树科技通用人形机器人包括 H1 与 G1,其中 H1 为定位高端科研、G1 定位为大众消费市 场。根据中国证券报,UnitreeH1 早在 23 年 10 月就完成了首批商业化小批量交付,定价 为 65 万元左右,定位于高端科研等领域;UnitreeG1 主要应对大众消费市场,定价为 9.9 万元起,宇树科技两款通用机器人通过差异化定位开拓市场,商业化进展有望迎来突破。
UnitreeH1 国内第一台能跑的人形机器人,2025 年春晚表演尽显技术实力
H1 搭载大扭矩高功率 M107 关节电机,是国内第一台能跑的人形机器人。为适配大负载、 高密度、大功率的需要,宇树为 H1 设计了大扭矩密度 M107 关节电机,应用在 H1 的两个 膝关节上,峰值扭矩达到 360N·m,而髋关节电机扭矩则为 220N·m,踝关节为 45N·m, 手臂关节则为 75N·m。根据宇树官网,M107 和特斯拉人形机器人关节电机相比,尺寸更 小、更轻、动力性能更强劲,甚至最大扭矩是 Tesla-1 关节的 2 倍。在 M107 关节电机加 持下,H1 行走速度超 1.5m/s,潜在运动性能超 5m/s。H1 在速度、力量、机动灵活性等方 面具备全球近似规格最高动力性能,能够在复杂地形和环境中自主行走和奔跑,是国内第 一台能跑的通用人形机器人。
UnitreeH1 亮相 2025 年春晚,彰显技术实力。UnitreeH1 机器人在春晚舞台实现转手绢、 抛接等高难度动作。从技术角度来看:1)转手绢:机器人身上 32 个高精度传感器,基本 能做到手绢稍微歪一丁点在 0.01 秒内自动摆正,实时调整旋转力度。2)抛接:从手绢抛 出到接住,机器人需要不到 1 秒内完成三个关键动作,包括视觉追踪、轨迹预测、机械臂 动态调整。3)走位:依靠 SLAM 定位技术,实现全自动走位变队形。
UnitreeG1 面对大众消费的通用人形机器人,商业化落地可期。根据宇树科技 25 年 1 月 16 日的视频,G1 在山坡、草地、阶梯等地方能够流畅行走、跑步,体现复杂地形适应能 力进一步优化。“价格屠夫”G1 起售价 9.9 万元,相对友商动辄几十万元售价,价格亲民, 商业化落地有望加速。
宇树科技两款人形机器人通过差异化定位,面对不同客户群体,有望通过产品矩阵建设推 动商业化进程。UnitreeH1 面向高端客户,自 23 年 8 月发布以来,截至 24 年上半年已累 计销售 100 多台,商业化落地顺畅。UnitreeG1 定位性价比,面向大众消费市场,已经在 科研、教育、工厂等场景落地,具备量产能力。
1.3.3 智元:商用元年,量产启航
机器人创业公司,人形机器人研发迅速。智元机器人成立于 23 年 2 月,创始团队包括“稚 晖君”彭志辉等业内资深人士,具有较强的技术背景和产业资源。23 年 8 月,智元发布远 征 A1 人形机器人。远征 A1 是智元的第一代通用型具身智能机器人,机器人身高 175cm, 体重 55kg,步行速度可达 7km/h,整机承重 80kg,单臂最大负载 5kg。时隔仅一年,智元 机器人在 24 年 8 月发布远征、灵犀两大家族共 5 款商用人形机器人新品。新品发布后, 智元机器人坐上快速发展的列车,截至 25 年 1 月累计下线 1000 台通用机器人。
智元人形机器人包括远征 A1、远征 A2、远征 A2Max、灵犀 X1。远征 A1 为公司首款人形机 器人偏通用场景;远征 A2 智能化和移动能力强,主要用于交互服务场景;远征 A2Max 匹 配高自由度的灵巧手和大关节电机,定位于重载特征作业;灵犀 X1 面向科研教育领域, 提供全栈开源,智元人形机器人产品矩阵丰富,有望在多个下游应用“多点开花”。
关节电机、灵巧手迭代升级。1)PowerFlow 关节模组:远征 A2 对关节模组进行量产化迭 代,峰值扭矩从 350Nm 提升至 450Nm;2)灵巧手:从 17 个自由度升级为 19 个自由度, 触觉感知从之前视触觉丰富为 MEMS 粗觉+视粗觉。
三次开源,引领技术革新。24 年智元启动“中间件+整机+数据”三次开源:1)中间件: 开源 AimRT 通信框架,推动机器人商业加速;2)整机:公开灵犀 X1 硬件图纸和软件代码; 3)数据:开源 AgiBotWorld 全球首个百万真机数据集,推动机器人训练升级。智元通过 三次开源,引领技术革新,并有望依靠开源开始构筑智元生态,成为人形机器人行业领军 者。
行业最大规模量产工厂+全球数据采集规模最大的数采工厂,量产或将加速。智元机器人 量产工厂于 24 年 10 月投产,12 月开始“大上量”,截至 24 年 12 月底生产 900 台,25 年 1 月累计下线 1000 台。在行业最大规模量产工厂和数采工厂赋能下,智元机器人量产或 将加速。
1.3.4 乐聚机器人:盘古大模型加持,新产线投产提升量产能力
脱胎于哈工大机器人俱乐部,夸父人形机器人接入华为盘古大模型。乐聚机器人是由哈工 大机器人俱乐部脱胎而成,创始团队为机器人整体结构设计、人工智能算法背景,是由学 术向产业进化的团队。乐聚从创立第一年就发布第一款仿人机器人 AELOS,随后机器人持 续迭代,2023 年发布全尺寸人形机器人夸父,并于 24 年接入华为盘古具身智能大模型, 在华为开发者大会亮相。
夸父-MY 自由度提升,接入盘古大模型。24 年 5 月乐聚发布新款人形机器人夸父-MY,全 身自由度提升至 40 个以上,灵巧手自由度达 11 个,软件端接入华为盘古具身智能大模 型,赋能人形机器人大脑,提升小样本下的泛化能力。
夸父进入工业、商业服务、科研教育场景,江苏新机器人产线投产有望推动量产加速。盘 古大模型加持下,夸父人形机器人已经开启商业化应用:1)工业:批量交付一汽红旗、 蔚来汽车,负责搬运、扫码等工作;2)商业服务:在各展厅、企业担任导览员、快递员 等;3)科研教育:在高校、科研院所实验教学等。25 年 1 月夸父江苏新产线投产,产能 提升至 200 台/年,中远期有望提升至 300-500 台/年,量产加速。
1.3.5 银河通用:具身大模型领军者,商业化快速落地
学院派、务实派组合,银河通用成为中国人形机器人融资“标王”。公司创始人为王鹤(北 京智源人工智能研究院具身大模型负责人)、姚腾洲(拥有销售千万级智能硬件产品的量 产经验)分别为学院派和务实派的代表,24 年吸引 12 亿元融资,成为具身大模型赛道最 大融资额的公司。
Galbot1 依靠具身大模型、仿真合成数据训练,实现泛化能力、自研语言沟通、零代码部 署。泛化能力:没有采集任何物流真实数据,通过仿真合成数据训练和 Open6DOR 大模型 加持,推动 Galbot1 实现泛化抓取,成功率达 95%;自然语言沟通、零代码部署:Galbot1 能够通过自然语言命令执行任务。
Galbot1 率先在药房、工厂落地,26 年有望开启量产。银河通用已经满足商业化落地三大 技术要素——泛化能力、自然语言沟通及零代码部署,商业化落地无人智慧药房、工厂工 作。预计随着商业化场景小批量落地后,推动 Galbot1 加速迭代,2026 年有望开始量产。
1.3.6 小鹏:车企跨界典范,Iron 技术和商业化落地路径对标
Optimus 产品迭代至 Iron,技术和商业化落地对标 Optimus。小鹏机器人业务始于 2020 年 12 月收 购四足机器人企业 Dogotix(多够机器人),后合资成立鹏行智能,并从优必选引入团队正 式布局机器人赛道,23 年 10 月发布首款人形机器人 PX5,24 年 11 月发布 AI 机器人 Iron, 基于车企的 Ai 和智能驾驶技术积累,将视觉系统、感知系统等技术应用于机器人,首批 使用场景选择自家汽车工厂内部,技术和商业化落地对标特斯拉 Optimus。
小鹏 Iron 人形机器人在外形、灵巧手、智能化方面均有升级。1)外形:小鹏 Iron 身高 1.78m,重 70kg,相对 PX5 更加拟人;2)灵巧手:PX5 灵巧手自由度为 11 个,Iron 灵巧 手自由度为 15 个,自由度提升;3)智能化:将车端 AI 鹰眼视觉系统、自研图灵芯片、 端到端大模型以及强化学习算法移植至 Iron 上,智能化程度提升。
Iron 已进入工厂实训,商业化进程推进。根据小鹏 Iron 发布会信息,Iron 已经进入汽车 工厂开始实训,未来有望率先在工业生产、门店商业化落地。
1.3.7 小米:推出 CyberOne 人形机器人,产品侧重人类生活服务
22 年 8 月,小米在秋季新品发布会上推出首款全尺寸人形仿生机器人 CyberOne。该人形 机器人是继 21 年小米仿生四足机器人 Cyberdog 后,小米机器人 Cyber 家族的新成员。 其特征包括:
外观方面,CyberOne 身高 177cm,体重为 52kg,脸部没有采取拟真的精致五官路线, 而是采用一个面罩,外层半透明材质,内层为 OLED 与柔光特效,搭配 2D 弯曲贴合显 示模组可以实时表达机器人情绪。
运动能力方面,CyberOne全身由5种关节驱动,共21个自由度,行走速度达3.6km/h。 上肢有小米自研的 30N·m 扭矩的高效电机,电机重量仅为 500g,上半身较灵活。髋 关节主要电机瞬时峰值扭矩可达 300N·m,配合自研的人形双足控制算法,下半身行 走更加平稳。此外,CyberOne 单手垂直抓握物体重量可达 1.5kg。
传感器方面,CyberOne 对外界信息获取来自听觉和视觉。CyberOne 搭载了小米自研 的 Mi-Sense 深度视觉模组,可以对人脸、肢体动作等外界环境进行感知,三维重建 真实世界。同时 CyberOne 通过自然语言处理算法可感知 6 类 45 种人类语义情绪, 分辨 85 种环境语义,可以从说话的语气判断人类的心情。 综合来看,CyberOne 人形机器人具有表现突出的行动速度、抓握力、交互能力以及环境语 义识别能力,CyberOne 更加侧重于面向/服务人本身。
1.3.8 华为:加速布局具身智能生态
华为发力人形机器人联合产业链加速布局具身智能生态。24 年 11 月 15 日,在人工智能 应用创新成果发布会上,华为(深圳)全球具身智能产业创新中心宣布正式运营,华为在 具身智能领域的蓝图也随之浮出。当日,华为还与乐聚机器人、大族机器人、拓斯达、中 软国际、禾川人形机器人、兆威机电等 16 家企业签署了战略合作备忘录。华为正在通过 技术、生态、应用等多个维度,全方位推进人形机器人的发展,为人形机器人的广泛应用 及通用化、商业化奠定坚实基础,并有望加速中国人形机器人产业链崛起。
华为有望为产业联盟提供华为云机器人平台,助力企业制造开发、集成以及使用机器人。 具身智能技术具有很多基础性共性技术,AI 技术部分是关键因素。由华为牵头研发,有望 给国产机器人厂商带来确定性的 AI 能力,并加速技术革命性突破,扩大行业影响力。24 年 6 月,华为云发布盘古大模型 5.0。盘古大模型的数据容量、网络结构和泛化能力已在 自动驾驶、工业设计、建筑设计、媒体生产和应用、高铁、钢铁、气象、医药等众多领域 实现了创新应用和落地实践。
华为盘古具身智能大模型开始在乐聚机器人落地,参考华为与汽车厂合作模式,华为有望 依靠领先的大模型入局人形机器人。2024 年 6 月 21 日,华为开发者大会上,华为云还推 出了专精垂类的盘古具身智能大模型,可驱动机器人完成 10 步以上的复杂任务规划,还 可生成机器人所需的训练视频,加速机器人对复杂场景的学习。其多模态能力和思维能力 的提升,使机器人能够模拟人类常识进行逻辑推理,并在现实环境中精准执行任务,有效 解决了复杂环境感知与物理空间认知的难题。参考华为智能汽车合作模式,华为有望依靠 大模型和车企合作经验赋能人形机器人厂商,入局人形机器人行业。
1.3.9 字节跳动:聚焦具身智能大模型,大模型迭代至 GR-2
GR-2 具备世界建模和强大泛化能力。GR-2 通过预训练-执行实现指导机器人执行任务:1) 预训练:采用 3800 万视频片段和超过 500 亿个标记对任务进行预学习;2)生成和微调: 对任务视频和动作预测并微调;3)实现泛化任务:在 105 项任务操作任务中,能实现 97.7% 的成功率。
GR-2 经过长时间的预训练后,具有较强的泛化能力。根据字节跳动机器人研究团队论文 《GR-2:AGenerativeVideo-Language-ActionModelwithWebScaleKnowledgeforRobotManipulation》,经过预训练后,GR-2 工作能力能够泛化到新 背景、新环境、新物体和新任务。
字节跳动大模型能力强,人形机器人厂商魔法原子寻求与字节跳动豆包大模型合作,而 GR-2 是机器人大模型,具备世界建模和强大泛化能力,有望吸引其他人形机器人寻求合 作。
1.3.10 腾讯:自研+投资入局人形机器人
自研小五机器人,瞄准人居环境。24 年 9 月 24 日,腾讯 RoboticsX 实验室发布人居环境 机器人“5 号”,身高 1.4m-1.8m,全身自由度达 29 个,最高负载达 50kg,能够实现物 理交互辅助老人起身、推轮椅避障等功能。
区别于端对端解决方案,腾讯采用层次化学习方案,使得机器人更智能。根据腾讯首席科 学家张正友,有别于业界端到端的解决方案,腾讯提出层次化学习解决方案,第一层为自 身状态的估计,第二层为环境感知,实现机器人对不同环境的控制智能,第三层为对任务 的感知,通过三层拆分学习,能够不断积累更新知识,每个层次解耦更新不会影响其他层 次,使机器人更加智能。
投资优必选、乐聚机器人,入局人形机器人。腾讯不止自研机器人,还通过投资优必选、 乐聚机器人进入人形机器人赛道:1)优必选:2017 年腾讯参与优必选股权转让+C 轮融资, 斥资约 1.2 亿美元成为优必选重要机构股东;2)乐聚机器人:2017 年 5000 万元战略投 资乐聚机器人,并在 2023 年 B 轮融资跟投。
2、政策加持,机器人广受产业资本青睐
2.1 各国政府推动“机器人”战略,中国重视程度更高
各国政府持续推进“机器人战略”,中国近两年连续颁布机器人相关政策,重视程度更高。 美国、日本、欧美对机器人产业的政策布局较早,美国从 2011 年开始提出《国家机器人 计划 1.0》、日本 2014 年提出《机器人白皮书》、欧盟 2014 年提出《民用机器人项目》, 并持续推出新政策。中国产业布局较晚,但连年发布政策从产业规划、资金支持等多方面 推动机器人产业发展,未来中国有望依靠供应链和技术整合优势成为全球机器人新高地。
2.2 国内产业政策加速落地,驱动机器人产业发展驶入快车道
2024 年国内机器人产业政策数量更多、目标也更为具体,驱动机器人产业发展驶入快车 道。22、23 年北京、上海、深圳等一线城市率先出台机器人相关产业政策,2024 年以来 江苏、山东、广东、湖北、安徽等多省市跟进发布机器人产业政策。从数量来看,2024 年 产业政策落地数量比 23 年更多;从政策内容来看,24 年的机器人产业政策更加具体,北 京、黑龙江等地区明确提出突破机器人“大脑”、“小脑”、“肢体”技术,浙江、四川、河 南等多地对整机产品、整机企业给出明确目标。各地政府更加重视和细化对机器人产业链 的孵化、引导、扶持,有望驱动人形机器人产业加速发展。
2024 年为机器人产业基金落地大年,25、26 年机器人产业资金短板或得到补齐。2024 年 各省市、地区机器人产业基金密集设立,从规模来看,上海国家地方共建人形机器人创新 中心、深圳市人工智能和具身机器人产业基金、吴中区机器人产业基金、厦门追创机器人 产业创投基金等多个百亿及以上规模产业基金落地,我们认为机器人领域资金支持力度显 著加强,产业链发展有望在政策、资金双重支持下,进入加速成长期,人形机器人整机迭 代和商业化落地将加速。
2.3 人形机器人迎融资热潮,广受资本青睐
国内人形机器人赛道融资热度持续高涨。国内以宇树科技、银河通用为首的人形机器人厂 商接连获资本青睐,24 年均获 10 亿元以上融资,国外 FigureAI、1XTechnologies 等人 形机器人老牌厂商也接连获上亿美元投资,我们认为,在资本加持下,人形机器人迭代和 商业化落地有望加速。
3、软件:“大脑”进步飞速,“小脑”或为量产痛点
3.1 机器人逻辑架构由“大脑”+“小脑”+肢体组成
机器人逻辑架构:由“大脑”+“小脑”+肢体组成。人形机器人大致分为三大部分:人形 本体、高动态性能的控制算法(小脑)、具有泛化性的具身智能及非常接近人的通用人工 智能(机器人“大脑”)。从底层算法模型来看,机器人的软件可以分为“大脑”与“小 脑”,对机器人大小脑的划分不是完全按照人类大小脑工作的机理,而是在一个物理世界 去应对不同层次的问题的一种策略。“大脑”负责感知外界并模拟人类思维决策过程,“小 脑”则模仿生物进行复杂的运动控制,即运动控制。
大脑:负责感知外界并模拟人类思维决策过程,主要职能是环境理解、智能交互与认知推理,基础是机器视觉、大语言模型的发展。
小脑:模仿生物进行复杂的运动控制,主要职能是运动控制、路径规划和步态平衡。
本体(硬件):包含机器人的物理结构和执行器,它根据小脑层的运动规划,来进行 精确的伺服闭环控制每个电机高效精准地执行,完成既定的任务。
伴随着大模型的进展,人形机器人“大脑”智力快速提升,而“小脑”能实现的灵巧操作 能力却急需加强,主要受制于现实世界的多模态数据的采集能力,以及灵巧操作的软件泛 化能力较弱。供给端硬件的生产制造及成本早已不再是约束条件,当前,软件算法进步才 是推动人形机器人自主能力提升和应用场景拓展的关键。
3.2 具身智能技术为人形机器人最具突破性进展
具身智能是人工智能的一个发展方向,指一种智能系统或机器能够通过感知和交互与环境 进行实时互动的能力。具身智能不等于“大模型+机器人”,准确来说是人工智能+机器人 等物理实体,同时链接物理和虚拟两个世界,具身智能需要同时具备“本体+环境+智能” 三要素。
首先强调要具身本体,通常是机器人等物理实体。
其次强调要能与环境交互:能主动感知环境,还能通过行动改变环境,并能在与环境 的交互中不断学习和适应。
最后强调要有智能的提升:不仅通过算法和计算实现智能,还通过本体与物理世界的 交互来展现和发展智能。
具身智能技术的发展对人形机器人最具突破性意义。具身智能技术体系可分为“感知— 决策—行动—反馈”四个模块,四个模块形成一个闭环,在与环境的不断交互中,实现对 环境的重构映射、自主决策和自适应行动,并从经验反馈中不断学习进化。伴随着硬件制 造和软件技术等方面的进步,具身智能将赋予机器人更多的智慧,不断拓宽机器人的智能 边界和自主行动能力,使其更好地理解世界、自然化人机交互和高效执行任务,应对长尾 的能力,跨场景、跨行业、跨任务的能力能够进一步的提升。而人形机器人是具身智能的 一种形态,也被广泛认为是最理想的应用形态。因此,具身智能技术的突破对人形机器人 的量产与广泛应用具备关键性意义,有望引领人形机器人进入通用智能新代际。
智元机器人提出了具身智能 G1 到 G5 的演进路径和技术框架,通用人工智(AGI)是一个 长期的发展目标,就是在提供足够多、高质量的任务数据下,可以形成一个真正、全面的、 从感知决策到执行大模型、拥有具身智能、将具备跨任务的泛化能力、开放场景的机器人 技术能力。
3.3“大脑”:受益于大模型进步,已备初阶人类脑力
大模型是现阶段“大脑”的最佳解决方案。伴随着 AI 大模型的发展,机器人大脑实现产 业实现跨越式发展,智能化程度有望提升。目前人形机器人“大脑”技术以大模型为核心, 为人形机器人提供任务级交互、环境感知、任务规划和决策控制能力。 在环境感知方面:视觉大模型赋能人形机器人识别更精确,场景更通用; 在任务交互方面:基于大模型的语言/视觉运行处理方式可为人形机器人提供任务级 交互入口。 在任务规划方面:大型潜在的真实世界知识学习能力、强大的思考、推理和生成能力 为“大脑”的任务规划提供基础。 在决策方面:通过多模态统一建模,整合环境、运动等多样化信息,使得机器人能综 合视觉、语音、文本多维度信息,实现决策控制功能。 目前大模型可以分为非具身和具身大模型两类,他们本质的区别在于服务的对象不同。非 具身大模型服务的对象是人类,如 GPT-4、GPT-4V、Sora 等,它输出的内容是给人看或者给人读,更多还是在人机交互、内容生成等方面展现价值。而具身大模型的特点服务对象 是机器,其输出的内容是需要机器人能够理解、并最终要转化为具体可执行动作的控制指 令,以机械臂为例,最终输出可能就是对电机的控制信号。具身智能大模型被称作为机器 人的“大脑”,搭载具身智能大模型,赋予人形机器人“最强大脑”,已成为人形机器人 发展的必然趋势。
国内外典型的具身智能大模型有谷歌 RT-X、英伟达 GR00T、斯坦福李飞飞团队的 VoxPoser 以及 Meta 和 CMU(卡内基梅隆大学)联合打造的 RoboAgent 等。国内典型的具身智能大 模型有华为盘古大模型、阿里云大模型等。
人形机器人大模型多技术路线并行探索,有望从分层大模型逐渐向端到端大模型演进。现 阶段,机器人大模型主要是 4 条技术路线,一是 LLM(大语言模型)+VFM(视觉基础模型)分 层大模型,实现人机语言交互、任务理解、推理和规划,目前最为成熟。二是 VLM(视觉语言模型),结合语言与视觉理解间的差距,实现更准确的任务规划和决策,大多数的机器 人公司都采取了这个方案,典型代表有 FigureAI、银河通用、智元机器人等。三是 VLA(视 觉-语言-动作模型)端到端大模型,在 VLM 基础上增加运动控制,解决机器人运动轨迹决 策问题,以谷歌的 RT 模型为代表。四是多模态大模型,实现对物理世界环境的全面感知,是未来的主要研究方向。主要代表是麻省理工、IBM 等共同研究的 MultiPLY 模型,将视觉、 触觉、语音等 3D 环境的各类特征作为输入,以形成场景外观的初步印象,并通过多视图 关联将印象中的输出融合到 3D,最终得到以对象为中心的场景特征。
银河通用采用三层架构模型 VLA 大模型。底层是硬件层,中间层是通过仿真合成数据不用 任何真实世界数据训练的泛化的技能,包括自主建图、自主导航、物体抓取、开门开抽屉 开冰箱、移动操作、挂衣服叠衣服柔性物体操作的泛化技能。上层是大模型层,指负责任 务规划的基础大模型。1 月 9 日,银河通用以发布全球首个端到端具身抓取基础大模型 GraspVLA。GraspVLA 的训练包含预训练和后训练两部分。其中预训练完全基于合成大数 据,训练数据达到了有史以来最大的数据体量——十亿帧「视觉-语言-动作」对,掌握泛 化闭环抓取能力、达成基础模型;预训练后,模型可直接 Sim2Real 在未见过的、千变万 化的真实场景和物体上零样本测试,全球首次全面展现了七大卓越的泛化能力,满足大多 数产品的需求;而针对特别需求,后训练仅需小样本学习即可迁移基础能力到特定场景, 维持高泛化性的同时形成符合产品需求的专业技能。
谷歌采用端到端大模型 RT-X 模型。2023 年 10 月 4 日,谷歌旗下著名 AI 研究机构 DeepMind 在官网发布全球最大通用大模型之一 RT-X,并开放了训练数据集 OpenX-Embodiment。RTX 由控制模型 RT-1-X 和视觉模型 RT-2-X 组成的大模型同时训练决策和操作,直接端到端 地实现从人类指令到机械臂执行。但谷歌表示,AI 机器人非常强大,但在通用方面却很 差。例如,想开发一款物理扫地机器人,需要根据特定的环境、动作、障碍、反馈等数据 进行漫长地训练,然后进行反复测试才能完成产品研发。
人形机器人“大脑”仍需向更高级的智能化和自主化进化。当前,人形机器人“大脑”刚 刚具备初阶人类脑力,无法形成人类大脑全能力闭环。然而,要实现真正的智能化和自主 化,现有的大模型仍需在多个方面重点发力。
一是在感知模态维度方面形成突破。当前的人形机器人大模型主要依赖于视觉或语 音感知,这种单一的感知模态在处理复杂环境时显得力不从心。未来的大模型需要整 合视觉听觉、触觉等多种感知模态,能够提供更丰富的环境信息使机器人在复杂场景 中做出更准确的决策。
二是在指令生成速度与复杂性方面形成突破。现有的大模型在生成指令时速度较慢, 且生成的结果往往过于简单。这在需要快速反应的场景如紧急救援或复杂操作任务 中,可能导致机器人无法及时作出正确响应。目前主流机器人大模型偏向于任务理解 和拆分,对于机器人运动控制的涉及较少,只是用预设的端到端的训练方式生成了简 单且离散分布的机械臂末端位置和底盘移动指令,未渗透到连续路径和轨迹规划等 更偏机器人领域的内容。
三是在泛化能力提升与模型架构优化方面形成突破。泛化能力是大模型在新环境和 新任务中表现的关键。当前的模型在泛化能力上仍有待提高,尤其是在面对未知环境 和任务时,模型的表现往往不尽人意。为了提高泛化能力,未来的大模型需要在架构、 训练方法和数据集方面进行创新。例如,通过引入元学习、迁移学习等技术,可以使 模型更好地适应新任务。
3.4“小脑”:数据及泛化能力亟待突破
人形机器人“小脑”核心技术正在从基于模型的控制方法向基于学习的控制方法演进。机 器人“小脑”的运动规划与控制是人形机器人实现自然和流畅动作的关键,主要包括基于 模型的控制方法和基于学习的控制方式两个大类。传统的机器人控制方法依赖于精确的动 力学模型和专家知识,难以适应非结构化环境的不确定性和复杂性。学习型控制的发展使 得机器人能够从数据中学习控制策略,但其泛化能力和鲁棒性仍难以满足复杂场景需求。
传统的基于模型的控制方法:通过建立机器人的运动学和动力学模型,进行运动轨迹 规划和平衡控制,特点是身体控制稳健,步频较慢,代表算法有零力矩点(ZMP)算法、 线性倒立摆(LIP)算法、模型预测控制(MPC)算法、中心引力优化(CFO)算法等,但整 体开发较为复杂,成本高,不利于产品快速迭代。
基于学习的控制方法:使用端到端的 AI 技术,代替复杂的运动学模型,大幅度降低 了“小脑”开发难度、提升了迭代速度,一般通过人类示教或自主学习建立运动执行 策略。其中通过人类示教的方式也称为模仿学习,指通过人或者其他专家提供反馈示 教的方式使机器人以产生与示教相似的行动策略进行学习,效果依赖高质量示。
数据采集是机器人“小脑”发展的制约因素之一。提升机器人泛化能力的关键之一在于数 据的丰富性和准确性,不同于语言大模型的训练得益于互联网上海量的数据,机器人训练 数据则需要更多来自物理世界即真实世界动态环境中的交互数据,数据稀缺机器人技能学 习中的一个主要瓶颈,限制了算法的泛化能力和适应性。如何解决物理世界数据匮乏问题, 成为眼下人形机器人技术演进路上最大的难题。
主流的具身智能数据采集方法主要包括遥控操作、视频学习、合成数据等。
遥控操作:通过人类操作员远程控制机器人来直接捕获数据,适用于广泛的任务,数 据可以很容易地被模仿学习算法利用,采集效率比较低、成本过高,比较依赖本体、 很难泛化。目前采用这种方式的公司有特斯拉、PhysicalIntelligence 以及智元机 器人。其中 Optimus 的数据来自于 VR 遥操+动捕手套。
视频学习:通过人操作的视频,直接让机器人通过视频学习人类动作,积累训练数据。 这种方式可以从广泛的互联网视频中提取数据可,减少对专业设备和人员的依赖,降 低训练成本。但存在视频数据质量参差不齐、数据可解释性不足的问题。
合成数据:通过计算机模拟或生成模型创造的数据。合成数据的主要优势在于可以摆 脱现实条件的限制、快速且大量地生成数据,从而降低成本,赋予机器人更强的泛化 能力。例如,RoboGen 和银河通用,在海量合成的仿真环境中生成机器人训练数据。
4、硬件:技术路线趋于收敛,核心环节产能是关键
4.1 硬件方案趋于收敛
“肢体”是人形机器人实现所有拟人载体和基础,主要包含执行器、传感器、灵巧手、电 源、芯片、新材料结构件等方面。
执行机构对比:各家设计方案百花齐放、各具特色
关节执行器即机器人一体化关节,是影响机器人硬件成本和运动性能的关键部分。关节执 行器是驱动机器人执行机构(手臂、腿部等)运动的组件,安装在机器人关节处,通过将 电机的旋转运动转化为驱动连杆机构运动,又被称为(关节)驱动器或关节模组。按照运 动类型,执行器可分为旋转执行器、线性执行器。两者区别在于,线性执行器是将旋转运 动转换为直线运动输出,而旋转执行器则是输出旋转运动。基于成本、技术性能与软硬件 耦合等多方面的考量,各家人形机器人厂商在驱动器部件选用细节上存在一定的差异。大 部分厂商均以旋转执行器为主,少数厂商会采用线性执行器,如特斯拉。
旋转执行器多用于人形机器人关节处,如手腕、膝关节,主要由电机和减速器组成, 核心零部件是无框力矩电机、行星减或速器和谐波减速器等。目前主流的技术路线 有两条。从代表厂商披露的执行器方案来看,主要以刚性驱动器方案和准直驱驱动 器方案为主。刚性驱动器主要包括无刷电机+高传动比减速器(谐波)+高刚性力矩 传感器。准直驱驱动器主要包括高扭矩密度电机(无框力矩电机)+低传动比减速 器(行星)。
线性执行机构多安装于机器人上臂、大腿及肘部,可理解为旋转执行器的线性转 换,通常实现伸展、推拉等直线运动,主要通过梯形丝杠、滚珠丝杠或行星滚柱 丝杠实现。其中,行星滚柱丝杠具有更高承载力、更小的体积和更高的寿命,或 为未来发展趋势。
灵巧手:美国相对领先,国产灵巧手快速崛起
人形机器人是模仿人类手部结构与功能的高复杂度机械装置,灵巧手需要具备像人手一样 的灵活性、精巧性和功能多样性。这需要从外形、内在结构、驱动和传动原理等多个方面 进行深度仿生,使机器手能够模拟人类手指的复杂运动,实现抓取、操作和感知等多种功 能。当前美国在机器人灵巧手技术上处于领先地位,美国的许多公司和研究机构在灵巧手 的硬件设计和智能化控制系统方面积累了大量的技术经验。中国近年在机器人灵巧手域的 技术积累迅速增长,尽管与美、欧相比还有一定差距,但市场规模庞大,政府支持力度强, 市场化进程快。自由度角度看,海外特斯拉、ShadowHand、SCHUNK 和 ILDA 已经将 DOF 自 由度做到 20 个以上,国内青龙灵巧手自由度做到 19 个,处于国内较为领先地位。抓握力 角度,海外的 QBhand 和国内的星动纪元较为领先,抓握力分别达到 62N 和 80N。国内市 场上,因时机器人、傲意、腾讯 RoboticsX 实验室等企业也在积极布局,且具有低成本供 应链优势,未来国产灵巧手有望占据更多市场份额。
传感器配置对比:各家设计方案百花齐放、各具特色
机器人对环境的感知大多通过激光雷达、摄像头、毫米波雷达、超声波传感器、GPS 这五 类传感器及其之间的组合来实现。机器人感知方案或如同自动驾驶,分为纯视觉感知与激 光雷达两大路线。纯视觉方案利用摄像头和视觉算法进行环境感知,其优势为成本低且符 合人眼逻辑,在数据积累达到一定规模后能够超越激光雷达方案的表现,但在恶劣环境下, 摄像头完成感知任务的难度也会随之提升。激光雷达方案可以在现有技术条件下实现快速 3D 建模,比较精准的还原路况信息,目前的痛点在于成本高昂、且对芯片算力需求大。
当前,人形机器人感知方案主要分为纯视觉感知与多传感器融合两大路线。人形机器人视 觉方案目前主要以结构光、双目或多目 RGB、TOF 等的组合方案为主;算法基础强的厂商 会采用更为简单的传感器方案,而算法相对薄弱的厂商会选择更为核心的硬件。纯视觉方 案典型代表如特斯拉、小鹏。特斯拉 Optimus 采用纯视觉传感器方案,搭载了 2D 视觉传 感器和与特斯拉车辆相同的 FSD 技术以及 Autopilot 相关神经网络技术。大多数多传感器 融合方案主要结合深度相机与摄像头进行感知,代表公司有智元、宇树等厂商。
电池:动力电池为人形机器人提供所需的能量,对机器人的性能、续航能力、安全性 以及成本等方面具有重要影响。FigureAI 发布的 Figure02 人形机器人搭载 2.25KWh 的电池组,一次充电可以运行 5 小时。我国目前大部分人形机器人的运行时间通常为 2-4 小时。电源包括电池和电源管理系统两部分。电池方面,目前锂离子电池是主流, 但其在能量密度、循环寿命等方面仍无法满足未来人形机器人长时间、高负荷工作的 要求。国内企业如宁德时代等正在研发更高性能的电池技术。电源管理系统方面,主 要用于监控电池状态,优化能源使用,确保人形机器人在各种工况下都能稳定运行。 国内在电源管理系统的研发方面也在不断加强。
新材料结构件:人形机器人的新材料主要应用在骨骼、外壳等方面。该部分是支撑人 形机器人进行各种行动的基本框架,其应用场景包括外壳标料脊椎、大臂、小臂、大 腿、小腿等结构件。目前人形机器人"朋支体"骨骼的常用材料包括钢材、铝合金、镁 合金、碳纤维、工程塑料等。在保证机器人功能的先进性、稳定性、使用可靠性和服 役安全性的前提下,采用轻量化材料,结合结构优化设计、先进制造工艺,可使机器 人构件轻量化,能够提高机器人的机动灵活性,保证机器与人类一起协作工作时不会 受到机器的伤害等问题。目前,聚醚醚酮(PEEK)在人形机器人"肢体"方面具有较大的 应用潜力,可以满足人形机器人本体轻量化的要求,大幅提高人形机器人灵活性和工 作效率,减轻其运动惯性,提高安全性。采用了 PEEK 材料的特斯拉 OptimusGen2 较 上一代减重 10kg。
综上,结合 1.2 及 1.3 节展示的各家人形机器人具体方案对比,可见,在硬件方案设 计上,各家方案趋于收敛,人形机器人硬件不再是本质约束条件,难点主要体现在 0- 1 设计、规模制造及降本上。 根据特斯拉人形机器人 Optimus 公开信息,我们预测: 从技术壁垒看:行星滚柱丝杠>六维力矩传感器>谐波减速器>空心杯电机>无框力矩电机。 从竞争格局看,国产供应链具备较强的创新及降本能力,有望对人形机器人的量产及降本 做出巨大贡献,预计未来随着人形机器人市场的爆发,国内厂商市场份额有望进一步提升, 实现跨越式发展。
4.2 丝杠:成本+产能为王
4.2.1 丝杠厂商:规模制造能力是关键,其次降本能力
丝杠螺母传动将旋转运动变换为直线运动(或相反传递),主要分为滑动丝杠、滚珠丝杠、 行星滚珠丝杠。滑动丝杠是滑动摩擦、结构简单但精度差,传动效率 25-50%;滚珠丝杠是 滚动摩擦,传动效率约 90-99%,精度高、效率高、但价格高。行星滚柱丝杠承载力强、耐 冲击、体积小,但是由于结构复杂、加工难度大且成本高
反向式行星滚柱丝杠与标准式行星滚柱丝杠的差别在于螺母作为动力输入构件,绕自身轴 线旋转,丝杠作为执行部件,沿轴向移动;丝杠两端增加齿轮替代内齿圈与滚柱端齿啮合, 保证滚柱在丝杠上为滚动,滚柱与丝杠没有相对轴向位移,一起沿轴向移动。反向式行星 滚柱丝杠的螺母为主动件,丝杠为输出构件,滚柱、丝杠之间无相对轴向位移,其主要用 于中小负载、小行程和高速的应用场景,其最大的优势在于可将其螺母作为电机转子实现 电机和丝杠一体化设计,形成结构紧凑的一体式机电作动器。
行星滚柱丝杠是人形机器人“肢体”的核心组成部分,可以广泛应用于机器人的手臂、腿 部以及灵巧手等多个方面,为机器人提供精确的线性运动控制。以特斯拉人形机器人为例, 其人形机器人髋部、大腿、小腿部分采用行星滚柱丝杠,肘部采用滑动丝杠,丝杠分为 500N、 3900N、8000N 三种规格,以适应不同关节的承载需求。根据特斯拉公开信息,GEN3 灵巧 手自由度从 11 提升到 22 个,驱动方式预计采用线性执行器。目前,特斯拉在其人形机器 人 Optimus 中使用反向/反转式行星滚柱丝杠,主要基于其在性能上的优势,尤其是在承 载能力和刚度方面,但不排除对承载力要求更低的人形机器人采用成本更低的滚珠丝杠。
精度是衡量行星滚柱丝杠性能的关键指标之一。国际行星滚柱丝杠精度分类标准 G 级,行 星滚柱丝杠标准精度等级为 G1、G3、G5(导程精度:6μm/315mm、12μm/315mm、2 3μ m/315mm)。我们估计,人形机器人不需要像机床考虑重复定位精度,丝杠精度或许不需要 达到 G3 级别,G5 精度或能满足需求。
高精度行星滚柱丝杠制造难度非常高,主要有三大壁垒:原材料、工艺流程、生产设备。 并且由于反转式的螺母长度远远高于普通式,如何在如此高长度的螺母内加工螺纹是难点, 需要精密的机械加工技术和高质量的控制。
材料:普通的金属材料无法满足需求,通常需要特种金属材料来进行制备,国外丝杠 与国产丝杠均采用加入了 Mo 元素的优质合金结构钢,但国产仍有不小差距。
工艺流程:丝杠加工流程长工艺复杂,规模制造能力是关键。从材料、热处理、设计、 粗精加工、检测环环相扣涉及大量“KnowHow”,丝杠制造厂商需要较长时间的积累才 能掌握全部工艺,并且应用和反馈中不断迭代和优化。
生产设备:设备决定丝杠的加工精度和效率,磨床是丝杠加工的核心技术壁垒,其精 度直接决定丝杠精度。磨床通过其高度精密的磨削技术,能够确保丝杠具有一致的螺 纹形状和尺寸,从而提供可靠的性能和稳定的运动控制。磨床的精度直接影响着丝杠 的轴向精度、径向精度以及整体的运动平稳性。磨床研磨工艺的选择及磨床技术人员 的储备是一个制约因素。
当前行星滚柱丝杠格局较为集中,主要被海外龙头垄断,国内仅有几家具备量产能力。随 着人形机器人市场的爆发,国产厂商积极进入行星滚柱丝杠市场,将在产品性能、成本控 制以及产能扩张能力进行比拼。
全球市场,海外龙头企业占据了在高端行星滚柱丝杠领域的主导地位,包括:瑞士 GSA、 瑞士 Rollvis、瑞典 Ewellix、博世力士乐、美国 CMC 等。瑞士 GSA 公司是舍弗勒子 公司,于 2015 年收购瑞士 rollvis 集团,并且和母公司收购了伊维莱集团(前 skf 行星滚柱丝杠部门),成为全球行星滚柱丝杠龙头之一。目前,特斯拉人形机器人用 的是瑞士 GSA 集团的 RGTI 行星滚柱丝杠。
我国行星滚柱丝杠进口占比较高,具备量产能力的仅有南京工艺、博特精工等少数几 家。人形机器人市场,新进入的国内厂商包括贝斯特、恒立液压、北特科技、双林股 份、新剑传动、北特科技、五洲新春、江苏雷利、震裕科技等。
4.2.2 设备:磨床是核心,关注精加工环节降本新路线
磨床是精加工设备核心,需求弹性大。在丝杠有较大潜在成长空间背景下,产能扩产有望 成为丝杠企业下一步工作重点。丝杠制造流程较长,会带来热处理、校直、车床、磨床、 检测设备等多类设备需求。其中,螺纹磨床是决定丝杠精度的核心设备之一,要实现最终 的高精度加工,磨床核心功能部件需要具有较高精度。根据秦川机床公告信息,从再融资 项目中关于滚动功能部件扩产的项目规划看,5 亿丝杠产值(公司公告披露的测算结果) 对应设备投资额 1.56 亿元,其中磨床价值量占比约为 48%,价值量占比高主要由于高端 磨床采用了进口机床,单价较高,高精度床身导轨磨单价可达 2800 万元。
假设人形机器人出货量达到 100 万台,平均每台机器人使用 10 支行星滚柱丝杠,使用两 台磨床(内螺纹和外螺纹加工)进行制造,假设设备单价为 200 万元(内螺纹磨加外螺纹 磨对应 400 万元/套),每支丝杠平均制造时间分别为 40/60/80 分钟(按照精磨环节时间 计算),对应磨床市场需求分别为 44/67/89 亿元。
螺纹磨床原本是较小的市场,海外企业单一体量不会太大,国产厂商未来有较大成长空间。 德国、日本等发达国家的磨床企业起步较早、技术水平领先,产品附加值较高,包括德国 斯来福临集团、日本捷太格特、德国埃马克、士罗曼蒂克等。国内磨床企业普遍体量也还 较小,在丝杠扩产有较大潜在市场需求的情况下,我们认为国内有能力实现螺纹磨床突破 的企业将有较大弹性。目前秦川机床、华辰装备、日发精机均积极加码螺纹磨床布局。
粗加工制造环节存在技术升级迭代的新机会。提升加工效率是实现降本的重要方式之一, 例如通过以车代磨、以铣代磨实现降本,这会带来硬车床、旋风铣床、超硬刀具的需求。
以铣代磨:经统计,传统磨削工艺中,螺纹磨削时间占整个工艺流程的 2/3。基于螺 纹磨削切削用量的限制,并且在磨削过程中要不断地修整砂轮和校直丝杠,工时较长。 硬铣螺纹工艺是将螺纹滚道一次成形铣削,不仅减少了工序,而且不必反复修整刀具 和校直,在一定程度上降低了螺纹加工所占时间份额,从而大大缩短了滚珠丝杠加工 周期,提高了加工效率。目前国内企业正积极布局旋风铣床开发,秦川机床子公司汉 江机床目前开发的数控丝杠铣床可用于滚珠丝杠滚道硬旋铣成型加工,加工效率比 传统方式提高 30%。
以车代磨:粗加工环节,通过数控车床实现以车代磨,以缩短磨削加工工时、提升加 工效率是丝杠降本核心方向之一。目前浙海德曼开发的高精度高刚性主轴结构电主 轴,可以承受较大的轴向负荷,可实现重切削及以车代磨,根据浙海德曼公告信息, 公司已积极与下游多家企业进行了应用技术交流对接,已向有关企业供应过相关设 备。现有产品高端机(车床及车铣复合加工中心)系列精度指标已达到了行业领先水 平,未来将往更高精度突破,实现部分工艺以车代磨技术。
4.3 减速器:谐波为主、行星为辅双路线并存
从代表厂商披露的执行器方案来看,基于成本、技术性能与软硬件耦合等多方面的考量, 主要以刚性驱动器方案(谐波减速器)和准直驱驱动器(行星减速器)方案为主,其中特 斯拉人形机器人采用刚性驱动方案(即谐波减速器)、国产人形机器人大都采用准直驱动 方式(即行星减速器方案)。根据《国内外双足人形机器人驱动器综述》,人形机器人的驱 动单元主要包括了刚性驱动、弹性驱动和准直驱驱动三种,刚性驱动器在双足人形机器人 率先应用,设计理论也相对成熟,在传统的双足机器人、工业机器人、协作机器人和工业 精密转台等方面得到广泛应用,但受到电机装置功率密度限制。弹性驱动器由于弹性体的 引入,系统驱动不足,给控制带来了难度,尤其是在机器人前置使用时,机器人整机的运 动控制比较难实现。准直驱动驱动器是最近几年新兴技术,发展迅速,并有很多产品得到 应用。
减速器是旋转执行器的核心零部件之一,在原动机和工作机或执行机构之间起匹配转速和 传递转矩的作用。目前谐波减速器、行星减速器以及创新型减速器存在技术路线问题。特 斯拉人形机器人主流路线是谐波减速器方案,同时也与双环传动研发的新型减速器、或者 行星减速器方案。国产人形机器人大都采用行星减速器为主,谐波减速器为辅。使用谐波 减速器方案需用到力矩传感器做力控,结构和成本更加复杂,多级行星结构相对简单、但 精度相对较低。从产品和成本差异度看,谐波减速器赛道好于行星减速器,谐波减速器未 来规模经济和成本迭代空间大于行星。
全球谐波减速机市场较为集中,日本的哈默纳科、日本新宝等企业技术水平处于行业领先 地位。国内谐波齿轮传动技术发展相对较晚,内资绿的谐波率先在国内实现了谐波减速器 的产业化和规模化,同时也涌现了来福、大族等优质厂商。国内部分企业通过技术攻关、 生产工艺的改进,研发出的产品在性能和稳定性等方面已能够达到国际先进水平,打破了 国外的技术垄断,对国外品牌逐渐形成一定的替代。在行星减速器方面,相对来说,中国 产厂商已经占据较大市场份额,主要代表厂商有赛威传动(德国)、纽卡特(德国)、威腾 斯坦(德国)、新宝(日本)、纽格尔智能(中国)、罗斯特(中国)、中大力德(中国)、 纽仕达特(中国)、科峰智能(中国)等。
龙头公司已率先计划扩产。面对人形机器人对谐波减速器的需求,哈默纳科、绿的谐波纷 纷扩产。2024 年 10 月,哈默纳科计划进行约 100 亿日元的战略投资,开拓新兴的人形机 器人市场。2025 年 1 月 1 日,绿的谐波完成非公开发行募集资金 14 亿元用于新一代谐波 减速器扩产项目,拟建设 100 万台/年谐波减速器产能,预计 2027 年两代谐波减速器产能 合计 159 万台/年。
4.4 电机:设计创新和新材料是发展趋势,国产性能日益进步
人形机器人电机要求三个关键点,即高效率、高动态和高功率密度。电机是指依据电磁感 应定律实现电能转换或传递的一种电磁装置,主要作用是产生驱动转矩,作为用电器或各 种机械的动力源。关节电机为人形机器人各种动作和姿态的实现提供动力,具备减速、传 动、提升扭矩等功能,作为机器人的核心硬件,是机器人运动的“心脏”。人形机器人的 自由度决定电机需求的数量,机器人灵活性越高,所需的电机数量越多。 高效率:低能耗和低摩擦损失很重要,因为机器人通常由电池供电,能经受得起苛刻 的运行条件,可进行十分频繁的正反向和加减速运行,并能在短时间内承受过载。 高动态:整个驱动器(电机、机构、接线、传感器和控制器)的惯性应尽可能低,电动 机从获得指令信号到完成指令所要求的工作状态的时间应短。 高功率密度:机器人应用需要高速、高扭矩电机,这些电机还需要小巧,紧凑,轻巧。
空心杯电机和无框力矩电机为人形机器人核心电机。通常,无框力矩电机具有高效、高扭 矩密度和长寿命等特点,因此在需要高性能和精确控制的人形机器人关节中得到了广泛应 用。空心杯电机是一种直流永磁的伺服控制电机,主要应用于末端灵巧手。
无框力矩电机:无框力矩电机是一种以输出扭矩为衡量指标的无框架式永磁电机,没 有轴、轴承、外壳或端盖,只有转子和定子两个部件。转子是内部部件,由带永磁体 的旋转钢圆环组件构成,直接安装在机器轴上。定子是外部部件,包含有齿钢叠片, 外面包裹着能产生电磁力的铜绕组,紧凑地安装在机器外壳的主体内。以特斯拉人形 机器人为例,特斯拉人形机器人全身共有 28 个执行器,则对应需求 28 个无框力矩电 机。
空心杯电机:属于伺服电机,不同于普通铁芯电机将电机绕组固定在铁芯之上,空心 杯电机绕组不依靠铁芯支撑,而是利用特殊工艺将电机绕组做成可以独立支撑的杯 状。由于采用无铁芯转子结构,空心杯电机消除了由于铁芯形成涡流而造成的电能损 耗。同时,其重量和转动惯量大幅降低,减少了转子自身的机械能损耗,大幅提高了 电机的运转性能。
空心杯电机的生产难点在于线圈的绕制过程,这一环节包括设计和加工两个关键步骤,直 接影响电机本身特性的重要参数。目前,空心杯电机厂商线圈绕制主要使用专门定制的线 圈设备,国内市场主流绕线设备供应商包括田中精机、中特科技、东莞台立、昆山库克等。
无框力矩电机国内外厂商产品性能逐渐缩小。美国科尔摩根是全球无框力矩电机龙头,拥 有超 70 年的运动控制研发经验,电机性能在全球处于第一梯队。国内目前进展较快的公 司包括步科股份、航天电器。相比海外龙头,国产无框力矩电机在产品性能方面虽然仍有 差距,关键参数与国外企业的差距不断缩小。
鸣志电器是人形机器人空心杯电机国产先锋,兆威机电厚积薄发。空心杯电机起源于德国、 瑞士等欧美国家,全球头部企业包括德国 Faulhaber、瑞士 Maxon 和瑞士 Portescap。海 外龙头在空心杯电机领域布局较早,技术经验积累深厚,是全球空心杯电机的主要供应商。 国内起步较晚,有业务布局的企业包括鸣志电器、拓邦股份、江苏雷利和伟创电气。根据 上述各公司公告,鸣志电器空心杯电机技术水平位居全球前列;拓邦股份空心杯电机已经 实现批量应用;江苏雷利子公司鼎智科技的空心杯电机已实现量产,目前处于小批量验证 阶段;伟创电气处于产品内部测试阶段,其余企业技术相对薄弱,国产替代空间广阔。
4.5 传感器:视觉、力觉、触觉为主,亟待培育国产龙头
具身智能机器人是指将 AI 融入机器人物理实体,赋予它们像人一样感知、学习和与环境 动态交互的能力。具身智能机器人根据其功能和应用场景,配备了多种类型的传感器,包 括视觉传感器(如摄像头、激光雷达、毫米波雷达、红外传感器等)、听觉传感器(如麦 克风)、嗅觉传感器(如气味传感器)、触觉传感器(包括力传感器)、编码器、IMU 等,以 实现感知和分析外部环境并进行自身状态反应,实现复杂的交互和操作任务。
4.5.1 视觉:主流方案为 3D 视觉,国产化较高
视觉方案主要分为 2D 视觉和 3D 视觉:1)2D 视觉:通过 2D 相机分析灰度或彩色图像中 的像素灰度特征获取目标中的有用信息,识别纹理形状。容易受到光照影响,且无法实现 三维精准测量。2)3D 视觉:精度更高、信息量更大(三维图像)、集成度更高,适用于更 加复杂、精密的识别、检测需求。 机器人的视觉感知属于高度集成的模组方案,对于体积、成本、精准度都有较高要求,因 此 3D 视觉高度集成、体积小、精度高的优势更适合机器人的场景。
目前主流机器人厂商的视觉方案各不相同。其中波士顿动力 Atlas 选择的是 TOF 深度相机 方案,特斯拉 Optimus 选择多目摄像头方案,小米 CyberOne 采用深度视觉模组,优必选 WalkersX 采用多目视觉传感器。
海外头部厂商先发优势明显,国内厂商多技术布局、通过芯片自研逐渐打开市场。海外头 部 3D 视觉传感器厂商通过芯片自制、自身产品依托,业务规模较大,国内代表公司奥比 中光等通过自研芯片,实现 3D 视觉传感器部分技术指标逐渐接近海外龙头厂商,未来有 望实现国产替代。
4.5.2 力觉:机器人精确、灵活操作的核心
从力传感的检测方法来看,可分为电阻式、电容式、电感式,光电式等。电阻应变式综合 性能检测模式优势明显,有望在人形机器人中得到应用。 硅/金属箔电阻应变传感器有望应用于人形机器人。不同类型的力矩传感器在稳定性、刚 度、动态特性等维度进行比较后,硅/金属箔电阻应变式传感器在稳定性、刚度、信噪比 等方面具有优势,有望在人形机器人中得到应用。
从力传感器的感知维度来看,力矩传感器可以分为一维到六维,测量维度的数量越多,产 品生产难度越大、档次越高;从主流的传感器的测量维度来看,一、三、六维力矩传感器 为常见产品,二、五维力矩的相对较少。
从人形机器人的工作原理来看,我们判断未来人形机器人的手腕、脚踝环节需六维力矩传 感器、其他关节可以适用关节扭矩传感器。 1)末端执行机构(手部、脚部)---六维力矩传感器:由于人形机器人末端执行机构主要 为手部和脚部,执行的过程中力臂在几十到几百毫米之间,力臂较大且属于随机变化;而 对于这两类环节的力也要求实现精确处理,因此这两类关节所受的力并非简单的一维、三 维力,我们判断这个关节需要适用六维力矩传感器。 2)其他关节---关节扭矩传感器:特斯拉人形机器人旋转执行机构类似协作机器人关节, 而线性执行机构也通过滚珠丝杠完成直线运动,整体对于力的感知相对简单,我们预计其 他关节需单轴力矩传感器。
全球力矩传感器的龙头为美国 ATI,国内目前力矩传感器技术领先的企业主要为创业公司 (南宁宇立仪器、常州瑞尔特),上市公司主要为柯力传感、中航电测、东华测试等。
4.5.3 触觉:视觉+触觉为目前技术前沿、应用潜力大
电子皮肤是是新型的仿生柔性触觉传感系统,通过柔性传感器进行信号感知转换。从表面 的接触方向来看,电子皮肤能够感知压力、剪切力、接触力等多多个类型的力,能够助力 机器人在手部实现更加精细的操作。
电子皮肤主要分为基底层、导电层、传感层。 基底层:基底层是电子皮肤的最内层,通常由柔性材料制成,以模拟人体皮肤的弹性 和柔韧性。又称为支撑层,起到支撑作用。 导电层:导电层在电子皮肤中起到传导电信号的作用,通常包含导电材料,如导电石 墨或特定的导电聚合物,用于检测并传输由外界刺激引起的电信号变化。导电层的设 计和材料选择对于电子皮肤的灵敏度和响应速度至关重要。 传感层:传感层位于电子皮肤的中间层,包含了大部分的传感元件,负责精确识别压 力和摩擦力并转化为电信号。传感层可以实现对外界刺激的精细感知,是电子皮肤的 核心材料。
电子皮肤主要内部的柔性传感器是触觉传感器的一个子集。从检测方法来看,柔性触觉传 感器传统方案主要包括压阻式、电容式、压电式、摩擦式四种类型,其中压阻式触觉传感 器具有成本低、稳定性好等多个优点,是目前的主流方案。
国内头部厂商帕西尼提出了视觉+触觉方案,在触觉的多项技术指标实现领先,有望成为 未来的主流方案。 在去年的 2024WRC 大会上,帕西尼正式发布了、第二代多维触觉灵巧手 DexH13,及基于 ITPU 技术的多维度触觉传感器 PX-6AXGEN2。在帕西尼感知科技的 DexH13 双手上,搭载了 近 2000 颗自研生产的高精度触觉传感器 PX-6AXGEN2;此外,该双手还集成了 DexH13 双 手集成了有 800 万高清 AI 手眼相机,基于先进的零样本位姿估计视觉算法,能够识别和 抓取物体六维位姿,适应多种复杂环境和任务。
帕西尼的 IPTUGEN2 触觉传感器在多项技术指标领先、且成本低。根据帕西尼官网, ITPUGEN2 多维触觉传感器在灵敏度、抗干扰等多项指标表现优异,且通过全集成方案,产 品成本相对较低。
全球市场以外资品牌为主,行业集中度高。全球柔性触觉传感器市场主要以外资品牌为主, 其中CR5为57.1%,头部厂商包括Novasentis、Tekscan、JapanDisplayInc.(JDI)、Baumer、 Fraba。国内柔性传感器厂商以帕西尼科技、汉威科技、钛深科技、弘信电子等企业为代 表,近年来迅速发展。
4.6 灵巧手:向高承载力、柔性感知方向发展
灵巧手的设计灵感来源于人类手部的复杂结构和功能,它使得机器人能够执行诸如抓取、 操纵、甚至感知等多样化任务,灵巧手的成熟度决定了其融入人类世界的深度。灵巧手结 构设计三要素:驱动、传动、感知。典型灵巧手由驱动系统、传动系统、感知系统和控制 系统构成。灵巧手的技术迭代方向往高灵活度、柔性感知、智能化方向发展。
根据特斯拉公开信息,GEN3 灵巧手相比于 GEN2 的主要变化在于: (1)手部增加了自由度,从 11 个提升至 22 个。 (2)驱动器装载在了手腕部位。
驱动方式:空心杯电机是灵巧手电机主流方案,无刷有齿槽电机是降本方案。 电机驱动是最适合灵巧手批量生产使用的方式,其使用的电机按有无齿槽区分为无刷有齿 槽电机和无刷无齿槽电机,大部分直流无刷电机都是有齿槽设计,空心杯电机属于无齿槽 电机,具备小直径、扭矩波动小等特点,是当前机器人灵巧手电机的主流方案。无刷有齿 槽电机直径较空心杯电机更大,可部分替代空心杯电机在灵巧手中的应用,是可行的灵巧 手降本方案。
传动方式:微型丝杠+腱绳复合传动或成未来灵巧手主流方案。 机器人灵巧手抓取的稳定性和灵活性指标主要取决于传动系统,按照传动方式不同,可将 灵巧手分为腱传动、连杆传动、齿轮/蜗轮蜗杆传动等类型。特斯拉 0ptimusGen1 灵巧手 采用空心杯电机+多级行星减速器+蜗轮蜗杆方案。腱传动是应用最广泛的灵巧手传动方式, 具备排布灵活、柔性传动等优点,但负载能力较弱。微型丝杠新型传动方案具备高承载、 高效率、高精度、高可靠性等优点,未来微型丝杠+腱绳复合传动或成主流方案。2024 年 11 月 28 日,Tesla0ptimus 在 X 平台官方账号发布旗下 0ptimus 机器人接球视频展示其 新一代手臂和灵巧手,掌内所有驱动系统已移至前臂,通过腱绳驱动手指。根据《空间五 指灵巧手控制系统设计_韩运峥》,电机和滚珠丝杠外置于手臂中,电机通过减速器带动滚 珠丝杠,电机轴的旋转运动被转化为丝杠螺母的平移运动,丝杠螺母拉动腱绳,腱绳另一 端连接到手指指骨上,拉动手指关节绕关节轴旋转,形成手指弯曲运动。
感知系统:电阻式和电容式触觉传感器有望成为主流。 灵巧手感知系统可使用的传感器包含力、位移、触觉、角位移、视觉、压力、力矩、位置、 霍尔和温度传感器等。根据特斯拉 GEN2 发布会,特斯拉机器人上确定搭载了触觉传感器。 触觉传感器赋予灵巧手触觉感知能力,通过接触测量物体的物理特征,从而实现对周围环 境的感知。根据原理不同,触觉传感器分为压阻式、电容式、压电式和光学式等,最见的 是压阻式、电容式和压电式触觉传感器。通常,电阻式适用于大面积覆盖,可用于手臂和 身体部位;电容式适用于高精度场景,可用于指腹以辨别纹理;热辐射式:可布局在指缝 间感知温度。
4.7 整机:海内外几乎处于同一起跑线,国产整机厂商有望乘势而起
2023 年 11 月 2 日,工业和信息化部又印发了《人形机器人创新发展指导意见》,提出到 2027 年,人形机器人技术创新能力显著提升,构建具有国际竞争力的产业生态,综合实力 达到世界先进水平。自上而下的政策支持体系,产生了一系列区域集群效应。 人形机器人行业发展海内外几乎处于同一起跑,国产主机厂有望充分分享产业上升浪潮。 国内机器人厂商,如智元机器人、宇树科技、优必选、埃夫特、禾川科技均积极投身人形 机器人主机研发中,且华为重磅加码人形机器人产业,随着以华为为中心的具身智能产业 链联盟技术逐渐完善,国产人形机器人在应用场景开拓及产业链降本中起到重要作用,迎 来快速发展。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
热门跟贴