打开网易新闻 查看精彩图片

译者按· 2026.01.26

2025年12月14日,摩根士丹利全球具身智能团队推出研究报告《机器人年鉴·第二卷:如何训练你的机器人》,并在报告中提出,机器人产业正迎来“双重逃逸”的发展变局:其一,是应用场景的空间迁移,机器人从传统的工厂流水线走向家庭、农场、城市、海洋乃至太空等更广阔的场域;其二,是技术范式的核心转换,发展重心从以“大脑”为核心的通用大模型,转向以“身体”为核心的物理动作控制技术。

报告指出,这场“双重逃逸”将深刻重塑全球算力产业版图,而边缘推理芯片、模拟引擎、机器人传感器三大赛道,有望成为未来十年最具硬核竞争力的投资主线。此外,这份报告还强调,AI驱动的机器人正经历一场历史性跃迁,其应用边界正从工厂车间向多元场景拓展,技术训练的焦点也随之从“认知智能”转向“物理智能”,这一转变将触发边缘计算领域的新一轮激烈角逐。

传统工业机器人到Post AI时代:

跳脱结构化牢笼

摩根士丹利在报告中指出,传统工业机器人(Pre—AI Robotics)被锁死在“结构化牢笼”当中,局限于任务单一、固定产险、无需感知与学习能力的环境中。然而如图3所示,先进Post AI时代(Post—AI Robotics)机器人场景发生转变:Post-AI时代的机器人已经可以出现在多个应用场景内(包含家庭、农场、海洋等)。

“跳脱结构化牢笼”标志着机器人产业从“工具型”向“自主型”转变,场景拓展打开市场空间,技术重心的转移则为产业升级提供了核心支撑。随着场景从结构化走向复杂多变,技术研发已从“单一程序执行”转向“多模态感知+自主决策+精细控制”的综合能力构建。

对中国而言,这些技术突破不仅让机器人具备了适应动态环境的自主能力,更推动中国机器人产业在具身智能、运动控制等核心领域跻身世界前列。例如,2025年4月,北京人形机器人创新中心研发的“天工Ultra”创造人形机器人半程马拉松世界纪录 ;银河通用机器人发布全球首个跨本体、全域环视导航基座大模型NavFoM,率先突破小时级长程导航与动态避障 。

长期来看,企业需以场景为牵引、以技术为支撑,突破工程化与供应链瓶颈,形成“场景倒逼技术、技术赋能场景”的良性循环,才能在新一轮变革中占据优势。场景拓展的广度直接决定了市场增长的天花板。过去局限于流水线作业的机器人,如今已在中国的多种非结构化场景中落地生根。例如北京橡鹿科技的炒菜机器人能自主完成颠勺、调味、出菜全流程,覆盖八大菜系并在连锁餐饮门店规模化应用,既降低了商家运营成本,又保障了菜品标准化; 上海虹桥香格里拉酒店引入擎朗智能的人形机器人与专用机器人协同作业,实现接客问候、行李运送、客房引领、餐饮配送的全流程自主服务,让场景应用从单一功能走向系统协同。 这些场景的突破,让机器人产业从工业制造的细分赛道,拓展到多元化的高潜力领域,市场空间实现指数级扩容。

打开网易新闻 查看精彩图片

图1: 传统工业机器人 (Pre-AI Robotics) 特征简介(图源:摩根士丹利)

打开网易新闻 查看精彩图片

图2: Post-AI Robotics 特征简介(图源:摩根士丹利)

打开网易新闻 查看精彩图片

图3: 从Pre AI时代至Post AI时代机器人的转变(图源:摩根士丹利)

训练模式的转变:

从“大脑”最佳化到“身体控制”

如图4所示,报告将人工智能训练划分为两大核心赛道:其一为以大语言模型(LLM)、视觉语言模型(VLM)为代表的“认知赛道”,聚焦于构建文字与图像之间的抽象关联逻辑;其二是以视觉-语言-动作模型(VLA)为典型的“物理赛道”,核心目标是实现从像素信息到关节扭矩的精准映射。而这一划分,恰恰让莫拉维克(Moravec)悖论的效应清晰显现——对人类来说,“走路”这类肢体活动远比微积分运算简单,可在人工智能的训练逻辑里,二者的难易程度却呈现出截然相反的图景。目前,为了获取物理资料,产业界已形成如图5所示的三条收集训练数据的技术路线:远程操作(Teleoperation)、模拟训练(Simulation)和视讯学习(Videos)。

打开网易新闻 查看精彩图片

图4: Foundation models — Understanding the connections人工智能训练的两大核心赛道 (图源:摩根士丹利)

打开网易新闻 查看精彩图片

图5: 产业界收集训练数据的三条技术路线(图源:摩根士丹利)

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

图6: 三条技术路线的优劣势分析(图源:摩根士丹利)

远程操作,是指人类借助动作捕捉技术操控机器人,使其复刻自身行为的一种方式。然而这种方式不仅耗时费力,扩展性也欠佳,未来或将逐步被更先进的技术所取代。模拟训练技术依托数字孪生技术,能够在虚拟环境中无限复现各类复杂场景,比如极端天气、突发障碍物等,并结合强化学习算法持续优化机器人的动作指令。目前,虚幻引擎、Unity等主流游戏引擎公司已深度入局这一领域,英伟达的Omniverse平台正是凭借其在游戏GPU领域长期积累的技术优势搭建而成。视频学习技术可直接从海量人类行为视频(如YouTube平台的相关视频)中提取动作模式,无需进行物理层面的交互,就能完成机器人模型的训练。谷歌DeepMind的Genie 3、Meta的V-JEPA 2等一众“世界模型”,均采用了类似的技术思路,它们不仅能识别动作模式,还可精准预测物体的运动轨迹以及物理交互的最终结果。

视频学习技术的出现,让AI身体控制训练从“物理世界的试错”转向“数字世界的洞察”。Genie3、V-JEPA2等世界模型的探索,证明了“看海量视频学控制”的可行性,也为AI从“认知智能”走向“具身智能”打开了一扇新的大门。目前,视频学习技术已在工业机器人、智能制造、教育培训、影视与内容创作、医疗健康、智能家居与服务机器人等行业取得显著成果,核心体现在“无交互预训练—物理规律建模—控制策略迁移”的全链路价值落地。例如在教育培训领域,其运用于实训操作教学:AI生成设备操作、实验步骤的动态视频,替代教师重复演示,代表产品有猿辅导“小猿AI”等。

从发展现状来看,我国机器人领域的视频学习技术正实现从“看会”到“做好”的关键跨越,其核心演进方向聚焦于多模态深度融合、行业垂直适配与伦理合规强化三大维度,最终目标是让AI真正达成“看视频即懂物理、懂规则即能控制”的能力跃升。具体实践中,智元具身研究中心推出的GenieReasoner二代系统堪称多模态深度融合的典范之作,该系统成功攻克VLA模型语义推理与动作控制的对齐难题,同时开源ERIQ(聚焦于真机操控全流程的具身推理评测基准),充分验证了其达到业界顶尖水平的推理能力与跨本体泛化性能,推动具身智能向逻辑深度与执行精度的全新高度迈进 ;灵犀X2机器人则深耕行业垂直适配被广泛用于替代护工的繁琐工作,如搬运病人、取药以及陪同行走等任务。灵犀X2通过情感计算以及开源特性,正在改变机器人的角色,并为未来的广泛普及奠定基础 ;思灵Diana 7 Med通过中国国家药品监督管理局(NMPA)认证与欧盟CE-MDD医疗设备指令,针对不同地区伦理规范提供差异化适配而非“一刀切” 。

边缘算力需求爆发:

实时推理与分布式计算

报告指出,未来边缘算力将呈现两大趋势。一是专用边缘芯片迎来普及浪潮,英伟达的Jetson Thor便是这一领域的典型标杆。这款面向边缘实时推理的设备,单套定价约3500美元,已成功斩获波士顿动力、亚马逊机器人等行业头部企业的青睐。它的核心竞争力,在于能够在低功耗的前提下释放强大算力,精准匹配机器人动态避障等场景对实时响应的严苛需求。二是分布式推理网络架构革新正在提速。特斯拉率先提出“机器人即算力节点”的创新构想:假设有1亿台算力达2500 TFLOPS的机器人部署全球,仅需实现50%的利用率,就能聚合形成125000 ExaFLOPS的庞大算力,这一数值相当于700万颗单算力18 PetaFLOPS 的NVIDIA B200 GPU的总和。这种分布式模式的价值不止于此,它既有效降低了对中心化数据中心的依赖,更能借助机器人之间的协同联动,实现整体运行效率的跃升。

据摩根士丹利预测,到2030年全球机器人边缘计算需求将大幅增长,人形机器人、自动驾驶汽车、无人机等各类机器人形态都将贡献显著的算力需求。预计到2050年全球将售出14亿台机器人,将推动边缘AI算力需求达到数百万个B200芯片当量。

边缘AI芯片,是一类专为处理边缘计算环境中人工智能应用海量运算任务而生的核心模块。它通常被集成于边缘设备之中,赋能设备在本地完成实时的数据处理、分析与决策,极大提升了边缘终端的智能化水平,让各类应用场景的运行更高效、更灵活、更安全。专用边缘芯片的普及,正从算力架构、行业应用、产业格局、安全合规四大维度全面重构数字生态。其核心逻辑在于以“低延迟本地决策+云边端协同+高能效算力”的三重优势,推动物理AI与自主系统走向规模化落地。

在算力架构层面,这一趋势加速了云边端协同模式的定型:云端集中发力大模型的训练与迭代优化,边缘侧则肩负起实时推理与本地决策的核心重任,终端设备专注执行低延迟指令,最终将端到端的响应时延压缩至毫秒级。

在行业应用层面,专用边缘芯片实现了深度赋能。以人形机器人领域为例,它不仅支撑起机器人的实时感知与智能决策,更有效优化了动态避障、机械臂精准抓取、多传感器数据融合等关键功能,为商业化落地扫清了技术障碍。

在产业格局层面,市场竞争呈现出鲜明的分化态势:英伟达Jetson、AMD Versal等国际巨头凭借技术优势领跑高性能边缘芯片赛道;而国产厂商则在中低端物联网与工业场景中加速推进替代进程,持续提升自主芯片IP核的适配率与市场份额。

在安全合规层面,专用边缘芯片更凸显出独特价值。依托本地数据处理的特性,敏感数据无需上云即可完成计算分析,大幅降低了数据泄露风险,完美适配《数据安全法》、欧盟《通用数据保护条例》(GDPR)等国内外合规要求,为数据隐私保护筑牢了技术防线。

目前,我国国产专用边缘芯片厂商已构建起全栈巨头引领、创新新锐竞跑的多元发展格局,产品矩阵全面覆盖车载、工业、人工智能物联网(AIoT)、安防等核心应用场景。昇腾310B作为华为推出的高性能AI加速芯片,凭借其参数优势,成为众多企业国产化方案的首选。在算力方面,昇腾910完全达到了设计规格,即:半精度(FP16)算力达到256 Tera-FLOPS ,整数精度(INT8)算力达到512 Tera-FLOPS ,重要的是,达到规格算力所需功耗仅310W,明显低于设计规格的350W。

寒武纪思元270/370等芯片凭借其高性价比和多场景运用成为创新新锐。近年来,寒武纪在智慧金融、智慧能源及智慧交通等行业与合作伙伴共同完成了诸多落地案例。例如同招商银行合作上线的思元270智能模型,凭借其高效的推理服务,得到了金融客户的认可。

打开网易新闻 查看精彩图片

寒武纪思元270芯片,面向高能效比云端AI推理(图源:寒武纪官网)

“机器人即算力节点”的构想,对AI未来的发展从多维度的角度产生了影响。具体而言,这一概念将从算力供给、技术架构、应用落地、安全治理等多维度重塑人工智能的发展路径,推动AI从中心化云端走向分布式边缘协同,加速通用人工智能与具身智能的演进。

例如算力供给层面,突破了中心化算力瓶颈,形成分布式超级算力池。同时在技术架构层面推动AI从云端集中式走向边缘分布式协同。技术架构层面加速了边缘计算与分布式推理普及,减少数据回传延迟,满足机器人动态避障、自动驾驶等实时决策需求,提升AI系统响应速度与可靠性。此外这一构想拓展了AI场景边界,加速具身智能与行业融合,从而促进应用落地对安全治理而言,数据本地化处理减少传输风险,提升隐私保护能力,但也带来节点认证、数据一致性、恶意节点攻击等新安全挑战。最后,AI产业链分工与竞争格局将被重塑,加速机器人与AI企业协同,形成“机器人制造—算力运营—AI服务”的一体化商业模式,改变传统AI产业依赖数据中心的发展路径。

结语

当前,机器人产业正迎来全方位的升级变革,发展趋势凸显出多重核心特征。一方面,机器人的应用场景正从传统工业制造向医疗健康、民生服务、特种作业等多元领域加速延伸,覆盖范围与渗透深度持续拓展;另一方面,技术范式也在发生根本性转变,从过往的指令式编程逐步转向以具身智能、视频学习为核心的知识驱动与数据驱动融合模式,实现从“看会”到“做好”的能力跃升。与此同时,随着端侧复杂任务对实时决策、自主控制的需求日益攀升,未来机器人的边缘算力将迎来显著提升,为复杂场景下的高效响应与精准执行筑牢技术根基。尤为关键的是,机器人产业的高质量发展,需在聚焦核心技术突破、运动控制持续攻坚、多模态融合等关键难题的同时,将伦理规范、安全保障与场景适配贯穿于研发、生产、应用的全流程,推动机器人技术真正实现高效、安全、合规的落地,赋能千行百业的智能化转型。

打开网易新闻 查看精彩图片

在2025中国医学装备展览会拍摄的手术机器人演示现场(图源:新华社)

本文作者

于劼芊:香港中文大学(深圳)前海国际事务研究院研究助理。


黄平:香港中文大学(深圳)公共政策学院副教授兼助理院长,前海国际事务研究院副院长。

*原创声明:本文版权归微信订阅号“大湾区评论”所有,未经允许任何单位或个人不得转载、复制或以任何其他方式使用本文部分或全部内容,侵权必究。公众号授权事宜请直接于文章下方留言,其他授权事宜请联系IIA-paper@cuhk.edu.cn。

GBA Review 新传媒

校对 | 李 征

排版 | 许梓烽

初审 | 王炳云

终审 | 冯箫凝

打开网易新闻 查看精彩图片