这不是一个让机器人看起来更聪明的演示,而是一次让机器人真正能用的工程突破。
2026年4月2日,美国AI机器人公司Generalist AI正式发布了GEN-1具身基础模型。官方数据显示,在此前最优模型成功率仅为64%的简单物理操作任务上,GEN-1将成功率提升至99%,完成任务的速度大约是当前最先进模型的三倍。
Generalist AI成立于2024年,创始人皮特·弗洛伦斯(Pete Florence)此前是谷歌DeepMind的高级研究科学家,主导开发了PaLM-E和RT-2等具身智能领域的标志性模型。这一次,他带领团队在500万小时交互数据的基础上,交出了GEN-1这张成绩单。
速度与成功率,只是表面
GEN-1的测试数字让人印象深刻:完成箱体组装仅需12.1秒,而此前最优模型需要约34秒;手机入壳封装任务耗时15.5秒,速度是前代的2.8倍。但如果只把这些数字当成性能指标来读,就错过了这个模型真正重要的地方。
具身智能长期以来有一道难以绕过的成本墙。要让机器人学会一项操作任务,传统方案通常需要大量的"遥操作数据",也就是让人类远程控制机器人反复演示,由此生成的高质量训练数据代价高昂,每小时采集成本动辄数千美元。这道墙决定了机器人AI很难快速扩展到新任务、新机器人本体和新应用场景,因为每一次扩展都要重新付出巨大的数据采集成本。
GEN-1选择了一条不同的路。其预训练阶段使用的数据,主要来自通过低成本可穿戴设备采集的人类日常活动数据,而非依赖昂贵的机器人遥操作数据。这使模型在接触真实机器人之前,已经通过海量的人类行为数据建立起对物理世界的底层理解,包括手如何抓握、物体如何移动、力如何施加。当这个基础打扎实之后,迁移到具体机器人任务上所需的专项数据量,就大幅下降了。
Generalist称,在部分测试中,GEN-1仅用约GEN-0十分之一的专项训练数据,便可达到与前代模型相近的性能水平。此次对外展示的每项任务结果,每项仅使用了约1小时的机器人数据完成适配。
如果这个数字能在更广泛的任务场景中稳定复现,意味着机器人AI部署成本的下降不只是线性的,而是结构性的。
从实验室到工厂,这一步有多远
GEN-1的发布,落在一个具身智能正在密集升温的时间节点上。
过去两年,全球主要AI公司都在加注这个赛道。谷歌DeepMind的RT-X系列、Physical Intelligence(π)的π0模型,以及Figure、1X等人形机器人公司各自研发的控制系统,正在从不同技术路线逼近同一个目标:让机器人在非结构化的真实环境中稳定工作。
Generalist AI的独特之处,在于它从一开始就把"缩放定律"(Scaling Law)作为核心方法论。2025年11月发布的GEN-0是这个方向上的第一次验证,证明了具身智能领域同样存在类似大语言模型的规模效应,即随着数据和算力的增加,模型能力出现系统性提升。GEN-1则是在GEN-0基础上,通过叠加预训练扩展、强化学习、多模态人类引导和推理阶段优化,完成了从"能用"到"接近掌握"的跨越。
弗洛伦斯在官方博客中使用了"mastery"(掌握)这个词。这不是随意的修辞,它在技术上对应的是:在特定任务上实现足够高的成功率和足够快的执行速度,以至于可以被纳入真实工业流程,而不只是作为演示存在。
99%的成功率是一道实质性门槛。工业场景对可靠性的要求极高,低于这个数字的系统,在大多数生产线上都意味着太高的残次品率和维护成本,很难真正部署。过去的端到端机器人模型面对这道门槛时屡屡折戟,成本高、可靠性低、泛化能力差,是阻碍商业化落地的三把锁。
GEN-1给出的答案是:用人类数据替代昂贵的遥操作数据来降低成本,用缩放定律驱动的预训练来提升泛化能力,用强化学习在执行层面压缩失败率。三把锁是否同时打开,还需要更广泛的实际部署来检验。
Generalist自己也没有回避局限性。公司坦承,GEN-1目前仅在部分精细操作任务上实现了99%以上的成功率,并非所有测试任务都能达标,部分复杂操作场景仍需进一步提升。下一代模型的目标,是在更高复杂度任务上复现这次的突破,同时继续压低单任务所需的数据量。
对整个具身智能行业而言,GEN-1的发布提出了一个值得认真对待的问题:当训练数据门槛足够低、成功率足够高,机器人AI的商业化拐点,是否真的近了?
热门跟贴