机器人成功率从64%跳到99%，美国公司用更少数据重写具身智能规则|可靠性|智能规则|机器人|真实世界|速度|预训练

这不是一个让机器人看起来更聪明的演示，而是一次让机器人真正能用的工程突破。

2026年4月2日，美国AI机器人公司Generalist AI正式发布了GEN-1具身基础模型。官方数据显示，在此前最优模型成功率仅为64%的简单物理操作任务上，GEN-1将成功率提升至99%，完成任务的速度大约是当前最先进模型的三倍。

Generalist AI成立于2024年，创始人皮特·弗洛伦斯（Pete Florence）此前是谷歌DeepMind的高级研究科学家，主导开发了PaLM-E和RT-2等具身智能领域的标志性模型。这一次，他带领团队在500万小时交互数据的基础上，交出了GEN-1这张成绩单。

速度与成功率，只是表面

GEN-1的测试数字让人印象深刻：完成箱体组装仅需12.1秒，而此前最优模型需要约34秒；手机入壳封装任务耗时15.5秒，速度是前代的2.8倍。但如果只把这些数字当成性能指标来读，就错过了这个模型真正重要的地方。

具身智能长期以来有一道难以绕过的成本墙。要让机器人学会一项操作任务，传统方案通常需要大量的"遥操作数据"，也就是让人类远程控制机器人反复演示，由此生成的高质量训练数据代价高昂，每小时采集成本动辄数千美元。这道墙决定了机器人AI很难快速扩展到新任务、新机器人本体和新应用场景，因为每一次扩展都要重新付出巨大的数据采集成本。

GEN-1选择了一条不同的路。其预训练阶段使用的数据，主要来自通过低成本可穿戴设备采集的人类日常活动数据，而非依赖昂贵的机器人遥操作数据。这使模型在接触真实机器人之前，已经通过海量的人类行为数据建立起对物理世界的底层理解，包括手如何抓握、物体如何移动、力如何施加。当这个基础打扎实之后，迁移到具体机器人任务上所需的专项数据量，就大幅下降了。

Generalist称，在部分测试中，GEN-1仅用约GEN-0十分之一的专项训练数据，便可达到与前代模型相近的性能水平。此次对外展示的每项任务结果，每项仅使用了约1小时的机器人数据完成适配。

如果这个数字能在更广泛的任务场景中稳定复现，意味着机器人AI部署成本的下降不只是线性的，而是结构性的。

从实验室到工厂，这一步有多远

GEN-1的发布，落在一个具身智能正在密集升温的时间节点上。

过去两年，全球主要AI公司都在加注这个赛道。谷歌DeepMind的RT-X系列、Physical Intelligence（π）的π0模型，以及Figure、1X等人形机器人公司各自研发的控制系统，正在从不同技术路线逼近同一个目标：让机器人在非结构化的真实环境中稳定工作。

Generalist AI的独特之处，在于它从一开始就把"缩放定律"（Scaling Law）作为核心方法论。2025年11月发布的GEN-0是这个方向上的第一次验证，证明了具身智能领域同样存在类似大语言模型的规模效应，即随着数据和算力的增加，模型能力出现系统性提升。GEN-1则是在GEN-0基础上，通过叠加预训练扩展、强化学习、多模态人类引导和推理阶段优化，完成了从"能用"到"接近掌握"的跨越。

弗洛伦斯在官方博客中使用了"mastery"（掌握）这个词。这不是随意的修辞，它在技术上对应的是：在特定任务上实现足够高的成功率和足够快的执行速度，以至于可以被纳入真实工业流程，而不只是作为演示存在。

99%的成功率是一道实质性门槛。工业场景对可靠性的要求极高，低于这个数字的系统，在大多数生产线上都意味着太高的残次品率和维护成本，很难真正部署。过去的端到端机器人模型面对这道门槛时屡屡折戟，成本高、可靠性低、泛化能力差，是阻碍商业化落地的三把锁。

GEN-1给出的答案是：用人类数据替代昂贵的遥操作数据来降低成本，用缩放定律驱动的预训练来提升泛化能力，用强化学习在执行层面压缩失败率。三把锁是否同时打开，还需要更广泛的实际部署来检验。

Generalist自己也没有回避局限性。公司坦承，GEN-1目前仅在部分精细操作任务上实现了99%以上的成功率，并非所有测试任务都能达标，部分复杂操作场景仍需进一步提升。下一代模型的目标，是在更高复杂度任务上复现这次的突破，同时继续压低单任务所需的数据量。

对整个具身智能行业而言，GEN-1的发布提出了一个值得认真对待的问题：当训练数据门槛足够低、成功率足够高，机器人AI的商业化拐点，是否真的近了？