2026年5月6日,一家巴黎+加州双总部的机器人创业公司Genesis AI,从隐身模式中扔出了一颗深水炸弹——
1.05亿美元种子轮,投资方包括 Khosla Ventures、Eclipse、前 Google CEO Eric Schmidt、AI 先驱 Daniela Rus 和 Vladlen Koltun。
与此同时,他们发布了第一代产品:GENE-26.5,一个号称让机器人达到"人类水平物理操控能力"的 AI 基座模型,外加一只和真人手1:1等比的仿人机械手。
视频里,这只手单手打蛋、双手切番茄、空中玩魔方、弹钢琴、穿线束。弹幕区有人说"不敢相信这是真的",也有人说"又是 Demo 骗局"。
真相在哪?让我们剥开看。
一、操作:机器人领域的"最硬骨头"
Genesis 这篇博客最打动我的,不是那些花哨的 Demo,而是一开篇对"操作"这件事的定义——
▌ "Manipulation extends beyond simply relocating objects from point A to point B. It is the art of composing contact in space and time."
▌ (操作不是把东西从 A 搬到 B,它是在空间和时间中编排接触的艺术。)
说得好听。但为什么这件事这么难?博客里把机器人三个经典问题放在一起做了对比:
问题类型
本质
错误后果
导航
避开障碍物、找自由空间
撞墙,绕路,通常可恢复
运动/全身控制
利用接触获得支撑(站立、行走)
摔倒,可重新站起来
操作
接触本身就是任务
几毫米之差,任务直接失败
导航和运动,机器人已经搞定了。但操作这块硬骨头,折腾了几十年,问题在于:
你要预测力和形状的交互结果
现实世界充满不确定性(物体重量、摩擦力、表面材质)
每一步的误差会在长时序中不断累积
最后,可能因为几毫米的偏差,整个任务崩盘
Genesis 的判断很直接:操作是机器人学里最重要、也最未被解决的命题。谁先搞定它,谁就拿到了通用机器人的钥匙。
二、GENE-26.5 能做什么?8个 Demo,个个硬核
光说不练假把式。GENE-26.5 这次甩出了 8 个实打实的任务,全部在1× 真实时间、单一共享权重模型下完成,大多数挑战技能只用了不到1小时的机器人数据(<200个 episodes)。
这个是最炸裂的。一个双臂系统,4分钟内完成切番茄、单手打蛋、双手协调翻锅、用毛巾/盐磨/打蛋器/锅铲等多种工具——全程无剪辑。最惊艳的细节:转移切好的番茄时,机器人把刀重新靠在切菜板上作为支撑,通过协调双臂完成交接。这是即兴工具使用,不是提前编排好的。
抓取移液器→插吸头→转移液体→弹掉吸头→密封试管→操作仪器按钮→放入转子。涉及毫米级精度、精细力控(比如拧上1厘米的盖子)、以及灵巧的手内重新抓取(re-grasping)。
这是博客里明确说的:据作者所知,这是通用双臂机器人系统首次能够解决魔方(无需专门设计的机械夹具)。之前能搞定魔方的只有 OpenAI 2019年的单手机器人系统。Genesis 这次是双臂+空中协调,难度不在一个量级。
长跨度+语言引导,处理刚性物体、可变形物体和液体。尤其是吸管翻转——处理极度脆弱和半透明的物品,单手中多根手指之间需要复杂同步协调。
单手四物同时抓取
单手同时抓取四个不同尺寸物体,每种物体用不同的抓取类型,然后分类放入对应容器。这把很多夹持器方案的脸打得啪啪响——夹持器只能一次抓一个,这只手一次抓四个。
处理柔软、高度可变形的线缆和胶带,双手协调完成捆扎、挂载、包裹。圈内公认这是电子电气工程里最难的操作任务之一。
演奏 Ferris Wheel 和 Rush-E——注意,是Rush-E,每分钟300+音符。这个任务的策略是单独通过仿真强化学习训练的,不是 GENE 共享权重模型。博客说得很诚实:部分是测试控制系统的能力,"顺便为了乐趣"。
很多机器人公司做操作,用的是两指夹持器——因为好控制。Genesis 选择了一条更难的路:仿人机械手。
参数
Genesis Hand
尺寸
真正1:1匹配人手
主动自由度
20个(可反向驱动)
表面材质
覆盖软材料,模仿人类皮肤软接触动力学
▌ "Hardware is not downstream of the model; it is what makes the right data scalable."
▌ (硬件不是模型的下游,它是让正确数据能够规模化的东西。)
Genesis 的答案是:配套的触觉数据手套。基于 EMF(电磁场)手指跟踪 + 全手密集触觉感知。
手套成本比典型遥操作设备便宜100倍
数据采集效率比传统方法高5倍
3.3 控制栈:3ms延迟,10倍精度
这是技术含量最高的层。Genesis 的解法是:从底到顶全部自研。
参数
规格
控制器类型
高性能阻抗控制器
端到端延迟
低至 3ms
网络架构
单个 EtherCAT Y-slave 网络运行双臂
运行频率
500 Hz
对比数据:
圆形跟踪基准:供应商控制器误差约 20mm,Genesis 约2mm(差了10倍)。
单关节正弦跟踪延迟:供应商约 80ms,Genesis 调优后约3ms(差了约27倍)。
3.4 模型架构:流匹配 + 统一多模态
GENE-26.5 是一个机器人原生基础模型,用流匹配(flow matching)对轨迹上的联合分布建模。其设计目标包括:
异构数据联合训练:模型自动消化视觉、触觉、控制信号及互联网数据。
统一模型解决所有任务:状态估计、目标推理、渲染等全部集成。
吸收预训练先验:结合 VLM 的语义表示与世界模型的物理动力学。
四、数据规模:20万小时是什么概念?
▌ "In collaboration with partners, we have collected over200,000 hoursof data across these modalities."
20万小时意味着数亿帧的物理交互。由于这些数据是通过手套在真实场景中自然收集的,数据瓶颈将被彻底打破。
五、仿真:加速迭代的终极引擎
▌ "You can only improve what you can measure."
自研的Genesis World仿真平台实现了:
零仿真数据下的闭环评估。
每个评估点代表200个设置和150小时执行时间。
效率提升:仿真评估仅需极短时间,而真实世界同等评估需2,700人机小时。
六、业界怎么看?
Eric Schmidt(投资人):"Genesis 正在引入机器人领域的范式转变。"
Vinod Khosla(领投人):"有望实现商业客户的即时部署。"
Théophile Gervet(合伙人):"通过控制每一层(硬件到模型),我们才能整体性地解决问题。"
七、竞争格局:谁在做人形机器人?
公司
现状
策略差异
Figure
每小时1台量产
商业化最快
1X Technologies
目标10万台规模
垂直整合工厂,规模优先
Sunday Robotics
手套数据策略
和 Genesis 思路接近
Genesis AI
全栈+手套+仿人手
硬件自由度极高,软硬自研
机器人能否走进一个陌生的环境立即开始工作?这是 Figure、1X 等所有公司的终极考验。Genesis即将发布首款通用全身机器人,这将是真正的答案所在。
九、给读者的话
Genesis CEO 周贤的一句话值得玩味:
▌ "有史以来第一次,我们让机器人做到了只有人手才能做到的事情,而且可以可靠地、大规模地完成。"
注意两个词:可靠 + 大规模。Demo 里的精妙能否在现实中复现?2026年,注定是机器人操作元年。
● GENE-26.5 官方博客原文
● TechCrunch 报道:Genesis AI Goes Full Stack
● The Robot Report:Genesis AI Introduces GENE-26.5
● Humanoids Daily:Genesis AI Full-Stack Play for Human-Level Grail
● PR Newswire:Genesis AI GENE-26.5 发布公告
Mbot具身智能实验室
让尖端科技触手可及,人人皆可探索未来
Mbot基础交流群等你加入,下方扫码联系
具身-杰西
Mbot具身-小助手
Mbot-视频号
Mbot-公众号
热门跟贴