打开网易新闻 查看精彩图片

2026年5月6日,一家巴黎+加州双总部的机器人创业公司Genesis AI,从隐身模式中扔出了一颗深水炸弹——

1.05亿美元种子轮,投资方包括 Khosla Ventures、Eclipse、前 Google CEO Eric Schmidt、AI 先驱 Daniela Rus 和 Vladlen Koltun。

与此同时,他们发布了第一代产品:GENE-26.5,一个号称让机器人达到"人类水平物理操控能力"的 AI 基座模型,外加一只和真人手1:1等比的仿人机械手。

视频里,这只手单手打蛋、双手切番茄、空中玩魔方、弹钢琴、穿线束。弹幕区有人说"不敢相信这是真的",也有人说"又是 Demo 骗局"。

真相在哪?让我们剥开看。

一、操作:机器人领域的"最硬骨头"

Genesis 这篇博客最打动我的,不是那些花哨的 Demo,而是一开篇对"操作"这件事的定义——

▌ "Manipulation extends beyond simply relocating objects from point A to point B. It is the art of composing contact in space and time."

▌ (操作不是把东西从 A 搬到 B,它是在空间和时间中编排接触的艺术。)

说得好听。但为什么这件事这么难?博客里把机器人三个经典问题放在一起做了对比:

问题类型

本质

错误后果

导航

避开障碍物、找自由空间

撞墙,绕路,通常可恢复

运动/全身控制

利用接触获得支撑(站立、行走)

摔倒,可重新站起来

操作

接触本身就是任务

几毫米之差,任务直接失败

导航和运动,机器人已经搞定了。但操作这块硬骨头,折腾了几十年,问题在于:

你要预测力和形状的交互结果

现实世界充满不确定性(物体重量、摩擦力、表面材质)

每一步的误差会在长时序中不断累积

最后,可能因为几毫米的偏差,整个任务崩盘

Genesis 的判断很直接:操作是机器人学里最重要、也最未被解决的命题。谁先搞定它,谁就拿到了通用机器人的钥匙。

二、GENE-26.5 能做什么?8个 Demo,个个硬核

光说不练假把式。GENE-26.5 这次甩出了 8 个实打实的任务,全部在1× 真实时间单一共享权重模型下完成,大多数挑战技能只用了不到1小时的机器人数据(<200个 episodes)。

烹饪(4分钟,20+个子任务)
打开网易新闻 查看精彩图片
烹饪(4分钟,20+个子任务)

这个是最炸裂的。一个双臂系统,4分钟内完成切番茄、单手打蛋、双手协调翻锅、用毛巾/盐磨/打蛋器/锅铲等多种工具——全程无剪辑。最惊艳的细节:转移切好的番茄时,机器人把刀重新靠在切菜板上作为支撑,通过协调双臂完成交接。这是即兴工具使用,不是提前编排好的。

打开网易新闻 查看精彩图片

抓取移液器→插吸头→转移液体→弹掉吸头→密封试管→操作仪器按钮→放入转子。涉及毫米级精度、精细力控(比如拧上1厘米的盖子)、以及灵巧的手内重新抓取(re-grasping)。

打开网易新闻 查看精彩图片

这是博客里明确说的:据作者所知,这是通用双臂机器人系统首次能够解决魔方(无需专门设计的机械夹具)。之前能搞定魔方的只有 OpenAI 2019年的单手机器人系统。Genesis 这次是双臂+空中协调,难度不在一个量级。

打开网易新闻 查看精彩图片

长跨度+语言引导,处理刚性物体、可变形物体和液体。尤其是吸管翻转——处理极度脆弱和半透明的物品,单手中多根手指之间需要复杂同步协调。

单手四物同时抓取

单手同时抓取四个不同尺寸物体,每种物体用不同的抓取类型,然后分类放入对应容器。这把很多夹持器方案的脸打得啪啪响——夹持器只能一次抓一个,这只手一次抓四个。

打开网易新闻 查看精彩图片

处理柔软、高度可变形的线缆和胶带,双手协调完成捆扎、挂载、包裹。圈内公认这是电子电气工程里最难的操作任务之一。

打开网易新闻 查看精彩图片

演奏 Ferris Wheel 和 Rush-E——注意,是Rush-E,每分钟300+音符。这个任务的策略是单独通过仿真强化学习训练的,不是 GENE 共享权重模型。博客说得很诚实:部分是测试控制系统的能力,"顺便为了乐趣"。

3.1 硬件:弥合"具身鸿沟"
打开网易新闻 查看精彩图片
3.1 硬件:弥合"具身鸿沟"

很多机器人公司做操作,用的是两指夹持器——因为好控制。Genesis 选择了一条更难的路:仿人机械手

参数

Genesis Hand

尺寸

真正1:1匹配人手

主动自由度

20个(可反向驱动)

表面材质

覆盖软材料,模仿人类皮肤软接触动力学

▌ "Hardware is not downstream of the model; it is what makes the right data scalable."

▌ (硬件不是模型的下游,它是让正确数据能够规模化的东西。)

打开网易新闻 查看精彩图片

Genesis 的答案是:配套的触觉数据手套。基于 EMF(电磁场)手指跟踪 + 全手密集触觉感知。

手套成本比典型遥操作设备便宜100倍

数据采集效率比传统方法高5倍

3.3 控制栈:3ms延迟,10倍精度

这是技术含量最高的层。Genesis 的解法是:从底到顶全部自研

参数

规格

控制器类型

高性能阻抗控制器

端到端延迟

低至 3ms

网络架构

单个 EtherCAT Y-slave 网络运行双臂

运行频率

500 Hz

对比数据:

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

圆形跟踪基准:供应商控制器误差约 20mm,Genesis 约2mm差了10倍)。

单关节正弦跟踪延迟:供应商约 80ms,Genesis 调优后约3ms差了约27倍)。

3.4 模型架构:流匹配 + 统一多模态

GENE-26.5 是一个机器人原生基础模型,用流匹配(flow matching)对轨迹上的联合分布建模。其设计目标包括:

异构数据联合训练:模型自动消化视觉、触觉、控制信号及互联网数据。

统一模型解决所有任务:状态估计、目标推理、渲染等全部集成。

吸收预训练先验:结合 VLM 的语义表示与世界模型的物理动力学。

四、数据规模:20万小时是什么概念?

▌ "In collaboration with partners, we have collected over200,000 hoursof data across these modalities."

20万小时意味着数亿帧的物理交互。由于这些数据是通过手套在真实场景中自然收集的,数据瓶颈将被彻底打破。

五、仿真:加速迭代的终极引擎

▌ "You can only improve what you can measure."

自研的Genesis World仿真平台实现了:

零仿真数据下的闭环评估。

每个评估点代表200个设置150小时执行时间。

效率提升:仿真评估仅需极短时间,而真实世界同等评估需2,700人机小时

六、业界怎么看?

Eric Schmidt(投资人):"Genesis 正在引入机器人领域的范式转变。"

Vinod Khosla(领投人):"有望实现商业客户的即时部署。"

Théophile Gervet(合伙人):"通过控制每一层(硬件到模型),我们才能整体性地解决问题。"

七、竞争格局:谁在做人形机器人?

公司

现状

策略差异

Figure

每小时1台量产

商业化最快

1X Technologies

目标10万台规模

垂直整合工厂,规模优先

Sunday Robotics

手套数据策略

和 Genesis 思路接近

Genesis AI

全栈+手套+仿人手

硬件自由度极高,软硬自研

机器人能否走进一个陌生的环境立即开始工作?这是 Figure、1X 等所有公司的终极考验。Genesis即将发布首款通用全身机器人,这将是真正的答案所在。

九、给读者的话

Genesis CEO 周贤的一句话值得玩味:

▌ "有史以来第一次,我们让机器人做到了只有人手才能做到的事情,而且可以可靠地、大规模地完成。"

注意两个词:可靠 + 大规模。Demo 里的精妙能否在现实中复现?2026年,注定是机器人操作元年。

● GENE-26.5 官方博客原文

● TechCrunch 报道:Genesis AI Goes Full Stack

● The Robot Report:Genesis AI Introduces GENE-26.5

● Humanoids Daily:Genesis AI Full-Stack Play for Human-Level Grail

● PR Newswire:Genesis AI GENE-26.5 发布公告

Mbot具身智能实验室

让尖端科技触手可及,人人皆可探索未来

打开网易新闻 查看精彩图片

Mbot基础交流群等你加入,下方扫码联系

具身-杰西

Mbot具身-小助手

Mbot-视频号

Mbot-公众号