争夺“机器人大脑界”的安卓，达摩院开源具身基座模型

呼呼历史论

2026-02-11 00:49 ·辽宁

文丨晓静

编辑丨徐青阳

具身智能领域开源动作不断，各家都希望成为“机器大脑”界的安卓。

2月10日，阿里巴巴达摩院发布具身智能大脑基础模型RynnBrain，并一次性开源了包括30B MoE在内的7个全系列模型。

达摩院表示，作为业界首个MoE架构的30B具身模型，其只需要3B的推理激活参数就能超越业界的72B模型效果。

达摩院称开源的RynnBrain首次让机器人拥有了时空记忆和空间推理能力，在16项具身开源评测榜单上刷新纪录（SOTA），超越谷歌Gemini Robotics ER 1.5等行业顶尖模型。

达摩院RynnBrain开源之前，包括蚂蚁集团旗下灵波科技的LingBot-VLA、智元机器人的GO-1等基座模型先后对外宣布开源。

此次开源，达摩院特地强调了当前具身智能的两个路线“动作模型”和“大脑模型”泛化能力不足的瓶颈。

基于RynnBrain的定位、任务规划和执行演示（图片有多倍速）

“VLA模型往往因为数据稀缺难以实现泛化，”阿里巴巴发言人表示，“大脑模型普遍缺乏记忆力，动态认知受限且普遍存在物理幻觉。”

为了克服这些问题，达摩院的RynnBrain模型引入了时空记忆和物理世界推理，

前者可让机器人在其完整的历史记忆中定位物体、目标区域，甚至预测运动轨迹，从而赋予机器人全局时空回溯能力，后者可以确保推理过程紧密扎根于物理环境，减弱了幻觉问题。

基于RynnBrain模型的导航任务演示（图片有多倍速）

达摩院具身智能实验室负责人赵德丽表示：“RynnBrain 首次实现了大脑对物理世界的深度理解与可靠规划。”

据达摩院提供的材料，基于RynnBrain模型的时空记忆，运行RynnBrain模型的机器人，在执行A任务中被突然打断要求先做B任务，它能记住A任务的时间和空间状态，等完成B后继续工作。

RynnBrain具有认知、定位、推理、规划等多重能力

阿里巴巴透露，RynnBrain在Qwen3-VL基础上训练，使用自研的RynnScale架构进行训练优化，同等资源加速两倍，训练数据超过2000万对。

结果显示，RynnBrain能力全面，性能领先，在16项具身开源评测榜单上刷新纪录（SOTA），包括环境感知与对象推理、第一人称视觉问答、空间推理、轨迹预测等，超越了谷歌Gemini Robotics ER 1.5、英伟达 Cosmos Reason 2等具身顶尖模型。

RynnBrain在16项具身评测上实现SOTA

达摩院在对外的资料中强调，RynnBrain还拥有良好的可拓展性，能够快速地训练出导航、规划、动作等多种具身模型。

以具身规划模型为例，其需要强大预测能力和场景解析能力，但基于RynnBrain为基础，只需几百条数据微调，效果就能超越Gemini 3 Pro。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴