文丨晓静
编辑丨徐青阳
具身智能领域开源动作不断,各家都希望成为“机器大脑”界的安卓。
2月10日,阿里巴巴达摩院发布具身智能大脑基础模型RynnBrain,并一次性开源了包括30B MoE在内的7个全系列模型。
达摩院表示,作为业界首个MoE架构的30B具身模型,其只需要3B的推理激活参数就能超越业界的72B模型效果。
达摩院称开源的RynnBrain首次让机器人拥有了时空记忆和空间推理能力,在16项具身开源评测榜单上刷新纪录(SOTA),超越谷歌Gemini Robotics ER 1.5等行业顶尖模型。
达摩院RynnBrain开源之前,包括蚂蚁集团旗下灵波科技的LingBot-VLA、智元机器人的GO-1等基座模型先后对外宣布开源。
此次开源,达摩院特地强调了当前具身智能的两个路线“动作模型”和“大脑模型”泛化能力不足的瓶颈。
“VLA模型往往因为数据稀缺难以实现泛化,”阿里巴巴发言人表示,“大脑模型普遍缺乏记忆力,动态认知受限且普遍存在物理幻觉。”
为了克服这些问题,达摩院的RynnBrain模型引入了时空记忆和物理世界推理,
前者可让机器人在其完整的历史记忆中定位物体、目标区域,甚至预测运动轨迹,从而赋予机器人全局时空回溯能力,后者可以确保推理过程紧密扎根于物理环境,减弱了幻觉问题。
达摩院具身智能实验室负责人赵德丽表示:“RynnBrain 首次实现了大脑对物理世界的深度理解与可靠规划。”
据达摩院提供的材料,基于RynnBrain模型的时空记忆,运行RynnBrain模型的机器人,在执行A任务中被突然打断要求先做B任务,它能记住A任务的时间和空间状态,等完成B后继续工作。
阿里巴巴透露,RynnBrain在Qwen3-VL基础上训练,使用自研的RynnScale架构进行训练优化,同等资源加速两倍,训练数据超过2000万对。
结果显示,RynnBrain能力全面,性能领先,在16项具身开源评测榜单上刷新纪录(SOTA),包括环境感知与对象推理、第一人称视觉问答、空间推理、轨迹预测等,超越了谷歌Gemini Robotics ER 1.5、英伟达 Cosmos Reason 2等具身顶尖模型。
达摩院在对外的资料中强调,RynnBrain还拥有良好的可拓展性,能够快速地训练出导航、规划、动作等多种具身模型。
以具身规划模型为例,其需要强大预测能力和场景解析能力,但基于RynnBrain为基础,只需几百条数据微调,效果就能超越Gemini 3 Pro。
热门跟贴