新京报贝壳财经讯 1月30日,蚂蚁灵波科技宣布开源具身世界模型 LingBot-VA。LingBot-VA 首次提出自回归视频-动作世界建模框架,将大规模视频生成模型与机器人控制深度融合,模型在生成“下一步世界状态”的同时,直接推演并输出对应的动作序列,使机器人能够像人一样“边推演、边行动”。

值得注意的是,这已经是蚂蚁继空间感知模型、具身大模型与世界模型“三连发”后,连续第四日发布模型,结合此前三日的模型类别, 可以看出蚂蚁正在探索“世界模型赋能具身操作”的新路径。

编辑 罗亦丹

校对 陈荻雁