周三下午,四个玩家同时进入同一张地图,彼此射击、躲藏、追逐。但他们看到的画面并非来自传统游戏引擎,而是一个神经网络实时想象出来的世界。这就是Agora-1,Odyssey团队今天发布的首个多智能体世界模型。

世界模型不是什么新概念。它能生成高保真的虚拟环境,让AI在仿真中学习。但过去这些模型有个硬性限制:同一时间只能容纳一个"参与者"。无论是人类还是AI,都是独自在模型生成的世界里探索。Agora-1打破了这个天花板。

打开网易新闻 查看精彩图片

团队选择了一个出人意料的测试场景:1997年的经典射击游戏《GoldenEye》。这款在N64上诞生的作品,曾是许多团队成员的童年记忆。游戏历来是AI研究的试验场——雅达利、我的世界、星际争霸都承载过类似探索。现在轮到这款25年前的间谍题材射击游戏了。

打开网易新闻 查看精彩图片

Agora-1最多支持四名玩家同时进入同一个生成世界。系统将他们匹配到共享的死亡竞赛中,每个参与者同时与同一个世界状态交互。你扣下扳机、躲进角落、拾取武器——这些动作被模型捕获,转化为对世界状态的更新,再实时渲染成像素流推送到每个玩家的屏幕上。某种意义上,Agora-1扮演了一个"学习出来的游戏引擎"角色。

从技术路线看,这并非多智能体世界模型的首次尝试。Multiverse把多个玩家的状态拼接成"分屏"表示,将多人视为单一世界状态;Solaris则沿序列维度拼接参与者,用自回归扩散Transformer生成更稳定的共享仿真。但后者有个硬伤:玩家数量增加时,模型上下文膨胀,无法线性扩展。更麻烦的是,当玩家彼此脱离视野,这两种方案都难以维持世界一致性。

打开网易新闻 查看精彩图片

Agora-1走了另一条路:解耦仿真与渲染。它维护一个显式的共享世界状态,但用不同方式建模动态演化与视觉渲染。这种分离让模型能从多个独立视角生成同一世界的连贯画面——多人游戏、机器人训练、多视角仿真,这些场景因此成为可能。

具体而言,Agora-1学习两个独立功能:一是世界状态如何随时间演化以响应玩家行为;二是如何从任意视角渲染该状态。这种架构设计让它在扩展性和一致性之间找到了新的平衡点。