“21世纪关键技术”关注科技未来发展趋势,研究21世纪前沿科技关键技术的需求,和影响。将不定期推荐和发布世界范围重要关键技术研究进展和未来趋势研究。
来源:21世纪关键技术
AI系统的核心挑战,从来不是生成一段流畅的文字,而是真正理解它所处的世界。当一个AI智能体需要操纵机械臂抓取物体、在网页上完成复杂任务、与数百个其他智能体协同决策,或者独立推进一项科学实验时,它所依赖的核心能力,是对环境动态的预测与建模——而非语言本身。这一认知,正驱动着AI研究的重心从语言模型向"世界模型"(world model)加速迁移。
2026年4月,一篇由来自香港科技大学、新加坡国立大学、牛津大学、南洋理工大学、香港中文大学等十所顶尖研究机构的逾四十位研究者联合完成的综述论文正式挂出预印本。这篇题为《智能体化世界建模:基础、能力、规律及展望》(Agentic World Modeling: Foundations, Capabilities, Laws, and Beyond)的报告,以综合超过400篇文献、覆盖100余个代表性系统的系统性分析,为世界模型这一正处于快速演化中的研究领域提供了迄今最为全面的统一框架。论文项目主页设于agentic-world-modeling.xyz,配套代码库已在GitHub公开,属早期预印版本,尚未经过同行评审。
"世界模型"的概念混乱与统一框架的必要性
"世界模型"(world model)这一术语在不同研究社区中承载着截然不同的含义:强化学习社区将其理解为用于规划的环境动态模型,视频生成领域将其视为逼真的像素预测器,语言智能体社区用它指代LLM对网页或操作系统状态的隐式表征,具身AI领域则将其与机器人感知和操控紧密绑定。这种碎片化的术语使用不仅造成了概念混乱,更阻碍了跨社区的知识共享与方法迁移。
这份论文的首要贡献,是提出了一套名为"能力层级×支配定律"(levels × laws)的统一分类框架,在两个维度上对世界模型进行系统性定位。
能力层级维度定义了三个递进的功能等级。L1预测器(Predictor)是最基础的层级,学习单步局部状态转移算子——给定当前状态与动作,预测下一步状态。这一层级的代表系统包括早期基于模型的强化学习方法,以及当前大量视频扩散模型在单帧预测上的应用。L2仿真器(Simulator)是当前最具实用价值的层级,它将单步预测组合为多步、动作条件化的展开轨迹,且这些轨迹必须遵守所在领域的支配定律——物理一致性、软件状态逻辑或社会规范约束。MuZero、DreamerV3、GAIA-1等广受关注的系统均属于这一层级。L3进化器(Evolver)是论文着力强调的最高层级:当预测失败、新证据与现有模型相矛盾时,L3系统能够自主修正自身的世界模型。这意味着系统不再是被动的预测器,而是主动的学习者,能够识别自身知识边界并通过实验填补空白。AI Scientist、MOOSE-Chem、OriGene等面向自主科学发现的系统代表了这一层级的最新进展。
支配定律维度将世界模型的应用领域划分为四个"管辖区间",每个区间有其独特的约束结构与失效模式。物理世界(Physical World)以牛顿力学、热力学等自然规律为约束,代表系统包括用于机器人操控的DayDreamer、用于自动驾驶的OccWorld与GAIA-1。数字世界(Digital World)以软件状态逻辑和API调用规则为约束,网页导航智能体WebDreamer、GUI操控系统UI-TARS和操作系统基准OSWorld均在此范畴。社会世界(Social World)以社会规范、他人意图和多智能体博弈为约束,从CICERO的外交游戏策略,到模拟一百万用户社交行为的OASIS,再到模拟经济运行的AIvilization,构成了一条从双人博弈到文明级仿真的完整谱系。科学世界(Scientific World)则以可证伪的科学假设与实验逻辑为约束,涵盖天气预测的GraphCast和GenCast、蛋白质结构预测的AlphaFold系列、材料发现的A-Lab,以及自主科研的AI Scientist系列。
这一2×4的分类矩阵——三个能力层级与四类支配定律的交叉——产生了十二个分析单元,为不同背景的研究者提供了共同的参照坐标。论文在图4中给出了一张2018年至2026年间70个代表性系统的时间线路线图,按层级与定律域着色,直观呈现了世界模型研究的演化轨迹。
跨域综合:四类世界的建模现状与失效边界
论文最具文献价值的部分,是对四类支配定律下世界模型现状的系统性梳理,并对每一类世界的关键失效模式做出清晰诊断。
在物理世界,机器人操控与自动驾驶是两条最成熟的应用主线。TD-MPC2展示了可扩展、鲁棒的连续控制能力;DreamerV3将端到端模型训练推进至横跨25个不同任务域的通用设置;Aether则在几何感知框架中统一了重建、动作条件预测与视觉规划。论文指出,视觉世界模型在物理一致性上的瓶颈尤为突出:标准评估指标如FVD(Fréchet视频距离)捕捉的是分布真实性,而非规划可用性——画面上物体运动流畅,不等于系统正确理解了碰撞约束或重力方向。"干预敏感性脆弱"(fragile intervention sensitivity)被认定为当前物理世界模型最普遍的失效模式:模型可以外推"如果什么都不做会发生什么",但一旦引入真实的动作干预,预测质量急剧下降。
数字世界的建模挑战在于软件环境固有的部分可观测性与异步性。论文引用数据指出,当向标准基准注入真实的异步失败场景时,所有最先进的智能体任务完成率均出现显著下降。当前没有任何代码世界模型能够维护对隐藏后端状态的信念分布——服务器会话、数据库行、后台进程——也无法推理具有可变延迟的异步状态转移。这一"部分可观测软件即POMDP"的定性,精确指出了GUI和网页智能体世界模型最亟待突破的理论边界。
社会世界的模拟成熟度被论文评价为"尚不成熟",理由有三:当前LLM在二阶信念推理之外的理论心智能力急剧衰退、多智能体场景下普遍存在的"角色漂移"(role drift)与目标遗忘、以及形式化承诺追踪机制尚未被任何LLM架构真正整合。然而,这一领域的规模扩展速度令人瞩目:OASIS实现了百万智能体的社会仿真;ProjectSid在多智能体文明仿真中观察到了劳动分工和社会专业化的自发涌现;SocioVerse则利用1000万真实用户数据校准智能体的社会行为。论文对一个基本设计模式的建议值得关注:将紧凑的社会状态表征(承诺、约束、关系)、对话生成器与状态转移更新器分离,使状态转移可记录、可回溯、可审计。
科学世界是论文中着墨最多、也最具前瞻意义的部分。L3进化器的概念在此得到了最充分的体现:从A-Lab在材料合成中实现的闭环自主实验循环,到AI Scientist系列通过多智能体辩论演化科学假设,再到OriGene自主发现治疗靶标的迭代修正机制,这些系统共同指向了一种前所未有的科研范式——AI不再是人类科学家的工具,而是能够自主识别知识空白、设计实验、解读结果并修正自身假设的科研智能体。论文援引MOOSE-Chem的实验结果:该系统能够仅凭2024年前的文献复现2024年发表于《自然》和《科学》的化学假设,这被视为L3假设生成能力已在自然科学领域具备可行性的实证信号。
评估体系的重构与治理挑战
论文的另一项重要贡献是对评估方法论的系统性批判与重构。当前世界模型的评估存在一个根本性的偏差:过度依赖感知质量指标,而忽视了决策可用性——论文称之为"决策中心评估"(decision-centric evaluation)原则的缺失。以自动驾驶为例,一个渲染出色的世界模型在视觉上看起来完全合理,却可能在碰撞预测或轨迹规划上完全失效。报告由此提出了L2层级评估的三个必要维度:长时程一致性(long-horizon coherence)、干预敏感性(intervention sensitivity)和约束一致性(constraint consistency),并建议将这三个维度作为任何世界模型评估报告的基本配置。
治理挑战是论文结语着重强调的维度。随着L3进化器在科学和社会领域的部署范围扩大,一系列尚未得到充分讨论的风险正在积聚。论文特别指出,对抗性智能体在社会仿真场景中可能系统性地污染共享状态,正如网络钓鱼攻击依赖注入可信文本一样;现有LLM倾向于温和的评估和偏向多数方的立场,在模拟有争议的社会场景时会产生系统性偏差;以及L3系统自主修正模型的能力,使其输出与人类意图之间的对齐问题比静态模型更难以验证和控制。
这份报告的意义,最终体现在它试图做的那件事:将原本各自为营的研究社区——强化学习、视频生成、语言智能体、具身AI、AI for Science——纳入统一的分析框架,使不同领域的研究者能够相互借鉴方法、共享失效经验、建立可比较的评估基准。这种跨域整合,或许比任何单一的技术突破都更难实现,也因此更具长期价值。从被动的下一步预测到能够主动重塑其所处环境的世界模型,这条路的终点,是AI系统对现实世界的真正理解——而非仅仅是对其外观的逼真复现。
阅读最新前沿科技趋势报告,请访问21世纪关键技术研究院的“未来知识库”
未来知识库是 “21世纪关键技术研究院”建 立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。
截止到2月28日 ”未来知识库”精选的百部前沿科技趋势报告
(加入未来知识库,全部资料免费阅读和下载)
热门跟贴