智元斩获WorldArena世界模型总分冠军。我仔细看了技术报告,发现GE-Sim 2.0这次赢在功能全面。 长时序生成、多视角生成、本体状态生成、近实时推理、奖励判别——这些核心环节全部补齐,真正形成了世界模拟器的完整技术闭环。尤其长时序推演能力很亮眼:连续生成40到50秒的视频片段时,画面质量衰减非常慢,甚至比很多行业基线方案前10秒的表现还要好。 另外,智元团队做了大量闭环评测,证明模型在多项任务上与真实世界保持强相关性。他们不是只看宏观成功率,而是一案一案地对比rollout结果,还用混淆矩阵给出了量化证据。 这种严谨程度说明,GE-Sim 2.0作为策略评测器是相当可靠的。
逍遥扒扒影:智元斩获WorldArena
热门跟贴