【亿邦原创】4月16日,阿里巴巴和腾讯分别发布了各自的世界模型产品。阿里ATH事业群推出的是开放式世界模型“Happy Oyster”,腾讯混元团队发布了3D世界模型“HY-World 2.0”。

Happy Oyster侧重交互式内容创作平台,用户可以在生成过程中持续输入指令,画面实时响应,瞄准影视制作、游戏开发等创意产业的效率提升。

HY-World 2.0更像3D资产工厂,生成的不是视频,而是可编辑、可导入游戏引擎的真实3D资产,直接服务于游戏开发和具身智能仿真训练。

一个走闭源产品路线,一个走开源生态路线。虽然方向不同,但都是想让AI更好地理解和生成物理世界,至于哪条路更走得通,还得开发者来投票。

1、“Happy”宇宙再下一城

4月16日,阿里巴巴ATH事业群正式推出开放式世界模型产品“Happy Oyster”(快乐牡蛎),主打实时世界创建与交互。这是继视频生成模型HappyHorse(快乐马)之后,ATH推出的第二款产品,从“生成视频”进一步延伸至“交互式世界模型”。

与Sora、Gen-3等传统AI视频工具“写prompt→等渲染→收到成片”的一次性线性流程不同,Happy Oyster在生成过程中可持续接收用户指令,画面实时响应、持续演绎。这让使Happy Oyster更接近一个实时渲染引擎,而不仅仅是后期剪辑师。

产品提供两种深度交互模式:导演模式支持最长3分钟、最高720p的视频生成,创作者可在生成过程中随时切换机位、指挥角色行动,甚至改变剧情走向;漫游模式支持1分钟的实时生成,允许用户以第一人称视角在生成的3D环境中自由移动,支持键盘控制与摄像头实时驱动,实现“所言即所见,所行即所得”。

Happy Oyster基于原生多模态架构,底层是一个支持音视频联合生成的流式生成世界模型,依托阿里强大的多模态训练,Happy Oyster对物理规律(如重力、碰撞、光影变化)有更深层的模拟,生成的3D动态环境在视角转换时能保持极高的稳定性。

2、腾讯混元开源3D世界模型

同一天,腾讯混元团队正式发布并开源混元3D世界模型2.0(HY-World 2.0),支持文字、图片、视频等多种模态输入,能够自动生成、重建和模拟包含人、物、景的完整3D世界,并支持多格式3D资产(Mesh/3DGS/点云等)导出,可与Unity、UE等主流游戏引擎工作流无缝对接。

HY-World 2.0的核心升级,是把能力从“生成单个物体”扩展到了“生成完整世界”,可以直接生成可二次编辑的3D资产文件,并导入到游戏制作或具身仿真引擎,降低了游戏地图的创作门槛。官方称,在开源方案中,HY-World 2.0是首个达到SOTA水平的3D世界模型。

HY-World 2.0延续了腾讯混元的一贯策略,发布即开源。模型权重和代码已在GitHub与Hugging Face同步开源。

2026年以来,阿里ATH事业群已连续推出视频生成模型HappyHorse、AI开发工具Meoo、开放世界模型Happy Oyster等多款产品,节奏密集;腾讯混元也在3D世界模型赛道上持续深耕,从1.0到2.0迭代迅速。

两家几乎同时出手,既标志着世界模型赛道从概念验证进入产品落地阶段,也意味着大模型竞争的焦点正在从语言模型、视频生成,向更复杂的物理世界建模和实时交互方向延伸。