今天,阿里巴巴 ATH 事业群推出了开放式世界模型产品 Happy Oyster(快乐牡蛎)。

打开网易新闻 查看精彩图片

与此前在排行榜霸榜、主打高品质视频生成的“Happy Horse”不同,Happy Oyster 的定位是“实时世界引擎”。

四百年前,莎士比亚曾写下:"The world is your oyster." 世界是你的牡蛎,等你亲手打开。

“Happy Oyster”名字应起源于此。

世界模型的产品设定也很搭:说一句话,就能拥有一个以创造(Create)、漫游(Wander)、导演(Direct)、分享(Share)四大核心能力为支点的AI世界,你可以像导演一样掌控剧情与事件,也可以像旅人一样在无边想象中沉浸体验。

Happy Oyster 基于原生多模态架构,其底层是一个支持音视频联合生成的流式生成世界模型。

在过去,类似 Sora 或 Gen-3 的工具更像是“后期剪辑师”,你输入指令,它渲染出一段固定的短片。

而 Happy Oyster 的逻辑更接近于“实时渲染引擎”,它不再是单次交付,而是在生成过程中持续接收指令,让场景随你的意志实时演化。

从目前放出的作品 Demo 来看,堪称惊艳。

目前 Happy Oyster 主要提供两种深度交互模式,以满足不同创作需求:

一个是导演模式(Director Mode):支持最长 3 分钟的视频生成,最高分辨率为 720p。

创作者可以在生成过程中随时切换机位、指挥角色行动,甚至改变剧情走向。

一个是漫游模式(Roam Mode):支持 1 分钟的实时生成,分辨率为 480p。这一模式允许用户以第一人称视角在生成的 3D 环境中自由移动,支持键盘控制与摄像头实时驱动,真正实现“所言即所见,所行即所得”。

根据目前披露的产品细节,Happy Oyster 最大的特点在于,低延迟的交互反馈。

相比于传统世界模型长达数分钟的渲染等待,它具有以下代际优势:

1. 流式反馈:它打破了“Prompt-渲染-成品”的线性流。在生成过程中,你可以通过文字、语音或图片动态干预,世界会立即做出反应。

2. 物理逻辑一致性:依托阿里强大的多模态训练,Happy Oyster 对物理规律(如重力、碰撞、光影变化)有更深层的模拟,生成的 3D 动态环境在视角转换时能保持极高的稳定性。

3. 音画同步生:它是行业内少有的原生支持音视频联合生成的模型,环境音效会随场景变化自动匹配,无需二次配音。

打开网易新闻 查看精彩图片

目前 Happy Oyster 已正式开启内测,可以通过官网 happyoyster.cn 加入候补名单。

从“Happy Horse”到“Happy Oyster”,阿里看起来正通过一套完整的 AI 内容生态链打造其“happy 宇宙”。

下一个“happy”产品会是什么?