Google在2026年I/O大会上放了个大招。不是新手机,不是新系统,而是一个能把你的实拍视频变成"超现实梦境"的AI模型——Gemini Omni。

这玩意儿最狠的地方在于:它不满足于像Veo 3那样从零生成AI视频,而是直接对你的真实素材下手。上传一段普通视频,加几句描述,它就能把你家楼下的便利店变成赛博朋克片场,或者让你养的猫开口说人话——而且口型还对得上。

打开网易新闻 查看精彩图片

Google给它的定位是"多模态模型新类别"。首批亮相的是Omni Flash版本,官方强调它能同时吃进去四种输入:文字、音频、静态图片、视频,然后吐出任意一种格式的输出。不过现阶段主攻视频方向。

打开网易新闻 查看精彩图片

具体怎么用?流程倒不复杂。打开Gemini应用,上传你的参考素材——可以是一张图、一段音频、一段视频,或者干脆纯文字描述。想让自己出镜也行,上传数字形象做Avatar,生成的角色会模仿你的长相和声音。

Google特意提到一个技术细节:Omni懂物理。重力、动能、流体力学这些概念被写进了模型的认知里,生成的画面要符合现实世界的物理规律。这话是真是假,得等用户上手实测才知道。

目前放出的两个Demo挺有代表性。一个是喜剧演员Adam Waheed的短片,另一个是YouTuber Happy Kelli的视频。从官方展示的效果看,角色在多帧之间保持了高度一致性——这恰恰是AI视频最容易穿帮的地方。

收费策略分两层。付费用户通过Gemini应用和Flow平台完整使用;免费用户也能玩,但限定在YouTube Shorts的Remixes功能里——相当于给短视频加个AI滤镜的轻量版。

打开网易新闻 查看精彩图片

背后的产品逻辑很清晰:Veo 3已经证明了Google在纯AI生成视频上的实力,Omni则是往"人机协作"方向迈了一步。不是替代拍摄,而是把拍摄素材当成画布,让AI帮你完成后期不可能实现的视觉效果。

对内容创作者来说,这意味着什么?以前需要绿幕、动捕、特效团队才能做的画面,现在可能只需要一部手机加几句Prompt。门槛崩解的速度,比大多数人预期的更快。

当然,问题也跟着来了。当"真实视频"和"AI改造视频"的边界被彻底模糊,平台怎么标注?观众怎么分辨?Google没说,但这些问题不会自己消失。

Omni Flash已经开始向Google AI Plus等付费订阅用户推送。免费版的YouTube Shorts Remixes功能同期上线。想试试把你的生活片段变成"发烧梦"的,现在就可以动手了。