Google Gemini Omni发布：实拍视频变"超现实梦境"

全栈遛狗员

2026-05-20 02:23 ·北京

Google在2026年I/O大会上放了个大招。不是新手机，不是新系统，而是一个能把你的实拍视频变成"超现实梦境"的AI模型——Gemini Omni。

这玩意儿最狠的地方在于：它不满足于像Veo 3那样从零生成AI视频，而是直接对你的真实素材下手。上传一段普通视频，加几句描述，它就能把你家楼下的便利店变成赛博朋克片场，或者让你养的猫开口说人话——而且口型还对得上。

Google给它的定位是"多模态模型新类别"。首批亮相的是Omni Flash版本，官方强调它能同时吃进去四种输入：文字、音频、静态图片、视频，然后吐出任意一种格式的输出。不过现阶段主攻视频方向。

具体怎么用？流程倒不复杂。打开Gemini应用，上传你的参考素材——可以是一张图、一段音频、一段视频，或者干脆纯文字描述。想让自己出镜也行，上传数字形象做Avatar，生成的角色会模仿你的长相和声音。

Google特意提到一个技术细节：Omni懂物理。重力、动能、流体力学这些概念被写进了模型的认知里，生成的画面要符合现实世界的物理规律。这话是真是假，得等用户上手实测才知道。

目前放出的两个Demo挺有代表性。一个是喜剧演员Adam Waheed的短片，另一个是YouTuber Happy Kelli的视频。从官方展示的效果看，角色在多帧之间保持了高度一致性——这恰恰是AI视频最容易穿帮的地方。

收费策略分两层。付费用户通过Gemini应用和Flow平台完整使用；免费用户也能玩，但限定在YouTube Shorts的Remixes功能里——相当于给短视频加个AI滤镜的轻量版。

背后的产品逻辑很清晰：Veo 3已经证明了Google在纯AI生成视频上的实力，Omni则是往"人机协作"方向迈了一步。不是替代拍摄，而是把拍摄素材当成画布，让AI帮你完成后期不可能实现的视觉效果。

对内容创作者来说，这意味着什么？以前需要绿幕、动捕、特效团队才能做的画面，现在可能只需要一部手机加几句Prompt。门槛崩解的速度，比大多数人预期的更快。

当然，问题也跟着来了。当"真实视频"和"AI改造视频"的边界被彻底模糊，平台怎么标注？观众怎么分辨？Google没说，但这些问题不会自己消失。

Omni Flash已经开始向Google AI Plus等付费订阅用户推送。免费版的YouTube Shorts Remixes功能同期上线。想试试把你的生活片段变成"发烧梦"的，现在就可以动手了。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴