还记得用AI生成一张图片时的惊奇吗?那个时代已经翻篇了。
现在,任何一个普通人,都能用几句话生成一段堪比电影片段的短视频。
就在两周前,OpenAI的Sora 2席卷全球互联网,将此前只属于技术极客的视频制作能力,毫无保留地交到了每个普通用户手中。
十月十六号,谷歌DeepMind也宣布推出Veo 3.1,这是谷歌生成视频模型的最新版本。
两大AI巨头的接连出牌,标志着AI视频生成技术正式步入高速发展期。
AI不再只是创建内容的工具,它本身也在成为社交网络的主角。
01 AI视频成为普通人创作新风口
AI视频这个领域,正在变成了普通人也能实现创作的新风口。
而这一切,最关键的变化来自于Sora 2的 “Cameo”(客串)功能,它彻底改变了创作规则。
用户只需事先拍摄一段简短的一次性视频和音频,就可以将自己的形象或任何人物、动物或物体的逼真虚拟形象添加到生成的视频片段中。
Open AI首席执行官山姆·奥特曼也因此火出圈。
“奥特曼在吉卜力工作室窃取宫崎骏作品”
很难想象这些视频都是由Sora2生成,如果没有附带AI标签的话,完全可以以假乱真了。
而这项技术也正在催生一股全新的创作浪潮。越来越多普通用户开始用AI视频制作过去只有专业团队才能完成的创意内容。
有人让自己和已逝的亲人“同框”出现在家庭聚会中,有人把自家宠物变成电影主角,还有人用AI还原了童年在老街巷玩耍的场景。
当技术门槛被彻底踏平,创意就成了唯一的通行证。
现在,任何一个有手机、有想法的人,都能在几分钟内制作出过去需要专业团队和昂贵设备才能完成的视频内容。短视频创作这个风口,已经不再属于技术极客,而是属于每一个想要讲述自己故事的普通人。
02 Veo3.1能否硬刚Sora2
眼看着Sora 2生成的视频在网络上疯狂刷屏,谷歌终于坐不住了。这次推出的Veo 3.1,怎么看都带着一股浓浓的“踢馆”意味。
那么,谷歌这次“秀肌肉”,秀得怎么样?
客观地说,这次Veo 3.1确实有点东西。
一是功能层面的完善。视频编辑功能得到了强化,用户现在可以对片段进行更细致的调整,对最终画面有了更精准的掌控。
有人用 “威尔史密斯吃面条” 这个被当做 AI 视频图灵测试的关键词,让 Veo 3.1 生成视频,对比之前Runway的作品,可以看出这次的威尔史密斯把面条吃得格外香。
Runway生成
Veo3.1生成
二是编辑功能上,谷歌也玩出了新花样。通过参考图像指导角色生成、用首尾两帧填充中间内容、基于视频末尾继续延展等操作,Veo 3.1都可以做。
延展功能可以生成一分钟的内容,基于前一段继续生成,来保持故事的连贯性。
然而,当大家兴冲冲地拿Veo 3.1和Sora 2进行对比后,气氛就变得有点微妙了。
Veo3.1之前一直被传,会比Sora2更强,是因为传出有原生分镜能力,并且能生成30s到1分钟的视频,所以大家一直觉得非常的期待。
结果最后放出来的版本,是跟Veo3一样,只能生成8s,可以靠延长视频撑到30s
此外在“脑洞大开”的创造力上,Sora 2也依然是神。
Sora是可以自己给出很棒的分镜的,简单给个prompt,它就能给你生成还不错的小故事,但是Veo3.1还是需要你把Prompt写的比较精确才行...
谷歌Veo 3.1是一次强有力的回应,证明了谷歌在这个赛道拥有顶级的实力。
但想就此扳倒Sora 2的王座?抱歉,谷歌还不行。
03 Sora2的新赛道
在文生视频的战场上,Sora 2已经稳稳坐上了第一把交椅,没人会反对。
但OpenAI的野心远不止于此。
它又开辟了一个新战场,直接推出了独立社交应用Sora by OpenAI,把AI生成视频这把火,从工具领域烧向了整个社交网络。
Sora打造了一个纯粹的AI生成内容生态。不允许上传手机相册或其他应用中的现有视频或照片,所有内容必须由AI生成。
APP上架仅4天就冲至美国App Store总榜第一,前7日在iOS平台的下载量就达到约62.7万次。登顶了美国iOS免费应用软件的榜首,势头甚至压过了自家的ChatGPT以及谷歌的Gemini 。
Sora的免费不是真的免费。
当你想免费使用sora,需要输入邀请码才能使用,因此买卖邀请码也变成了一个新市场,一个邀请码甚至被炒到几十到上百美元。
这种略带稀缺性的方式,保证了用户群的画像一致性,更极大地拉升传播热度 。
但这也意味着压力已经实实在在地给到了抖音和快手等传统短视频平台。它构建了一个完全原生于AI的内容生态,从“生成”到“分发”再到“互动”,形成了一个闭环。动摇了传统平台依赖真人拍摄创作的根本。
Sora 2的这步棋,无疑已经将战火引燃了短视频巨头们的家门口。
04 压力给到国内大厂
对于世界而言,Sora 是打开创新海洋的又一把钥匙。
但对于抖音、快手这类以视频为核心的社交平台来说,Sora 将会成为它们的最大竞争对手。
这种零成本、高创意的内容生产模式,不可避免将会分流传统短视频的创作市场。
早在 2023 年,字节跳动创始人张一鸣便在一封公开信中指出,字节跳动不能错过 AGI:“AGI 能够解决字节跳动在第二曲线增长上的困境。”
而在一代Sora问世前,字节跳动宣布了一项人事变动——原抖音集团CEO张楠宣布,自己辞去CEO一职,未来将把精力聚焦在剪映的发展上。
后来字条跳动就推出了即梦,属于剪映板块旗下。
即梦背靠字节的剪映、抖音生态,有天然分发入口和用户场景优势。即梦的Seaweed模型支持文本生成视频、动作模仿、多模态参考等功能,平台集成创作、编辑、分享完整生产链条。
另一边,坐拥 7.15 亿用户的快手,也推出了 “可灵 AI”。在今年 4 月中旬的月度付费流水超 1 亿元人民币,位列全球视频生成领域第一。
值得一提的是,在这场竞赛中,还涌现出像“恒星AI”这样的玩家,号称全球首个AIGC视频社区,比Sora 2还早两个月落地。
这也说明,在“AI模型+社区”这个未来赛道上,中国公司并非没有敏锐的嗅觉和快速行动的能力。面对Sora 2的挑战,中国的互联网企业并未坐以待毙。这场AI的竞赛,注定会是一场精彩的长跑。
热门跟贴