12月9日,OpenAI正式向全球用户开放了其备受期待的人工智能(AI)视频生成模型——Sora,标志着人工智能在视频创作领域的又一次突破。Sora可以根据文本提示生成高质量的逼真视频,距OpenAI首次公开预览该产品已经过去了10个月。
根据OpenAI的介绍,Sora将向美国及其他市场的ChatGPT付费用户开放。全新的Sora Turbo版本不仅支持生成最长达20秒的视频,还能够为用户提供多种不同的变体。这一功能无疑为内容创作者、电影制片人及广告商提供了更多创作的自由度。自今年2月首次预告Sora以来,OpenAI已经与多家电影制片厂、媒体公司及经纪公司展开合作,并允许一些著名的艺术家、演员和导演进行试用。
OpenAI声称,Sora不仅仅是一个视频生成工具,而是一项基础性技术,旨在理解并模拟现实世界的规律。这项技术的最终目标是打造能够与物理世界互动的人工智能模型。这一进展被看作是向AGI(通用人工智能)迈出的重要一步。
然而,尽管Sora展现了令人期待的潜力,早期测试也暴露出了一些局限性。比如,在某些测试中,Sora生成的视频出现了“多余的肢体”问题,并且在物理现象的理解上存在不准确之处。此外,与图像生成模型或聊天机器人相比,Sora生成每个视频所需的时间和算力要大得多,这也意味着目前Sora的应用还受到一定的技术限制。
OpenAI首席执行官Sam Altman在介绍中表示,Sora的使用权限将受到限制。ChatGPT Plus订阅用户每月可以生成50个低分辨率的视频,而ChatGPT Pro订阅用户则可以在较慢的速度下生成无限量的高分辨率视频,同时享有500个快速生成的视频的权利。然而,尽管Sora的潜力巨大,它在欧洲的部分地区暂时无法使用,原因是该地区的科技监管要求更加严格。
在最新的演示中,OpenAI还展示了Sora的一些新功能。用户不仅可以通过文本描述来生成视频,还可以上传静态图片或现有视频,Sora能够基于这些素材生成新的内容。例如,用户上传一个视频片段后,Sora会生成该片段的延续画面,使得视频更加完整。此外,Sora还引入了Storyboard功能,用户可以详细描述希望在视频中发生的情节变化,进一步指导视频生成过程。
尽管Sora是全球首个视频生成AI模型,但与之竞争的产品已经逐渐涌现。Google的Veo、快手的可灵、Runway的Gen-3、字节跳动的PixelDance等同类工具已经在市场上崭露头角。这些工具不仅在速度上逐渐超越了传统的影视制作流程,还在某些领域开始应用于电影制作、广告创作等高需求行业。毫无疑问,Sora的发布将进一步推动视频创作领域的革命性变革,而随着技术的不断成熟,未来AI视频生成技术将为影视行业带来更多创新和机遇。
总的来说,Sora不仅是OpenAI在生成模型领域的重要一步,也意味着AI技术在创意产业的应用正在加速,这将极大改变我们对视频创作的认知和方式。随着技术的不断进步,Sora及类似的AI视频生成工具,将可能彻底颠覆电影、广告和内容创作的未来。
热门跟贴