2月16日凌晨,OpenAI发布了首个文生视频模型Sora,迅速占据各大新闻网站头版头条。据官方介绍,作为AI视频模型Sora可以根据文本指令创建现实且富有想象力的场景,直接输出长达60秒的视频,并且包含高度细致的背景、主体和背景准确细节的复杂的多角度镜头,以及富有情感的多个角色、特定类型的运动等,

目前官网上已经更新了48个视频demo,在这些demo中,Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。

打开网易新闻 查看精彩图片

Sora建立在过去对DALL·E和GPT模型的综合研究之上,提出了一种新的模型可能。它不仅可以理解用户在提示中提出的要求,还能理解它们在物理世界中的存在方式。

当然,目前的Sora模型依然存在缺陷,比如它可能难以精准模拟复杂场景的物理状况,也能无法理解一些特定的因果和时间联系等。在处理空间细节,比如分辨左右时,Sora也可能会出现混淆;在精确描述一段时间内发生的事件,如特定的摄影机移动轨迹时,也可能稍显差强人意,且目前该模型仅向有限数量的创作者提供访问权限。

Sora发布后,不少分析认为这将对影视制作、广告、教育等多个领域带来革命性的变化,比如在电影制作中,导演和制片人可以通过输入一段故事描述或场景要求,利用Sora模型快速生成预览片段,从而更高效地进行创作和决策;在广告领域,品牌方和广告代理商可以利用Sora模型,根据产品特点和目标受众,快速生成吸引人的广告视频;在教育领域,教师可以利用Sora模型制作生动有趣的课件和视频教程,提高学生的学习兴趣和效果。

不过也有业内人士认为,短期内较难带来颠覆性影响,毕竟由Sora生成的视频在隐私保护、版权问题以及滥用风险等方面都还存在未完善的风险点,为了确保技术的健康发展,我们需要在推动技术创新的同时,加强监管和自律,确保技术的合法、合规和合理使用。