OpenAI首个AI视频生成模型Sora正式推出。2月份,OpenAI发布的视频生成模型Sora备受期待,部分用户进行了预测试。Sora允许用户使用文本提示创建高清视频剪辑,还可以根据静止图像生成视频剪辑,并可以加长或填充现有视频。

打开网易新闻 查看精彩图片

Sora能够生成高达1080p分辨率的视频,在宽屏、垂直或方形宽高比下长达20秒。该公司在一份公告中写道:“你可以携带自己的素材进行扩展、混音和混合,或者从文本中生成全新的内容。”新的故事板工具还允许用户为每一帧精确指定输入。

该公司还发布了Sora的新版本Sora Turbo,据称其速度明显快于2月份预览的型号。Sora Turbo将是ChatGPT Plus和Pro用户可以使用的独立产品。

学习物理世界

OpenAI表示,Sora“是理解和模拟现实的人工智能的基础,是开发可以与物理世界交互的模型的重要一步。”与物理世界的交互对一些模型来说一直是一个挑战,正如最近的一项科学研究所表明的那样,LLM往往无法准确表示现实世界。

该公司指出,Sora在当前的迭代中经常产生“不切实际的物理效果,并在长时间内难以应对复杂的动作”

在Sora周一的直播亮相中,OpenAI首席执行官Sam Altman表示,人工智能视频是OpenAI的一项重要努力,该公司将视频视为一种媒介,它促进了人工智能和人类用户之间的共同创造动态,超越了基于文本的交互。他还表示,视频对OpenAI的AGI(通用人工智能)路线图至关重要,因为它为人工智能了解现实世界提供了丰富的环境。

“我们在OpenAI启动了Sora项目,以构建真正深入了解世界及其物理的人工智能系统,”OpenAI Sora首席研究科学家Bill Peebles在直播中说。“我们才刚刚开始。这个早期版本的Sora会犯错误——它并不完美。但它已经到了我们认为它对增强人类创造力非常有用的地步,我们迫不及待地想看看世界会用Sora做什么。”

打开网易新闻 查看精彩图片

伦理问题依然存在

对人工智能生成的视频的担忧仍然存在,主要集中在可能的滥用上,包括通过深度伪造传播错误信息、检测操纵内容的挑战、关于版权和隐私的道德问题,以及放大训练数据中存在的偏见的风险。

OpenAI表示,所有Sora生成的视频都附带了C2PA元数据来识别和验证其来源,同时还宣传了其他保护措施,如默认可见水印和用于额外验证的内部搜索工具。该公司还表示,它正在先发制人地阻止“特别具有破坏性的虐待形式”,如虐待儿童和性相关的深度伪造。

OpenAI表示,这种措施引入将让社会有时间探索视频生成技术的可能性,并开发更多的保障措施来确保负责任的使用,但一些专家并不相信它的安全性。

芬兰人工智能治理公司Saidot的人工智能伦理和治理顾问Nana Nwachukwu表示:“经过近一年的推迟,Sora的发布对人工智能来说是一个里程碑式的时刻,但它也重新引发了关于安全和先进技术伦理影响的重要讨论。

“虽然Sora改变行业的潜力是巨大的,但它也降低了创建危险欺骗性内容的障碍。”她说,并指出OpenAI目前的护栏可能还不够。“我们无法确定这些措施的有效性,也无法确定所指出的风险是否是该系统的全部预期风险。治理必须与监测和管理这些风险的技术一起发展。如果没有持续的监督和强有力的行业标准,创新的希望可能会被错误信息和伤害的威胁所掩盖。”

打开网易新闻 查看精彩图片

可利用性

Sora将免费提供给ChatGPT Plus用户,允许他们每月生成多达50个480p视频,或更少数量的720p视频。OpenAI表示,其Pro计划将包括10倍的使用率、更高的分辨率和更长的持续时间。该公司表示,明年将有更多量身定制的定价计划。