OpenAI正式推出其首个AI视频生成模型Sora|openai|sora|人工智能|元数据|命令提示符|视频生成模型

OpenAI首个AI视频生成模型Sora正式推出。2月份，OpenAI发布的视频生成模型Sora备受期待，部分用户进行了预测试。Sora允许用户使用文本提示创建高清视频剪辑，还可以根据静止图像生成视频剪辑，并可以加长或填充现有视频。

Sora能够生成高达1080p分辨率的视频，在宽屏、垂直或方形宽高比下长达20秒。该公司在一份公告中写道：“你可以携带自己的素材进行扩展、混音和混合，或者从文本中生成全新的内容。”新的故事板工具还允许用户为每一帧精确指定输入。

该公司还发布了Sora的新版本Sora Turbo，据称其速度明显快于2月份预览的型号。Sora Turbo将是ChatGPT Plus和Pro用户可以使用的独立产品。

学习物理世界

OpenAI表示，Sora“是理解和模拟现实的人工智能的基础，是开发可以与物理世界交互的模型的重要一步。”与物理世界的交互对一些模型来说一直是一个挑战，正如最近的一项科学研究所表明的那样，LLM往往无法准确表示现实世界。

该公司指出，Sora在当前的迭代中经常产生“不切实际的物理效果，并在长时间内难以应对复杂的动作”

在Sora周一的直播亮相中，OpenAI首席执行官Sam Altman表示，人工智能视频是OpenAI的一项重要努力，该公司将视频视为一种媒介，它促进了人工智能和人类用户之间的共同创造动态，超越了基于文本的交互。他还表示，视频对OpenAI的AGI（通用人工智能）路线图至关重要，因为它为人工智能了解现实世界提供了丰富的环境。

“我们在OpenAI启动了Sora项目，以构建真正深入了解世界及其物理的人工智能系统，”OpenAI Sora首席研究科学家Bill Peebles在直播中说。“我们才刚刚开始。这个早期版本的Sora会犯错误——它并不完美。但它已经到了我们认为它对增强人类创造力非常有用的地步，我们迫不及待地想看看世界会用Sora做什么。”

伦理问题依然存在

对人工智能生成的视频的担忧仍然存在，主要集中在可能的滥用上，包括通过深度伪造传播错误信息、检测操纵内容的挑战、关于版权和隐私的道德问题，以及放大训练数据中存在的偏见的风险。

OpenAI表示，所有Sora生成的视频都附带了C2PA元数据来识别和验证其来源，同时还宣传了其他保护措施，如默认可见水印和用于额外验证的内部搜索工具。该公司还表示，它正在先发制人地阻止“特别具有破坏性的虐待形式”，如虐待儿童和性相关的深度伪造。

OpenAI表示，这种措施引入将让社会有时间探索视频生成技术的可能性，并开发更多的保障措施来确保负责任的使用，但一些专家并不相信它的安全性。

芬兰人工智能治理公司Saidot的人工智能伦理和治理顾问Nana Nwachukwu表示：“经过近一年的推迟，Sora的发布对人工智能来说是一个里程碑式的时刻，但它也重新引发了关于安全和先进技术伦理影响的重要讨论。

“虽然Sora改变行业的潜力是巨大的，但它也降低了创建危险欺骗性内容的障碍。”她说，并指出OpenAI目前的护栏可能还不够。“我们无法确定这些措施的有效性，也无法确定所指出的风险是否是该系统的全部预期风险。治理必须与监测和管理这些风险的技术一起发展。如果没有持续的监督和强有力的行业标准，创新的希望可能会被错误信息和伤害的威胁所掩盖。”