就在这个月的16号,OpenAI官网上线了个震撼的东西——Sora视频模型。这货不简单,能够根据我们说的话,画的图,转化成长达一分钟的视频,而且画面质量超级棒,听话得很。

为什么说Sora是个大革命?

首先,Sora是OpenAI搞出来的第一个能把文字变视频的模型。你没听错,就是把文字故事变成动画电影那种!这意味着,咱们即将迎来科技的新浪潮。Sora的出现,让AI领域的竞争加速,也让资本市场上的很多公司看到了新的增长点。

Sora到底有什么本领?

别看Sora只能生成一分钟的视频,但它能做的事情,真的是挺炸裂的。无论是根据你的一句话,一段描述,还是一张静态图,它都能变魔术似的生成视频。视频不仅清晰,还能展现复杂的场景和角色的生动表情,连镜头转换都像大导演拍的电影一样流畅。

Sora有哪些厉害的特点?

国泰君安的研究报告把Sora的特点总结为三个:“超长视频”,“多角度镜头”,“接近真实”的处理技术。这让Sora在AI视频制作领域里,秒杀了其他同行。

Sora比别的AI模型强在哪?

简单来说,就是视频长、画质好、细节丰富。其他AI做的视频,要么是几秒钟的小短片,要么就是画面质量一般。而Sora,无论是视频的连贯性还是场景的真实度,都做得非常出色。

不过,Sora还在进步中

尽管Sora这么厉害,但它还在成长的路上。目前还有些小问题,比如分不清左右,或者在描述一些随时间变化的事件时可能会有点儿困难。不过,OpenAI说了,他们相信Sora能开启一种全新的视频创作方式,让我们对物理世界有更深的模拟和理解。

Sora的出现,代表着什么?

简单说,就是AI做视频的能力,大跃进了!Sora能深度模拟真实世界,这不仅是AI技术的一个巨大突破,也意味着人工智能在理解和互动真实世界方面,又向前迈进了一大步。

应用前景广阔

在过去的几年里,OpenAI以其革命性的创新引领了人工智能领域的前进步伐。从2021年初的图像生成系统DALL·E到2022年末的聊天机器人ChatGPT,OpenAI不仅推动了AI技术的发展,也逐步改变了我们对未来工作方式的认知。

最新的突破来自于Sora模型,这个先进的系统能够在一分钟内生成高保真视频,不论是横屏还是竖屏格式,它都能够适配,为视频创作领域带来了前所未有的灵活性。这意味着,无论是在电影制作、电视内容制作,还是在自媒体领域,Sora的应用都将开启新的可能性。

据国盛证券分析,Sora的出现标志着影视动画行业的一个颠覆性时刻。Sora模型的设计基于对DALL·E和GPT研究的深化,并且利用了DALL·E 3的高级提示词技术来为视觉模型训练数据生成富有描述性的标注,从而使得模型能够更精确地根据文本指令进行创作。

360集团的创始人周鸿祎指出,Sora采用了与众不同的技术路径。以往的视频和图像生成依赖于真实图片的Diffusion组合,而OpenAI这次则是将其大语言模型的优势与Diffusion技术相结合,让Sora不仅能够理解现实世界,还能够模拟它,这样生成的视频更加真实,突破了传统2D范围的限制。

周鸿祎进一步强调,这种大模型的应用前景广阔,它不仅能够处理大量视频数据,而且能够在图像传达信息量方面实现巨大的飞跃。这种进步让通用人工智能(AGI)的实现看起来不再是遥不可及的梦想,而是可能在不久的将来成为现实。

他预见,借助强大的大模型基础,结合对人类语言、知识和世界模型的深入理解,再加上多种技术的融合使用,我们能够在各个领域创造出超级工具,这不仅包括生物医学、蛋白质和基因研究,还有物理、化学、数学等学科的研究。Sora对物理世界的模拟能力,尤其是在机器人具身智能和自动驾驶技术方面,预示着巨大的变革。

Sora的能力在理解并呈现物理定律方面将带来该领域的革命性突破,也引起了工信部信息通信经济专家委员会委员、数字经济专家刘兴亮的关注,他将其视为AI技术在内容创作领域开启的新纪元。

刘兴亮对Sora的评价尤其值得关注。他指出,Sora能够在短短一分钟内生成1080P高清视频,内容涵盖多个角色、各种动作和背景细节,达到了接近电影级别的逼真效果。这不仅极大地丰富了观众的视觉体验,也为内容创作者提供了强大的工具,使他们能够以更低的成本、更快的速度把创意变为现实。这一技术的飞跃,预示着AI将在未来人类生活的方方面面扮演更加重要的角色。

从市场趋势来看,2022年被誉为影像之年,2023年为声波之年,而2024年则被预见为视频之年。OpenAI宣布,Sora将作为构建世界模型的基石,推动着向实现通用人工智能(AGI)的目标迈进。

此外,对于Sora的进一步发展,算力需求的旺盛成为不可忽视的话题。国泰君安指出,Sora模型将推动AI多模态领域实现飞跃式的发展,相关领域如AI创作将经历深度变革,AI的赋能范围将进一步扩大。这不仅意味着多模态训练及推理应用对算力基础设施的需求将大幅提升,国盛证券也强调,遵循AI缩尺律,随着训练计算量的增加,样本质量的显著提升将使得算力需求成为多模态时代最核心的瓶颈之一。

重点关注:

我们的世界因为一些超级聪明的电脑程序——我们称之为AI(人工智能)——变得更加智能。这些AI能做很多事情,比如帮助我们创建视频、图片,甚至是写文章。但是,让这些AI运行起来,需要很强的电脑力量,我们叫它“算力”。

最近,有一种趋势,全球对这种强大的电脑力量的需求正在飞速增长。这对于中国的一些公司来说,是一个大机会。据南方财富网的数据显示,中国股市上有52家公司正在做与AI算力相关的事情。这些公司做的事情包括制造AI服务器的零件、组装服务器、出租算力,还有建设数据中心等等。

有些公司专门做服务器的零件,比如海光信息、寒武纪等;有的公司则是把这些零件组装成完整的服务器,比如高新发展、神州数码等;还有的公司提供算力租赁服务,比如恒润股份;还有的公司负责建设数据中心,存储大量的信息,比如奥飞数据。

不仅如此,还有很多大公司也在积极布局AI基础设施。比如,万兴科技就宣布,他们的视频创意产品可以用来做各种视频的创作和剪辑,他们还有一个叫做“天幕”的大模型,专门用于视频创意类的AI技术。

昆仑万维和Opera也在做短视频,而昆仑万维的一个大模型在一次评测中拿到了第一名。还有当虹科技,他们开发了一种工具,可以把静态照片变成三维的视频。

总的来说,有超过10家中国上市公司在过去三个月里,分享了他们在视频生成模型领域的进展。这显示出中国在AI算力方面正在快速发展,为世界的智能化贡献力量。