OpenAI的Sora会砸掉谁的饭碗

智能科技学

2024-02-19 10:08 ·江西

不约而同，同日出招。两个AI巨头在同一天各自放出了自己的AI新核武器，OpenAI的文生视频模型Sora又一次赢得了满堂彩。Sora的惊艳亮相，不仅碾压了诸多AGI视频同行，更有可能改变电影电视广告游戏行业的未来游戏规则。

谷歌新模式性能完胜

周四，谷歌突然发布了新一代多模态大模型Gemini 1.5 Pro，在与OpenAI的大模型之战中加速超越。这是业界迄今最强的大语言模型，最高可支持10,000K Token上下文，直接将性能提升到了百万级别，在性能上完全秒杀了OpenAI的GPT-4 Turbo。

百万级别Token意味着什么？谷歌AI项目负责人杰夫·迪恩(Jeff Dean)解释说，在Gemini 1.5 Pro百万级别上下文窗口支持能力下，用户可以完成复杂的内容交互，轻松解析整本图书、电影、播客，理解非常长的文档，甚至是数百个文件数十万行的代码库。

Gemini 1.5 Pro的发布，意味着谷歌在和OpenAI的军备竞赛中占据了强大的性能优势。相比之下，OpenAI的GPT-4 Turbo只能处理128k Token，而且近期更是出现了性能下滑的不利状况，直到上个月发布更新之后才有所改善。

然而，OpenAI并没有让谷歌独美。就在同一天，他们发布了文本生成视频的AI模型Sora，只需文本就能自动生成视频；继文本模型ChatGPT和图片模型Dall-E之后，OpenAI又开始颠覆视频领域。

相比谷歌Gemini 1.5 Pro基于数据性能的硬实力优势，Sora基于视觉美学的惊艳表现，显然更容易让人印象深刻，迅速成为了社交网站上的热点。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴