打开网易新闻 查看精彩图片

不约而同,同日出招。两个AI巨头在同一天各自放出了自己的AI新核武器,OpenAI的文生视频模型Sora又一次赢得了满堂彩。Sora的惊艳亮相,不仅碾压了诸多AGI视频同行,更有可能改变电影电视广告游戏行业的未来游戏规则。

谷歌新模式性能完胜

周四,谷歌突然发布了新一代多模态大模型Gemini 1.5 Pro,在与OpenAI的大模型之战中加速超越。这是业界迄今最强的大语言模型,最高可支持10,000K Token上下文,直接将性能提升到了百万级别,在性能上完全秒杀了OpenAI的GPT-4 Turbo。

百万级别Token意味着什么?谷歌AI项目负责人杰夫·迪恩(Jeff Dean)解释说,在Gemini 1.5 Pro百万级别上下文窗口支持能力下,用户可以完成复杂的内容交互,轻松解析整本图书、电影、播客,理解非常长的文档,甚至是数百个文件数十万行的代码库。

打开网易新闻 查看精彩图片

Gemini 1.5 Pro的发布,意味着谷歌在和OpenAI的军备竞赛中占据了强大的性能优势。相比之下,OpenAI的GPT-4 Turbo只能处理128k Token,而且近期更是出现了性能下滑的不利状况,直到上个月发布更新之后才有所改善。

然而,OpenAI并没有让谷歌独美。就在同一天,他们发布了文本生成视频的AI模型Sora,只需文本就能自动生成视频;继文本模型ChatGPT和图片模型Dall-E之后,OpenAI又开始颠覆视频领域。

相比谷歌Gemini 1.5 Pro基于数据性能的硬实力优势,Sora基于视觉美学的惊艳表现,显然更容易让人印象深刻,迅速成为了社交网站上的热点。