“穿透”作者|冯庆艳
ChatGPT母公司OpenAI,简直像一个坏小孩和主宰者的结合体。
他总是喜欢在人们归于平静生活的湖面上,出其不意地,扔出一枚枚深水炸弹,然后在天上,有点促狭地看着,被炸弹炸得手忙脚乱的人群。
中国2024新年刚过,2月16日凌晨,OpenAI再扔出一枚深水炸弹。这枚炸弹的威力,可以说震惊了整个世界。这天,OpenAI推出了一款根据文字指令即时生成短视频的模型——Sora。
Sora模型一出场,可以说碾压已经诞生的其他所有同类模型。其不仅根据文字描述,便可生成长达60秒的视频,还能根据现有的静态图像生成视频,而且生成后的视频,质量简直可以“以假乱真”。比如高度详实的场景展现,复杂的摄像机运动,身在场景中的多个角色,都充满活力,能拥有丰富情感呈现。
OpenAI表示,Sora采用了DALL·E 3的技术,建立在过去对DALL-E和GPT模型的研究基础之上。
“通过让模型一次生成多帧画面,解决了一个具有挑战性的问题:即使生成的主体暂时离开视线内,也能确保主体不变。”OpenAI称。
不过OpenAI也提及,当前的Sora模型并不完美。弱点是它可能难以准确模拟复杂场景中的物理现象,也可能无法理解具体的因果关系。比如一杯水碎在桌面上,可能水洒在桌面的视觉呈现,要先于杯子碎裂。
虽然目前Sora未向公众开放使用,还处于接受安全测试阶段,但OpenAI CEO奥特曼发布的一些Sora生成的视频,足以碾压其他同类模型。也让同类模型的玩家,变得惊恐万分。
据了解,目前谷歌、Meta等科技巨头都有类似模型。谷歌的Lumiere模型正在测试,Meta去年发布了Emu模型。同时在生成式AI视频赛道上,此前还涌现出一批的创业公司,比如Runway、Pika、Stable Video Diffusion等。如今这些公司以及背后的投资机构,都似乎感受到了世界末日的到来。
一众科技大佬对于Sora模型都极为关注,不少大佬发表了自己的观点。特斯拉CEO埃隆·马斯克,他也曾经是OpenAI的早期创始人之一,后来因控制权之争黯然离场。此前马斯克也多次批评OpenAI的潜在安全风险。这一次,马斯克在X平台上的评价是“gg humans(人类)”。意思是人类愿赌服输。马斯克还称,通过AI增强的人类将在未来几年创造出最好的作品。
Sora模型的出场,给哪些行业从业者带来失业恐慌?
有人说,ChatGPT重构了文字内容相关的诸多领域,Sora未来可能会颠覆现有的视频、影视、广告、游戏、教育、动漫、小说、自媒体等诸多领域。
360集团创始人周鸿祎也认为,今天Sora可能给广告业、电影预告片、短视频行业带来巨大的颠覆,但速度不一定那么快。“它不一定那么快击败TikTok,更可能成为TikTok的创作工具。”
周鸿祎预测,Sora的出现,或意味着AGI(通用人工智能)实现将从10年缩短到1年。
OpenAI不断扔出震惊世界的深水炸弹的同时,其估值也跟着水涨船高。去年初,ChatGPT刚发布不久时,OpenAI的估值约为290亿美元,伴随着杀手级的Sora的推出,OpenAI的最新估值有望达到800亿美元。
Sora横空出世之前,OpenAI还在布局AI芯片制造基地,同时还构建了GPT商店(GPT Store),试图复制“终端+平台+生态”的苹果模式。
热门跟贴