弃子Sora,倒在生态壁垒前。
作者丨梁丙鉴
编辑丨董子博
当地时间3月24日,OpenAI宣布关闭视频生成应用Sora。这一决定被视为OpenAI在冲刺IPO前的战略调整,旨在将重心聚焦于企业级产品。
OpenAI CEO Sam Altman 在内部信中宣布:“Sora 视频平台将全面停运。不只是那个消费端 app,开发者 API、ChatGPT 里的视频生成功能,统统砍掉。干净利落,不留余地。”此时距离OpenAI高调推出Sora独立App仅仅过去了6个月。
应用层越发激化的竞争,正催促着曾经的明星产品们向前或坠落。红极一时的Sora迎来落幕,只是开始。
01
Sora的光荣和野心
Sora从来不是一款失败的产品。作为OpenAI首个视频生成模型,它在2024年2月发布后所引起的轰动,让人们将其称为AI视频生成的“GPT时刻”。
Sora的多模态能力支持用户通过文本、图像、视频的多样化输入生成高保真、电影质感的视频。不仅在生成时长上达到60秒,远超当时竞品普遍的5秒水平,而且Sora还具备初步的物理世界常识和时间逻辑。此前AI视频常因画面失真、逻辑混乱、低保持度等问题导致“一眼假”,但Sora却能通过光线的时间变化、动作稳定的因果链条,表现出它对场景和角色关系的理解。震动从学界传播到影视行业。
不仅如此,卓越的性能已经让学界无法将Sora单纯地视为视频生成模型,而是开始探讨这一品类作为“世界模拟器”的潜在意义。一位AI视频行业的观察者告诉AI科技评论:“Sora现在一骑绝尘,整个画面的真实度、清晰度它一定是最高的,整个画面的想象力以及物理表达也是最好的。有一个概念是世界模拟器,如果你能够跟真实世界达到同样的水准,大家就会觉得你的东西是更强的,这就是区别。”
Sora最核心的技术突破在于采用了DiT架构,将扩散模型与Transformer结合。这一创新使其能够同时处理视频的空间维度和时间维度,生成具有高度时许连贯性的长视频。同时Sora采用Patch化的数据表示,即仿照Token的思路,将视频和图像数据分解至被称为Patch的较小数据单元。由此Sora在不同时长、分辨率的视觉数据上实现了统一训练,极大提高了训练效率。
可以说,这是视频生成模型最重要的范式创新之一。Sora之后,DiT架构逐渐成为行业主流路线,被Runway Gen-3、Luma Dream Machine、快手可灵、阿里万相等国内外厂商采用。
作为自家第二款开启“GPT时刻”的产品,OpenAI对Sora寄予厚望。过去两年Sora的战略定位几经改变,但不变的是重要性逐步提升,愿景越来越宏大。
24年12月,Sora完成初步的产品化探索,向ChatGPT的Plus/Pro订阅用户开放,此时的Sora还只是ChatGPT里的一项集成功能。次年9月,OpenAI以独立产品的形态发布了Sora 2 App,值得注意的是其Cameo(真人出镜)功能。用户只需上传一段自拍视频,再加上诸如“我在沙发上撸狗”的提示词,就能生成本人出镜的AI视频。加之Sora 2内置TikTok式的视频流,技术迭代、社交裂变的多重属性叠加,Sora显然承载了OpenAI对做一款AI时代的TikTok的野心。25年10月,Sora又开放了官方API,支持商业集成,剑指新一代视频开发者平台生态。
25年12月,OpenAI和迪士尼更是公布了一项震动好莱坞的合作。后者将以10亿美元入股OpenAI,并授权超过 200个旗下角色用于Sora视频生成平台,包括米老鼠、白雪公主、钢铁侠、达斯·维达等。至此,Sora已经从一款工具型产品,在短短两年内成长为包含IP生态、社交分发和开发者平台的基础设施。
然而彼时很难想到,Sora的陨落就发生在短短四个月后。
02
视频模型之争进入深水区
Sora在发布后立刻引起了全球科技巨头和初创公司的激烈追赶,中国的AI视频生成赛道也迅速崛起,到今天已经成为一片互联网大厂、初创公司等多方混战的红海。
动作最快的字节于2024年3月开启了视频生成模型的内测,两个月后即梦全量上线。同年8月独立APP"即梦AI"正式上线,其定位为"一站式AIGC内容专业创作平台",支持AI图片创作、视频创作等功能。依托抖音和剪映的流量加持,截至2025年3月数据,其月活用户数已达893万。
快手在24年6月发布了对标Sora的可灵大模型,根据大模型整合应用平台Poe的统计,截至2025年5月,可灵系列大模型在视频生成模型赛道已经占据了30%以上份额。该系列侧重工作室、广告公司等ToB场景,优先追求渗透专业用户,虽然在用户规模上落后于即梦,但商业化进展喜人,据悉截至2025年3月,其ARR已突破1亿美元。
阿里和腾讯也紧随其后。前者的首款视频生成模型通义万象发布于24年9月,25年底已迭代至2.6版本,是国内首个上线了参考生视频功能的视频模型。后者则在24年12月开源了HunyuanVideo,该模型拥有130亿参数,可直接输出1080P、24fps的5秒短片,是当时最大的视频开源模型。
大厂之外,创业公司也纷纷下场,其中不乏视频赛道原生的AI独角兽。
其中有代表性的如MiniMax,基于自研的视频生成模型Abab-video-1,该公司于2024年8月发布了海螺AI。其差异化在于二次元动漫视频生成能力,MiniMax同年12月发布的图生视频模型I2V-01-Live专门针对二次元效果进行了优化,去年3月还收购了AI视频创业公司鹿影科技,后者的二次元动漫AI视频生成平台YoYo支持用户通过文字或图片输入快速生辰高质量动漫内容,此次收购同样是MiniMax针对自身在这一细分赛道的强化。
生数科技的Vidu发布于24年4月,是中国首个全面对标Sora的视频模型。Vidu的原创U-ViT架构同样采用了将Diffusion与Transformer架构融合的思路,但其在2022年9月提出,比OpenAI的DiT早三个月。“参考生视频”技术也是由生数科技全球首创,其在25年1月发布的Vidu Q1率先实现了这一功能,以解决多主体连续一致性难题。
此外,智谱在24年7月发布了基于自研模型CogVideoX的清影,可生成2K分辨率6秒流畅视频,商汤科技旗下则有面向C端的人物视频生成模型Vimi。
这些还只是24年视频模型和视频生成产品密集发布的一角,这一赛道在一年内有超过10余家公司推出了自研产品,并快速迭代。然而这番热闹景象背后,残酷的事实是模型同质化的问题正日益凸显。
技术指标上的接近让各家在1080P分辨率、多镜头切换、物理一致性等基础能力上难以拉开差距,倒逼模型厂商在技术和产品路线上加速分化。商业化的考验同样紧迫,开源模型不断冲击着模型厂商的定价权,视频模型之争进入了深水区,如何在应用端释放出模型能力更大的价值,成为了这一阶段竞争的核心议题。
03
模型参数打不穿的生态壁垒
视频生成任务的背后,有着庞大的内容生态。当竞争从模型层转向应用落地,生态壁垒的作用也随即开始显现。
这一点在国内的视频模型竞争中已经显露迹象。模型性能无法取得代差时,掌握了场景的大厂们可以用流量和生态反哺自家模型。字节旗下有抖音、剪影和红果短剧,快手依托主站,也在试图构建从生成到分发的闭环。对于阿里而言,这份驱动力则来自电商和营销的需求。
回到全球的视频模型之争,中国对AI视频应用的诸多实践,已经构建了难以突破的生态壁垒。
典型的例子是游戏行业。在开发侧,腾讯发布了混元游戏视觉生成平台,号称首个工业级AIGC游戏内容生产引擎,能精准还原"厚涂"、"赛璐璐"、"赛博朋克"等专业术语,此外还有名为"VISVISE"的游戏创作AI全链路解决方案,包括Auto LUV和裙摆AI等开发工具。
在玩法侧,视频模型的高自由度也提供了更多UGC玩法。网易的《逆水寒》上线了AI剧组模式,通过文字指令或真人视频,可生成以玩家角色为主角的二创视频。《倩女幽魂》《永劫无间》的捏脸功能,也得益于伏羲实验室的虚拟人、智能捏脸等技术。
漫剧也是视频模型落地的热门场景。AI漫剧的市场规模已近千亿,而受益于算力成本,它也有了相较短剧而言更可控的成本结构。前沿技术变得更可负担,让漫剧行业走上了一条短、平、快的量大管饱路线。一位AI漫剧创业者表示:“AI漫剧这个行业非常卷,一家公司如果直接和红果签约,可能得按一个月提供100部漫剧的条件签,其实就是量产。”对于视频模型而言,这是海量的应用空间。
出海市场同样广阔。据华尔街日报报道,截至2026年1月,昆仑万维旗下的DramaWave短剧平台月活已破8000万,年化收入近5亿元。该平台主要面向海外用户,提供1-5分钟的短剧内容,和同属昆仑万维旗下的AI短剧创作平台SkyReels形成了AI创作结合智能分发的生态闭环。值得一提的是,视频生成模型SkyReels-V4首创了九宫格参考技术,专门用于解决AI短剧角色一致性的难题。
此外还有影视工业和文旅提供的大量需求,每一个场景都为AI视频生成提供了全新的落地空间和商业模式上的更多可能。在新的技术范式出现之前,任务调用会成为模型迭代和商业上可持续的源动力,而成熟的产业链和广阔的市场无疑会为此创造源源不断的需求。
反观Sora,内容生态的缺失让模型能力独木难支。Sora 2的发布让其网站访问量在25年10月达到6619万峰值,但今年2月就已经回落至2117万,跌幅68%。
访问量少带来的最直接问题是商业变现难,2025年Sora月收入36.7万美元,而Kling AI的同期数据是2000万美元。这背后真正承压的是算力成本。一位AI视频创业者表示:“以前搞互联网,服务器花不了太多钱,但AI创业最大的区别是视频生成要一直花钱。”
算力的边际成本不会趋于零,Sora的任务一直都是找到那些付费意愿高的场景。但是内容生态的欠账让Sora的预期收入难以打正,技术范式的突破也迟迟无望,对于有意冲击IPO的OpenAI来说,Sora已经成为了一个持续烧钱的负担,食之无味,弃之没那么可惜。今天的关停,并不令人意外。
中国的产业链优势让国产模型在AI视频生成赛道占据一席之地,这不仅是一场胜利,而是整个AI行业范式转变的开端。今天一款更强的模型已经无法成为厂商之间的胜负手,能够实现智能向生产力的流畅转化,才是留在牌桌上的条件。Sora因此关停,未来也会有更多明星产品因此坠落。
然而关停并不是结束,原Sora团队后续将转向机器人技术的长期世界模型,Sora的技术会成为具身模型的一部分。Sam Altman曾透露,相关研究进展将快于多数人预期。在落地已经成为机器人核心命题的今天,竞争的烈度不会消失,只是转移。
未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!
公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。
热门跟贴