打开网易新闻 查看精彩图片

文 丨 阑夕

从Seedance 2.0积分难求、排队成灾开始,AI视频的抽卡问题就越来越难以容忍了。

什么意思呢?

我记得年初有很多媒体都用「AI视频跨过了童年期」这么句话,来形容国产视频模型主导的这轮爆发,是个相当精准的比喻。

在童年期,AI视频创作是公认的时间游戏,由于模型最后的交付质量像孩童般不稳定,想要拿到满意的结果,就势必要经历反复抽卡、从素材堆里挑拣的过程,算力资源尚且宽松的时候,这么干当然没毛病。

但实际上我们也看到了,Seedance 2.0红遍全球并迅速提价之后,不仅即梦的老会员账号在二手市场被炒到了从未有过的高价,连模型本身骤增的排队时间也让使用体验急剧变差,甚至极端点的AI短剧公司,已经把工作时间调整到了半夜,只为避开高峰期。

虽然这完全可以称得上是国产视频模型「甜蜜的负担」,但夹在时间和成本两座大山中间,过去我们习以为常的抽卡,可能已经成了阻碍生产力的最大因素。

更能说明问题的是,AI内容公司里已经出现了「抽卡师」——只负责批量跑模型,从废片堆里挑选可用素材——这么个岗位,这本身就是一个反证,如果视频模型真的足够精准可控,那类似的工种压根是不应该存在的,对不对?

就连我本人,前些日子也苦于找不到一个无需排队的平替渠道,就更不用提那些嗷嗷待哺的专业团队,好不容易排队半天却抽到一堆废片的崩溃程度,完全可以想象。

不过把市面上大大小小的主流产品试用下来之后,我最终留下了LibTV这款画布型工具,因为调用Seedance 2.0最低只需要0.36元/秒的定价,实在太良心了......

开个玩笑,价格够低只是一方面,它更深得我心的,其实是一种近乎于模块化的易用性。

随着AI大模型的爆发,我们通过一个对话框已经实现了很多以前力所不能及的事,但我一直觉得,拿所谓的自然语言喂给AI生成视频,总有一种说不上来的别扭。

大致是因为人类是视觉动物,把看到的画面转译成复杂的描述,这过程本身就会导致极高的损耗和误差,也是几乎所有视频模型需要不断抽卡、一致性不稳定,以致于让正经导演百般嫌弃的核心原因。

比如你们可以尝试辨别一下,如果用对话的形式来复刻出这些影史经典镜头,会是一项怎样复杂的工程:

在以前,这种题材的难度,基本是跟画面的复杂程度成正比的,角色越多,就越是要精细地描述出人物站位、神态和空间关系,AI在理解过程中产生的任何偏差,都足以让整个镜头推倒重来。

但依靠LibTV的内置功能,实现上面的复刻效果,基本只需要几步而已。

在机动部队x哆啦A梦这起案例中,我的工作流就是这样的:

- 批量上传角色图片,一键生成渲染图

打开网易新闻 查看精彩图片

- 在3D导演台中摆放角色站位

打开网易新闻 查看精彩图片

- 用720°全景功能一键分离原视频背景

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

- 把以上这些元素组合起来,输入我想要的角色站位提示词,得到成片

这就是模块化的意思,用户既不需要掌握什么提示词技巧,也不用理解何为镜头语言,就能毫不费力地把视频「搭」起来。

当然,这过程基本都是LibTV里很多独家功能在疯狂立功,比如最亮眼的3D导演台,在高自由度、高客制化的同时,还能保持一眼就懂的易用性,角色的站位与姿势、摄像机的角度和远近、物体的摆放与体积,这些仅仅用鼠标拖动+点击就能实现,在模型能力的基础上,衍生出了言出法随、指哪打哪的爽感:

或者是可以一键分离人物与场景的720°全景,也属于看上去难度不高但作用极大的功能,由于LibTV对场景细节的理解相当到位,在画面复刻的还原度、连续镜头的一致性上可以提供很大的帮助。

基于这些,哪怕是对AI产品完全没有熟练度的普通人,也能为身边的任何事物轻松打造一条高质感TVC广告,比如我做的这条高端奢侈粽子广告:

正经导演嫌AI不够专业的问题,是怎么被解决的?
打开网易新闻 查看更多视频
正经导演嫌AI不够专业的问题,是怎么被解决的?

值得一提的是,这条视频从脚本创意到音乐、剪辑,全程都在LibTV完成闭环,我只需要说出我哪怕是一个很模糊的想法,它也能直接补全,并支持每个环节的精细化调整:

打开网易新闻 查看精彩图片

能理解了吗?环环相扣,环环可控,以往需要上百字提示词事无巨细描述出来的画面,如今可以像乐高一样把视频「搭」起来,由于中间的链路变多,所以降低了信息损耗,最终达到事半功倍的效果。

思来想去,LibTV的好用之处在于它拓宽了交互的边界,要知道在真人影视剧拍摄现场,导演想要实现什么样的效果从来都不是单靠口述完成的,里面还有大量比划、模拟甚至亲自示范的做法,而LibTV之所以让人一看就懂,正是因为它遵循着现实世界而非AI原生的经验。

更重要的是,以前AI视频分镜的精细化处理,本质上是个需要堆资源的活儿,时间、成本、团队规模,每一项因素都影响着最终的产出质量,所以AI短剧的精品化,在某种程度上才会成为大厂特权。

然而当一切变得可控之后,不仅大厂可以更快验证市场,连中小公司也有了上桌吃饭的机会,只要故事够好、审美在线,就可以以小博大。

剧情创作博主菲菲飞就是个鲜活的例子,作为一支只有几个人的小团队,他们用LibTV生成的AI作品「阿黄」已经在抖音获得了超过140万赞,评论区满是对叙事紧凑、技巧出众的称赞声音。

这就是我说的「堪称良心」的意思,对于单兵作战的新手,LibTV是降低AI视频创作门槛、快速出片的工具;

而在轻车熟路的专业团队手里,LibTV已经可以延伸出系统的作用,万物集于一片画布,再加上作为硬通货的Seedance 2.0免排队额度,由此事半功倍的一站式体验,价值是要远远大于反复抽卡折腾的。

是的,门槛和产能,就是我认为工具类产品最有机会切入和改变的市场。

我一直觉得,创作一条AI视频,总有一天会变成跟拿起手机拍照一样稀松平常,成为日常表达不可或缺的一部分,雅俗共赏,兼容并蓄。

这也是为什么我愿意推荐大伙多去亲身体会AI视频的创作过程,从模型可以把创意捏成任何人类想要的模样,到像LibTV这样的产品,又在前者的基础上让AI长出手脚,只有身处其中,才能感受到变化是如何一天天发生的。

而事实证明,只要于生产力有益,好的模型和产品就永远不愁卖。

从看不起,到用不上,短短几个月的时间里,海内外AI视频创作条件就发生了两级反转,甚至可以说,中国科技公司很少打过这么富裕的仗。

但可以确定,这不会、也不可能是最后一站,AI的狂奔,早晚有一天能跑到人类想象力的前头,或许,就可以从一张画布开始。

再次把链接贴出来,推荐每个人都去试一试。

https://www.liblib.tv/