作者|袁博

来源|AI先锋官

作为 aigc 里程碑式的产品,Sora一经推出便重现了 “ChatGPT式的震惊”,每次小迭代,甚至每次原生作品的推出都高度吸睛(可参考、)。

不争气的是,Sora一直没向用户开放,各种渠道的爆料也显示,它的每个惊艳作品的生成都经过了“修图”()。

期间,各种类Sora产品不断推出,但真能打的鲜见。

这回跳出来挑战的是快手,一时间风评甚好,也可见的投入了不少营销资源鼓吹。

小编不免手痒,凭试用了几百个 aigc 产品的经验,替大家评测一下。

产品信息显示,"可灵"采用与类Sora的DiT结构,并结合了快手自研的技术创新。它可以生成长达2分钟、30fps、1080p分辨率的视频,并支持多种宽高比。

据官网 (链接:https://kling.kuaishou.com/#create-video-view) 介绍,可灵大模型不仅具备强大的概念组合能力和想象力,还能生成大幅度的合理运动、模拟物理世界特性。

话不多说,先看我们先来看看官方发布的一些示例。

大幅度的合理运动

可灵采用3D时空联合注意力机制,能够更好地建模复杂时空运动,生成较大幅度运动的视频内容,同时能够符合运动规律。

·提示词:一个男人骑着马在戈壁沙漠飞奔,背后美丽的夕阳,电影级别画面

·提示词:一名宇航员在月球表面奔跑,低角度镜头展现了月球的广阔背景,动作流畅且显得轻盈

·提示词:一辆拉力赛车在赛道上快速转弯

通过上面的示例,不得不说“可灵”生成的视频其动作的连贯性、流畅性和运镜比国内市面上大多数的AI生成的视频都要丝滑。

2分钟的视频生成

得益于高效的 训练基础设施、极致的推理优化和可扩展的基础架构,可灵大模型能够生成长达2分 钟的视频,且帧率达到30fps。

 文生视频在Sora后终于来了个能打的,我们封快手可灵为mini版Sora
打开网易新闻 查看更多视频
文生视频在Sora后终于来了个能打的,我们封快手可灵为mini版Sora

·提示词:小男孩在花园里骑自行车经历秋冬春夏四季变换

 文生视频在Sora后终于来了个能打的,我们封快手可灵为mini版Sora
打开网易新闻 查看更多视频
文生视频在Sora后终于来了个能打的,我们封快手可灵为mini版Sora

·提示词:乘坐火车,透过车窗游览各式各样的风景

可以看到,可灵在风景、四季的切换时的过度非常的巧妙,并未让人感到生硬。

模拟物理世界特性

基于自研模型架构及Scaling Law激发出的强大建模能力,可灵能够模拟真实世界的物理特性,生成符合物理规律的视频。

·提示词:一个戴眼镜的中国男孩在快餐店内闭眼享受美味的芝士汉堡

·提示词:厨师在厨房切洋葱,为准备菜肴做准备

·提示词:小心地将牛奶倒入杯中,奶流平稳,杯子渐渐被奶白色填满

这个吃汉堡和倒牛奶的视频真的很难让人怀疑是AI生成,只不过还有会有小瑕疵的,比如,在厨师切洋葱的视频中,仔细看的话,不难发现在厨师还未切下去的时候完整的洋葱就变成洋葱块了。

并且,Sora此前也生成过吃汉堡的视频,两者不分上下。

概念组合能力

基于对文本-视频语义的深刻理解和 Diffusion Transformer 架构的能力,可灵能够将用户丰富的想象力转化为具体的画面,虚构真实世界中不会出现的的场景。

·提示词:一只白猫在车里驾驶,穿过繁忙的市区街道,背景是高楼和行人

·提示词:微距镜头,火山在一个咖啡杯中喷发

·提示词:一个积木小人在美术馆里参观

视频整体上还是不错的,但还是会存在一些小问题,比如,猫在车里驾驶时,两旁的车有时会出现在人行道上,不过在细节上可灵做的还挺不错的,比如,车的引擎盖上会有猫咪耳朵的倒影,好评!

-5-

电影级的画面生成

基于自研3D VAE,可灵能够生成1080p分辨率的电影级视频,无论是浩瀚壮阔的宏大场景,还是细腻入微的特写镜头,都能够生动呈现。

·提示词:一对男女手牵手在星空下行走,背景斗转星移

·提示词:落日余晖下的烟囱

·提示词:露水在蓝色玫瑰花瓣上,高清,近景,细节

这个电影级的画面确实没得说,尤其蓝色玫瑰花,感觉比现实中拍出来的还要真。

-6-

支持自由的输出视频宽高比

可灵采用了可变分辨率的训练策略,在推理过程中可以做到同样的内容输出多种多样的视频宽高比,满足更丰富场景中的视频素材使用需求。

·提示词:一只戴着太阳镜的柯基在热带岛屿的海滩上漫步

虽然它展示的视频大多都是5s的,但其生成的质量确实无可挑剔,可以媲美 Sora大部分那些“精修”视频,小编决定赐封它为“mini 版Sora”。

现在用户已经可以在快影APP里申请限时免费试用,审核通过后即可使用。用户无需具备专业的技术背景,只需输入提示词即可进行创作。

除视频生成外,小编还注意到,快手还基于此模型推出了其他应用,如AI舞王、AI小说 转漫画、AI变装、AI幻术等,并即将推出图生视频功能。

“可灵”的发布,可见快手在大模型技术方面动作之迅速。随着"可灵"的不断优化和升级,它将为视频内容创作者带来更多的可能性,开启国内AI视频生成的新纪元。

扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。

往期文章回顾