打开网易新闻 查看精彩图片

前几天收到腾讯混元文生视频模型的内测,话不多说来体验一下。

对于非专业用户来说,其实比较困难的点是写出优秀的提示词。对此,混元细心地给出了“灵感提示”,点开后能看到系统给出的提示词,包括转场视频、多动作视频、超写实视频。

打开网易新闻 查看精彩图片

随机挑取几个提示词体验一下,选择速度优先,其他默认:

打开网易新闻 查看精彩图片

提示词:一只猫在草原上奔跑,镜头切换到一个正在微笑的小女孩身上

打开网易新闻 查看精彩图片

提示词:一个技术人员在电脑前办公,过了一会,用一只手拿起桌上的咖啡杯

打开网易新闻 查看精彩图片

提示词:手持长焦跟拍,隧道灯光断续闪过,防护玻璃上的水珠随速度扭曲变形,高细节,自然光

以上case都是一次性生成,看起来混元生成AI视频的质量还是挺高的,前头镜头的切换自然,还能保持角色的一致性。

当然只用官方题库的case肯定不够。接下来我尝试用Runway的Gen-3 Alpha模型给出的提示词作为对比。

提示词:一名宇航员正在里约热内卢的一条小巷里奔跑。

混元:

打开网易新闻 查看精彩图片

Runway:

打开网易新闻 查看精彩图片

提示词:海啸穿过保加利亚的一条小巷,动态十足。

混元:

打开网易新闻 查看精彩图片

Runway:

打开网易新闻 查看精彩图片

提示词:Ultra-fast disorienting hyperlapse racing through a tunnel into a labyrinth of rapidly growing vines.
(超快速度的迷失方向延时摄影,穿过隧道,进入快速生长的藤蔓迷宫。)

混元:

打开网易新闻 查看精彩图片

Runway:

打开网易新闻 查看精彩图片

几个case的对比能够看出,runway的画质更加高清(可能主要因为是卖家秀),而混元在动作连贯性、流畅度方面表现也非常优秀,尤其是最后一个长镜头的case比较明显。

混元目前只有文生视频功能,图生视频尚未开放。

AI视频模型赛道也越来越卷了,也期待混元后续的产品策略。