前几天收到腾讯混元文生视频模型的内测,话不多说来体验一下。
对于非专业用户来说,其实比较困难的点是写出优秀的提示词。对此,混元细心地给出了“灵感提示”,点开后能看到系统给出的提示词,包括转场视频、多动作视频、超写实视频。
随机挑取几个提示词体验一下,选择速度优先,其他默认:
提示词:一只猫在草原上奔跑,镜头切换到一个正在微笑的小女孩身上
提示词:一个技术人员在电脑前办公,过了一会,用一只手拿起桌上的咖啡杯
提示词:手持长焦跟拍,隧道灯光断续闪过,防护玻璃上的水珠随速度扭曲变形,高细节,自然光
以上case都是一次性生成,看起来混元生成AI视频的质量还是挺高的,前头镜头的切换自然,还能保持角色的一致性。
当然只用官方题库的case肯定不够。接下来我尝试用Runway的Gen-3 Alpha模型给出的提示词作为对比。
提示词:一名宇航员正在里约热内卢的一条小巷里奔跑。
混元:
Runway:
提示词:海啸穿过保加利亚的一条小巷,动态十足。
混元:
Runway:
提示词:Ultra-fast disorienting hyperlapse racing through a tunnel into a labyrinth of rapidly growing vines.
(超快速度的迷失方向延时摄影,穿过隧道,进入快速生长的藤蔓迷宫。)
混元:
Runway:
几个case的对比能够看出,runway的画质更加高清(可能主要因为是卖家秀),而混元在动作连贯性、流畅度方面表现也非常优秀,尤其是最后一个长镜头的case比较明显。
混元目前只有文生视频功能,图生视频尚未开放。
AI视频模型赛道也越来越卷了,也期待混元后续的产品策略。
热门跟贴