产品体验｜腾讯内测混元文生视频大模型

猜想笔记

2024-12-03 11:31 ·北京

前几天收到腾讯混元文生视频模型的内测，话不多说来体验一下。

对于非专业用户来说，其实比较困难的点是写出优秀的提示词。对此，混元细心地给出了“灵感提示”，点开后能看到系统给出的提示词，包括转场视频、多动作视频、超写实视频。

随机挑取几个提示词体验一下，选择速度优先，其他默认：

提示词：一只猫在草原上奔跑，镜头切换到一个正在微笑的小女孩身上

提示词：一个技术人员在电脑前办公，过了一会，用一只手拿起桌上的咖啡杯

提示词：手持长焦跟拍，隧道灯光断续闪过，防护玻璃上的水珠随速度扭曲变形，高细节，自然光

以上case都是一次性生成，看起来混元生成AI视频的质量还是挺高的，前头镜头的切换自然，还能保持角色的一致性。

当然只用官方题库的case肯定不够。接下来我尝试用Runway的Gen-3 Alpha模型给出的提示词作为对比。

提示词：一名宇航员正在里约热内卢的一条小巷里奔跑。

混元：

Runway：

提示词：海啸穿过保加利亚的一条小巷，动态十足。

混元：

Runway：

提示词：Ultra-fast disorienting hyperlapse racing through a tunnel into a labyrinth of rapidly growing vines.

（超快速度的迷失方向延时摄影，穿过隧道，进入快速生长的藤蔓迷宫。）

混元：

Runway：

几个case的对比能够看出，runway的画质更加高清（可能主要因为是卖家秀），而混元在动作连贯性、流畅度方面表现也非常优秀，尤其是最后一个长镜头的case比较明显。

混元目前只有文生视频功能，图生视频尚未开放。

AI视频模型赛道也越来越卷了，也期待混元后续的产品策略。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴