昨天,阿里 ATH 团队正式开启了HappyHorse 1.0的灰度测试。
只需输入简单的文字描述,HappyHorse 1.0即可生成一段3s-15s长度的视频,视频中可以实现多镜头切换、连贯剧情等要素。
创作者可在阿里云百炼平台、千问App、造点AI和HappyHorse官网注册使用。
官网链接:
https://www.happyhorse.cn/
造点AI:
https://create.qianwen.com/
在HappyHorse-1.0的官网上,新用户完成账号注册,可领取66积分,同时视频生成服务享7 折权益,生成5秒720P视频需消耗45积分,折扣后实际扣除32积分。
造点AI同样也是45点积分,只不过没有优惠。
在千问APP内,每位用户每天可获得10点免费额度,生成一个高清、10秒的视频会消耗2点。
HappyHorse 1.0目前支持两个核心功能:多模态视频生成、视频编辑。
这意味着,它不仅可以实现音视频同出,还支持在原片基础上实现精准修改,支持上传参考图进行视频编辑。
OK!废话不多说,这匹屠榜的快乐马实力到底如何,咱们实测见分晓。
本来想让HappyHorse 1.0与Seedance 2.0进行PK,但可能是Seedance 2.0使用的用户太多,生成一个视频要10小时(难怪网上对它们的吐槽那么多),所以,小编将它的对手换为了可灵3.0。
复杂指令遵循和音画同步能力
提示词:
在一个小酒馆内,一支五位成员的乐队正在角落正演唱一首民谣,镜头从广角摇镜头切换至中间成员特写镜头,然后演唱完毕,最终定格于全体成员。
HappyHorse-1.0
可灵3.0
HappyHorse 1.0的生成速度与可灵3.0相比,略微有些逊色,大概在2分钟左右。
从生成结果上来看,HappyHorse 1.0与可灵3.0生成的人像没有出现肢体异常、扭曲等问题,镜头运动、画面灯光等元素均符合提示词要求。
只不过,HappyHorse 1.0视频在刚开始时,小提琴在演奏,但并没有音乐,音画同步效果上还是有些欠缺。
多角色对话
提示词:
电影剧本中的一幕场景,发生在洒满阳光的巴黎咖啡馆内,金色的午后阳光透过拱形窗户倾泻而入。一位男子身着定制深蓝色西装,坐在一位穿着飘逸深红色连衣裙的优雅女子坐的对面,两人之间摆放着两杯咖啡。空气中弥漫着一种难以言喻的紧张气氛。他身体前倾,声音低沉而平稳:“你从一开始就心知肚明,不是吗?这一切都不是真实的。”她直视着他,脸上没有丝毫动摇,嘴角挂着一丝若有若无的微笑,缓缓搅动着手中的咖啡:“一切都是真实的。而这正是它如此危险的原因。”电影式的广角构图,温暖的金色黄昏光线,浅景深效果,胶片颗粒质感,柔和复古色彩调配以深红色点缀,服装与面部表情细节丰富,黑色浪漫美学风格,充满情感氛围,欧洲街头摄影风格,戏剧性叙事手法,35毫米胶片质感。
HappyHorse-1.0
可灵3.0
在多角色对话的镜头里,Happy Horse-1.0和可灵3.0生成的视频简直完美。
对话衔接流畅,语调也很贴合具体情境,人物的语气没有了刻意模仿人类的伪人感,停顿得也恰到好处,将提示词完美的演绎了出来,包括氛围、人物情绪、表情等。
镜头语言
提示词:
海岸缓推古人举巨齿鲨的牙对光骤推面部牙齿逆光微距定格。三段递进运镜:侧面推进→举牙对光→骤推面部逆光定格,人物表情:眉锁眼震撼困惑嘴微张手触锯齿,原始敬畏框架外,逆光冷白边,缓推骤推定格,原始敬畏,顺滑过渡,保持结构稳定避免形变。匹配音效(强)和背景音乐(弱)。
HappyHorse-1.0
可灵3.0
HappyHorse-1.0还是有一点瑕疵,在最后人物头后冒出的白烟有点让人摸不到头脑。同时在配乐上,小编认为还是可灵3.0更有感觉。
情绪和动作刻画
提示词:
封闭昏暗狭长走廊,少女孤身身处诡异走廊,正面仰拍,镜头特写神情再展开环境,双手收紧抱臂,眼神警惕环顾四周,脚步缓慢迟疑向前挪动,室内弱光,局部冷光打亮,高对比暗黑色调,大面积阴影,墙面暗光纹路、空气中浮尘粒子特效,音效:空旷走廊回声、细碎异响、压抑悬疑背景音。少女:“这里……到底是什么地方?”
HappyHorse-1.0
可灵3.0
两个视频各有不足:按照提示词,镜头应该是由近到远,而可灵3.0则是直接切的镜头,HappyHorse-1.0则是完全忽略了“向前挪动”,同时墙两边还有“鬼画符”。
相较而言,小编更倾向于可灵3.0。
物理真实性
提示词:
一个超高帧率的慢动作特写镜头,明亮的厨房内,深色橡木餐桌边缘,放着一只晶莹剔透的圆柱形玻璃杯,杯中盛有满的纯净清水,水面平静。画面左侧,一颗网球飞来,撞上玻璃杯底部右侧。杯子受力的瞬间,与桌面产生相对滑动,清水表面泛起同心涟漪。杯子随即开始倾斜坠落,摔碎在地板上。
HappyHorse-1.0
可灵3.0
在物理真实性上,HappyHorse-1.0明显效果不如可灵3.0,虽然可灵3.0生成的视频中,水杯降落时有些许瑕疵,但整体来看还不错。
HappyHorse-1.0生成的视频中,先是水直接穿模,然后杯子碎裂后却还是完整的,水体的形态变化也十分诡异。
综上结果来看,对比可灵3.0,HappyHorse 1.0还有一些再提升空间,如物理真实性、提示词遵循度、文字渲染等。
但不得不说,HappyHorse 1.0在人物对话方面做的还是非常出色的,人物神情、语气等。
目前HappyHorse 1.0也只是小试牛刀,仍在不断进化中。 开场就能有这个成色,后面的表现令人期待。
热门跟贴