6月23日,据阿里云消息,视频生成模型 HappyHorse 1.1 正式发布,并已同步登陆 HappyHorse 官网、千问云及阿里云百炼平台。
作为 HappyHorse 1.0 的升级版本,HappyHorse 1.1 围绕动态表现力、主体一致性、指令遵循能力、视觉呈现质量和音频表达能力等方面进行了系统优化,进一步提升模型在专业内容生产场景中的创作质量、可控性与应用效率。
据介绍,HappyHorse 1.1 针对此前版本在部分画面中存在的动作迟缓、节奏不足等问题,对运动建模与时序一致性能力进行了优化。
在复杂动作场景中,新版本可提升动作衔接的连贯性和力量感,使人物运动、镜头变化以及高动态画面呈现更加稳定。对于打斗、奔跑、转身、跟拍等场景,模型在动态理解和画面连续性方面均有所增强。
在主体一致性方面,HappyHorse 1.1 提升了多图参考生视频能力。新版本支持最多 9 张角色参考图同时输入,可用于增强角色、商品和品牌元素在不同镜头中的稳定性。该能力适用于多角色短剧、直播带货、多人物广告等场景,有助于在多分镜生成过程中保持人物形象、商品细节和品牌视觉元素的一致。
指令遵循能力也是此次升级的重点之一。HappyHorse 1.1 强化了长上下文语义理解与镜头编排稳定性,可适配简洁提示词和复杂提示词两类输入需求。
对于打斗等高强度动态场景,用户通过较为简洁的描述即可让模型理解画面意图;对于包含多场景、多角色和连续叙事的复杂输入,新版本也可进行更连贯的演绎与呈现。
视觉呈现质量方面,HappyHorse 1.1 对用户此前反馈较多的“油光感”“过度锐化”等问题进行了优化。新版本在保留法令纹、毛孔等面部细节真实感的基础上,降低画面涂抹感,使人物皮肤和整体画面质感更自然。同时,模型还增强了对正反打、跟拍等专业镜头语言的理解能力,可更好适配短剧、广告等对画面表现有较高要求的内容制作场景。
音频表达能力方面,HappyHorse 1.1 对台词表达、音效描述和音画同步进行了优化。
根据官方介绍,新版本可根据场景与情绪变化动态调整台词语速、停顿和语气。用户也可在提示词中描述背景音乐、环境音效等声音元素,使生成视频具备更完整的声音表现。同时,模型进一步提升了音画同步精度,降低声音与画面动作之间出现错位的情况。
此次 HappyHorse 1.1 已在多个平台开放体验。用户可通过 HappyHorse 官网、千问云以及阿里云百炼平台使用该模型。价格方面,HappyHorse 1.1 上线期间提供限时 6 折优惠。720p 分辨率官方刊例价为 0.9 元/秒,折后价格为 0.54 元/秒;1080p 分辨率官方刊例价为 1.2 元/秒,折后价格为 0.72 元/秒。
据了解,HappyHorse 1.1 主要面向专业内容生产场景,覆盖短剧制作、广告创意、直播带货、多角色视频、多分镜内容生成等应用方向。通过本次升级,模型在视频动态表现、角色稳定性、画面真实感、复杂指令理解以及声音表达等方面进一步完善,为创作者和企业用户提供了更高效的视频生成工具。
PS:
见实7月将分别在上海、广州发起,还有3场走进南京、杭州、北京的线下游学+异业合作也在报名中,欢迎下方加入会员一起。
热门跟贴