阿里云视频生成模型 HappyHorse 1.1 发布|happyhorse|人物|动作|真实感|知名企业|视觉|阿里云

6月23日，据阿里云消息，视频生成模型 HappyHorse 1.1 正式发布，并已同步登陆 HappyHorse 官网、千问云及阿里云百炼平台。

作为 HappyHorse 1.0 的升级版本，HappyHorse 1.1 围绕动态表现力、主体一致性、指令遵循能力、视觉呈现质量和音频表达能力等方面进行了系统优化，进一步提升模型在专业内容生产场景中的创作质量、可控性与应用效率。

据介绍，HappyHorse 1.1 针对此前版本在部分画面中存在的动作迟缓、节奏不足等问题，对运动建模与时序一致性能力进行了优化。

在复杂动作场景中，新版本可提升动作衔接的连贯性和力量感，使人物运动、镜头变化以及高动态画面呈现更加稳定。对于打斗、奔跑、转身、跟拍等场景，模型在动态理解和画面连续性方面均有所增强。

在主体一致性方面，HappyHorse 1.1 提升了多图参考生视频能力。新版本支持最多 9 张角色参考图同时输入，可用于增强角色、商品和品牌元素在不同镜头中的稳定性。该能力适用于多角色短剧、直播带货、多人物广告等场景，有助于在多分镜生成过程中保持人物形象、商品细节和品牌视觉元素的一致。

指令遵循能力也是此次升级的重点之一。HappyHorse 1.1 强化了长上下文语义理解与镜头编排稳定性，可适配简洁提示词和复杂提示词两类输入需求。

对于打斗等高强度动态场景，用户通过较为简洁的描述即可让模型理解画面意图；对于包含多场景、多角色和连续叙事的复杂输入，新版本也可进行更连贯的演绎与呈现。

视觉呈现质量方面，HappyHorse 1.1 对用户此前反馈较多的“油光感”“过度锐化”等问题进行了优化。新版本在保留法令纹、毛孔等面部细节真实感的基础上，降低画面涂抹感，使人物皮肤和整体画面质感更自然。同时，模型还增强了对正反打、跟拍等专业镜头语言的理解能力，可更好适配短剧、广告等对画面表现有较高要求的内容制作场景。

音频表达能力方面，HappyHorse 1.1 对台词表达、音效描述和音画同步进行了优化。

根据官方介绍，新版本可根据场景与情绪变化动态调整台词语速、停顿和语气。用户也可在提示词中描述背景音乐、环境音效等声音元素，使生成视频具备更完整的声音表现。同时，模型进一步提升了音画同步精度，降低声音与画面动作之间出现错位的情况。

此次 HappyHorse 1.1 已在多个平台开放体验。用户可通过 HappyHorse 官网、千问云以及阿里云百炼平台使用该模型。价格方面，HappyHorse 1.1 上线期间提供限时 6 折优惠。720p 分辨率官方刊例价为 0.9 元/秒，折后价格为 0.54 元/秒；1080p 分辨率官方刊例价为 1.2 元/秒，折后价格为 0.72 元/秒。

据了解，HappyHorse 1.1 主要面向专业内容生产场景，覆盖短剧制作、广告创意、直播带货、多角色视频、多分镜内容生成等应用方向。通过本次升级，模型在视频动态表现、角色稳定性、画面真实感、复杂指令理解以及声音表达等方面进一步完善，为创作者和企业用户提供了更高效的视频生成工具。

PS:

见实7月将分别在上海、广州发起，还有3场走进南京、杭州、北京的线下游学+异业合作也在报名中，欢迎下方加入会员一起。