4月20日,阿里ATH正式对外公布,旗下AI视频生成模型HappyHorse 1.0将于4月27日通过阿里云百炼平台逐步开放API测试。
首批邀测对象为企业级客户,个人用户暂未列入开放范围。该模型从4月10日被阿里认领到如今公布测试日程,仅间隔10天,推进速度较快。
HappyHorse 1.0的核心能力在于一次性生成带音轨的完整视频,无需后期拼接。模型基于150亿参数、40层结构的单流自注意力Transformer架构,原生支持七种语言的唇形同步,包括英语、普通话、粤语、日语、韩语、德语和法语。
按照官方规划,4月底开放测试后,HappyHorse 1.0将于5月份正式发布商用版本。
在技术评测方面,该模型此前以匿名形式登顶全球知名评测平台Artificial Analysis的文生视频榜单,将字节跳动旗下Seedance 2.0挤至第二位。
在文本生视频不含音频的赛道上,HappyHorse 1.0的Elo得分达到1379分,高于Seedance 2.0的1273分,也高于昆仑万维SkyReels V4及快手可灵AI 3.0等主流产品。
在图像生视频不含音频的赛道上,该模型获得1411分,刷新该榜单历史纪录。
需要指出的是,Artificial Analysis的盲测样本中,人像生成与口播类内容占比超过60%,而HappyHorse在人像场景上表现突出,这一特点可能在评测结果中有所体现。
HappyHorse项目由ATH创新事业部主导,联合阿里平台技术、通义实验室及淘天技术等多个团队协同打造。
ATH事业群是阿里巴巴CEO吴泳铭于3月成立并亲自负责的部门,整合了通义实验室、MaaS业务线、千问事业部、悟空事业部及AI创新事业部五大板块。
据彭博报道,阿里此前推出的Wan品牌视频生成器在Artificial Analysis榜单上的最高排名约为第20位,HappyHorse此次登顶意味着阿里在视频AI领域的排名有了明显提升。
从行业竞争格局来看,字节跳动的Seedance 2.0于今年初上线后,凭借多模态能力快速获取市场关注;快手的可灵AI 3.0则依托短视频生态积累了大量用户基础。
HappyHorse 1.0目前仅面向企业客户开放,普通用户短期内尚无法直接体验。这款模型在榜单上的领先表现,能否在真实业务场景中转化为用户体验的优势,仍有待4月27日测试开启后进一步观察。
热门跟贴