前阵子 AI 视频圈最热闹的事,可能就是竞技场那匹黑马 HappyHorse。它没有正式发布,没有完整介绍,甚至连背后的公司是谁都不清楚。
更有意思的是,产品还没真正开放,市场已经先替它完成了一轮商业验证。大量仿冒套壳擦边版 “ HappyHorse ” 一夜之间涌现,名字、界面、话术都在蹭这匹神秘黑马。某种程度上,HappyHorse 已经变成了一个流量符号。
直到最近,这场猜马游戏终于有了答案。阿里 ATH 团队正式认领这匹竞技场黑马,并同时开放了 HappyHorse-1.0 灰测。
官网地址 www.happyhorse.cn
而在知危编辑部第一时间上手 HappyHorse-1.0 后,我们发现它真正值得关注的地方,可能不只是效果好,而是它正在用高质感和低成本,重新定义 AI 视频生成的商业门槛。
这次 HappyHorse 主要开放了两项功能:视频生成和视频编辑。
我们先试了最核心的视频生成。实际跑下来,它的等待时间大概在 3 到 5 分钟,单次最长能生成 15 秒视频,画质可以选 720P 或 1080P,参考图最多支持 9 张。
在实际测试里,没有参考图的情况下,我们只用了一段不到 100 字的提示词,就生成了一支质感不错的纪录片风格片段。
视频整体音画同步完成度相当高。比如手掌揉过面团时细碎的摩擦声,面板随着揉面节奏撞击案台的声音,都能跟手部动作对上节拍。
而在加入参考图之后,抽卡出片明显更稳定了。我们用一张参考图,一句简短提示词生成了一支 15s 汉堡广告片,最终画面不管是运镜、配乐还是镜头氛围,都比较接近成熟商业广告短片。
我们还尝试了经典电影桥段的复刻。在参考图基础上,需要提示词里把环境、运镜、台词、音效、节奏等等细节描述得更准确。
结果同样不错,前后一致性强,人物表演比较有情绪张力。
尤其是镜头指令遵循,什么时候切镜、怎么切、在哪个时间点推进叙事,模型基本都能按提示词执行。
比如我们在下面的视频提示词中描述,5-10s,镜头要拉开到稍远的远景,俯拍人物:
多轮测试后,我们也摸索出了 HappyHorse-1.0 目前比较清晰的使用方法。
如果只是随手生成,它已经能给出不错的质感;但如果想提高抽卡成功率,最好还是先用 GPT-Image-2 做出参考图,再配合结构化提示词,把各种画面细节写清楚。提示词越具体,模型给出的结果越接近商业可用。
当然,它也不是没有短板。目前,HappyHorse 在台词的情感层次,以及武打动作等复杂物理调度上,还有明显提升空间。
而在视频编辑方面,HappyHorse 可以直接通过文字指令修改画面,也可以叠加参考图,对局部元素进行二次调整。这一部分里,它同样展现出了较强的指令遵循能力。
比如局部改动,我们提供了一张粉色口罩的参考图,让它给视频中的人物戴上。实际效果里,口罩和面部贴合非常自然。
在大场景变化下,主体一致性也依然保持得不错。比如下面这个案例,我们把暴雨场景改成雨过天晴,光线发生了变化,但人物外貌和动作没有漂移。
整体测试下来,HappyHorse-1.0 的视频生成效果,已经算是目前视频模型里比较优秀的一个。
除了效果,他的价格优势也是值得一提的。
视频模型行业现在在商业化落地方面过得并不是特别好,即使它们画面精致,目前落地也依然有很多阻碍。
因为商业内容生产,本质上不是偶然抽出一个惊艳样片,而是持续、批量、可控地生产素材。这也决定了视频模型想打开商业化的市场,至少要过两道门槛:成本和可控性。
先看成本,可以说,AI 视频生成天然就是一个成本敏感型工具。分辨率提高、时长加长、重试次数变多,价格可能呈指数级增长。对专业影视团队来说,贵一点也许还能接受,但对普通创作者、MCN、小商家来说,一条视频多花几块钱,放到几十几百条素材里,就是实打实的预算压力。
而我们实际体验下来,HappyHorse 还是比较有性价比的。目前在 HappyHorse 官网生成 720P 的 5 秒视频,只要 2.2 元( 0.44 元/秒 ),这是最常见的包月价格第 2 档,也就是专业用户最常选择的套餐,跟其他视频平台相比打了 62 折。企业级客户通过阿里云调用 API 接口没有门槛限制,不需要一次性预缴千万级费用。
这个差距单看一秒并不夸张,但如果放到批量内容生产里,比如制作一部单集 5 分半、共 60 集的短剧,就能省下一万元以上。
再看可控性。现实世界里的商业内容,并不只是要一段利于传播的奇观视频,更多时候,创作者需要一段能直接被剪进成片、服务叙事、和前后镜头接上的素材。
这意味着,模型能否准确理解提示词,再把各种视频细节尽可能转化为可控的变量,是影响 AI 视频模型商业落地的关键。
从测试结果看,HappyHorse 在这一点上的优势,主要集中在中近景内容。它在大光圈、浅景深、强氛围感的镜头表达上完成度较高,指令遵循能力较强。
而这恰好对应了广告、电商、短剧等社媒素材里的高频需求。这类内容通常不需要复杂的大场面调度,却非常依赖商品质感、人物情绪和镜头节奏的稳定性。
如果说去年的 AI 视频赛道,还在执着于比拼生成更震撼的奇观镜头,那么今年,这场竞争已经全面迈入更务实的商业落地阶段。
AI 视频模型能力的提升,正在重塑广告、电商、短剧等内容的生产方式。
更重要的是,从今年我们看得出,HappyHorse 等国产 AI 视频模型,彻底扭转了国产模型跟在海外模型后面补课的局面,变成了行业的带头者。过去是别人发布一个新模型,国内团队追着补齐短板;现在,新的变量和新的想象力,正在从中国模型开始。
从做 AI 视频找乐子,到进入真实的内容生产链条,国产 AI 视频模型的商业拐点,正在到来。
热门跟贴