视频生成赛道最近冒出一匹黑马——字面意义上的"马"。
一个代号 HappyHorse-1.0 的神秘模型,悄无声息登顶 Artificial Analysis 的 AI Video Arena 排行榜。不是第二第三,是三项第一全包:文本转视频、图像转视频、带音频生成,把 Seedance 2.0 和可灵按在地上摩擦。
分数差得有点侮辱人。HappyHorse-1.0 的 Elo 1375,甩开第二名整整 100 分。作为参照,从第二到第十名的差距,拢共也就 50 分。这相当于马拉松比赛里,第一名冲线时第二名还在补水站。
更离谱的是图像转视频赛道——1409 分,直接刷新该榜单历史纪录。
我亲自下场试了试盲测。十几轮下来,但凡有"欢乐马"的选项,我基本都在给它投票。不是刻意站队,是画面确实骗过了眼睛。
比如这场"长枪短炮"的新闻发布会。右边画面色调沉稳,特写切近景再拉远景,镜头语言像电影开场;左边血红的天空红得发假,人物站位也透着一股 AI 特有的违和感。揭晓答案:右边是 HappyHorse,左边是 Pyramid-Flow。
再比如实验室场景。左边镜头推进太快,破坏了专注工作的安静氛围;右边不仅速度克制,人物面部纹理也更真实——左边光滑得像开了十级美颜,右边能看到皮肤该有的细节。答案又是右边那匹"马",左边是 PixVerse V6。
这种差距很难用参数解释,更像审美层面的降维打击。
技术层面目前披露的信息:40 层单流 Transformer,原生音视频同步,8 步去噪出 1080P,H100 上 5 秒片段只要 38 秒。关键是据说完全开源——基础模型、蒸馏版、超分、推理代码全放。
至于幕后团队,多方指向阿里淘天集团未来生活实验室,负责人是张迪。这位履历相当跳跃:阿里十年老兵,2020 年去快手搞出可灵 1.0/2.0,今年 9 月短暂加入 B 站,11 月又回阿里。职级 P11,直接向淘天首席科学家汇报。
目前 HappyHorse-1.0 还处于"三无"状态:无官网(出现的几个都被打假)、无技术报告、无代码库。有消息称团队正在赶工,10 号正式发布。
有意思的是,这个盲测机制的设计——数千名真实用户在完全不知情的情况下二选一,相当于让模型靠"脸"吃饭。没有品牌加持,没有参数堆砌,纯凭画面说话。而多数用户的手,诚实地指向了那匹突然出现的"马"。
热门跟贴