3月10日消息,魔乐社区(Modelers)宣布已上架由阶跃星辰自研的 Step-Video 视频生成和 Step-Audio 语音模型两款开源多模态大模型,并基于华为昇腾 CANN 异构计算架构和昇腾服务器,完成了对模型的适配。开发者和企业用户在魔乐社区中可以直接下载并体验。

据了解,Step-Video-T2V 是目前全球参数量最大的开源视频生成模型,达到300亿参数。可直接生成204帧、540P分辨率的高质量视频。根据阶跃星辰此前公布评测结果,Step-Video-T2V 在指令遵循、运动平滑性、物理合理性、美感度等方面的表现均显著超过市面上既有的效果最佳的开源视频模型;而 Step-Audio 是行业内首款产品级开源语音交互大模型,能生成多种情感、方言、语言、唱腔及个性化风格的语音。阶跃星辰在不久前的生态开放日上透露,3月份还将开源图生视频模型。

据悉,魔乐社区由天翼云与华为联合打造,面向 AI 开发者与技术爱好者,提供模型、数据集、开发工具链与应用的一站式托管与展示服务。(定西)

本文来自网易科技报道,更多资讯和深度内容,关注我们。