Stability AI发布了一个名为“Stable Audio Open”的人工智能模型,可以从文本生成各种音频样本。顾名思义,该模型是专为声音设计师、音乐家和创意专业人士设计的开源模型。

您可以创建用于音乐制作的各种材料

Stable Audio Open由 AI 图像生成器 Stable Diffusion 的创建者 Stability AI 开发,可简化长达 47 秒的鼓点、乐器连复段、环境声音以及音乐制作和声音设计所需的其他音频元素。从文本提示。

要使用稳定音频打开,您必须首先从Hugging Face下载它。用户还可以使用自己的音频数据修改和定制模型。 Stability AI 希望声音设计师、音乐家、开发人员和发烧友下载模型并提供反馈。

与付费产品 Stable Audio 2(允许您创建长达三分钟的音频源)不同,Stable Audio Open 专注于短音频样本和音效。它并不是为了生成完整的歌曲、旋律或人声而设计的。

Stable Audio Open 的开发是为了展示生成式人工智能在声音设计方面的潜力,同时确保创意社区负责任的发展。因此,为了保护创作者的权益,使用来自FreeSound和Free Music Archive的音频数据来训练Stable Audio Open。

Stability AI:引入稳定音频开放 - 音频样本和声音设计的开源模型