你刚听完一首歌的前奏,以为是歌剧,副歌部分突然变成了重金属,间奏还混进了一段雨声和雷声。这不是什么实验音乐人的新专辑,而是语音人工智能公司十一实验室刚刚发布的音乐生成模型Music v2能干的事。
距这家公司首次推出音乐生成模型快十个月了,新版本这次主打的卖点,就是让模型在一条音轨内部完成风格切换,同时还能把复杂的人声处理和作曲逻辑揉在一起跑。官方直接举了例子:从歌剧到重金属再切回来,中间还能插一轨快到听不清词的说唱,保证不崩。更夸张的是,它可以给曲子加上非音乐类的音效。
十一实验室对创作控制权的设计,倒是把实用主义写在脸上了。艺术家现在不用像以前那样,每次只能让模型吐出一段十几秒的片段再手动拼。Music v2允许按歌曲结构来搭建:前奏、主歌、副歌分开生成,最后再缝成一条完整的音轨。修音也变得更像一个修补工具,选中曲子里需要改的那一小块,用提示词重新生成,其他部分纹丝不动。这种局部重绘的逻辑,对于做商业配乐的人,算是把返工成本往下拽了拽。公司还强调,模型在跨语言、歌词咬合、人声表现和编曲结构上的稳定性都有提升。
把时间线拉长看,最近几个月大模型厂商在专业级音乐生成这条赛道上,油门都快踩进油箱里了。谷歌、稳定人工智能、Suno都发过新模型,方向出奇一致:更长、更复杂的曲子,以及更细的编辑颗粒度。谷歌在开发者大会上的演示格外具体——用它的Flow Music工具,给一首歌换编曲风格做翻唱,或者按段落拆开编辑,还能顺手生成一支音乐视频。整个行业的竞争焦点,已经从“能不能生成一首能听的歌”,迅速滑到了“能不能让创作者用起来足够顺手”的阶段。
不过,最让商业用户松一口气的,可能是版权这根刺被十一实验室主动拔掉了。公司特意点出,Music v2的训练数据全部来自已获授权的素材,生成的音轨明确标注为可商用。这个表态放在当下的行业背景里,指向性太明显了。同样是做AI音乐的Suno和Udio,已经被唱片公司拖进了版权诉讼的泥潭。几家巨头心里都清楚,跟版权方坐下来谈授权,已经不是锦上添花,是绕不过去的生存门槛。
目前这个新模型已经放进十一实验室的ElevenCreative工具里,主要面向市场营销和品牌创意团队。同期上线的还有一个独立平台ElevenMusic,专门用来生成AI歌曲。接入ElevenAPI的开放接口则还需要再等一等。整个产品布局的意图很明确:先把企业和创作者服务稳,让商业落地的路径跑通,至于开发者生态的放大效应,那是下一步的事。
热门跟贴