打开网易新闻 查看精彩图片

ElevenMusic 上线首周,App Store 音乐类排名从 400 名外冲进前 50。这个数字来自第三方监测平台 Sensor Tower,ElevenLabs 官方没发任何新闻稿——他们习惯这样,去年 8 月发音乐生成模型时也是静悄悄。

免费用户每天只能生成 7 首歌。不是 10 首,不是 5 首,是 7 首。这个精确的数字暴露了一件事:算力成本卡得很死。对比 Suno 免费版每天 10 首、Udio 每月 600 积分(约 20 首短歌),ElevenLabs 的门槛设得更克制。

一家估值 110 亿美元的语音 AI 公司,为什么突然做音乐?

答案藏在它的融资文件里。今年 2 月那轮 5 亿美元 C 轮融资,ElevenLabs 给投资人画了一张图:语音模型迟早 commoditize(商品化),必须提前卡位多模态。音乐是测试用户付费意愿的最低成本实验——比视频便宜,比纯语音有想象空间。

从"配音工具"到"创作平台"的惊险一跃

从"配音工具"到"创作平台"的惊险一跃

ElevenLabs 的发家史很简单:2018 年成立,靠语音克隆和文本转语音(TTS,Text-to-Speech)技术吃下播客、有声书、游戏配音三块市场。2023 年,他们的语音生成 API 被集成进 4000 多个应用,包括《纽约时报》的音频版、Character.AI 的对话角色。

但语音模型的护城河正在变浅。OpenAI 的 Whisper 开源了,Google 的 SoundStream 论文公开了,字节跳动的 Seed-TTS 今年 3 月直接放出演示视频。ElevenLabs 的 CTO Piotr Dąbkowski 去年在一次播客里承认:「纯语音技术领先窗口期,可能只剩 18 到 24 个月。」

音乐成了对冲风险的筹码。去年 8 月,ElevenLabs 发布首个音乐生成模型,强调「commercially safe」(商用安全)——意思是训练数据干净,不怕版权诉讼。今年 1 月,他们拉来格莱美提名制作人 Illmind 和 DJ Fresh,做了张全 AI 协作专辑《Convergence》。

这些动作都在为 ElevenMusic 铺路。但直到 4 月 1 日 App 正式上架,外界才意识到他们的野心不止于 B 端 API。

产品细节里的"产品经理思维"

产品细节里的"产品经理思维"

打开 ElevenMusic,第一屏不是生成器,是「发现」页。Live stations、预置专辑、每日 mood 歌单——Focus、Energy、Relax、Late Night、Cosmic、Chill——这套交互几乎照搬 Spotify。顶部还有 Top Charts、Trending Now、New Releases,连 UI 配色都接近 Apple Music 的暗色模式。

这个设计选择很耐人寻味:它不是工具,是平台。

Suno 和 Udio 的首屏都是输入框,强调「你写词,AI 唱」。ElevenMusic 反过来,先让你听别人做的,再诱导你 remix。点击任意歌曲,右下角有个「Remix」按钮,输入文字就能改风格、换乐器、加歌词。每次 remix 消耗 1 次日限额——免费用户的 7 首歌就是这么被设计消耗的。

生成器的选项也做了取舍。长度可调、歌词开关、写作风格三选一,没有 Suno 复杂的流派标签系统,也没有 Udio 的手动编曲轨道。ElevenLabs 的产品经理显然做过减法:降低决策成本,提高完成率。

付费墙设在 $9.99/月 或 $95.90/年。Pro 用户每月 500 首、500GB 云存、全风格解锁。这个价格带卡得很准——比 Suno 的 $10/月 Pro 便宜 1 美分,比 Udio 的 $12/月 Standard 低一档。年费折扣力度 20%,略高于行业平均的 15%,暗示 ElevenLabs 更想要长期订阅而非月抛用户。

打开网易新闻 查看精彩图片

藏在招聘启事里的下一步

藏在招聘启事里的下一步

ElevenLabs 的招聘页面有个没填满的岗位:Consumer Marketing Lead, Music Vertical。JD 里写着「设计创作者激励体系,探索版税分成模式」。这解释了为什么 App 里暂时没有创作者收益功能——基础设施还没搭完。

他们的思路可能参考了 ElevenReader。去年推出的有声书平台,让作者上传文本、AI 生成音频、按播放量分润。早期入驻的独立作者,月收入 reportedly 能达到四位数美元。ElevenMusic 大概率会复制这套:用户生成歌曲 → 进入平台曲库 → 被其他用户播放/收藏/remix → 创作者获得积分或现金。

但音乐比有声书复杂十倍。版权归属、采样检测、人声克隆授权,每个都是雷区。ElevenLabs 今年 1 月那张《Convergence》专辑,所有参与制作人都签了额外协议,明确放弃传统版税主张,换取一次性预付金。这种「买断制」能否规模化,是 ElevenMusic 能否跑通创作者经济的关键。

另一个变量是唱片公司的态度。Suno 和 Udio 去年被环球、索尼、华纳联合起诉,指控训练数据侵权。ElevenLabs 的「commercially safe」标签是主动避险,但安全不等于免疫。他们的音乐模型训练数据来自哪?官方只说是「licensed content and original compositions」,没给比例。

110 亿美元估值的算术题

110 亿美元估值的算术题

按 2 月融资口径,ElevenLabs 的市销率(PS)约 25-30 倍。作为对比,Spotify 的 PS 是 3 倍,Adobe 是 10 倍。投资人赌的不是现在的收入,是「语音+音乐+视频」的多模态叙事。

ElevenLabs 今年 3 月发布的「全能创作工具」ElevenStudio,已经能一站式完成广告生成、配音、翻译、图像生成、视频剪辑、声音设计。音乐是其中唯一缺失的 consumer-facing(面向消费者)环节——ElevenMusic 补上了这块拼图。

但多模态的故事需要用户买单。ElevenLabs 的 B 端 API 收入占大头,consumer 产品 ElevenReader 和现在的 ElevenMusic 都是实验性质。一位接近公司的投资人透露,C 轮融资的 use of proceeds 里,40% 投向多模态模型研发,30% 做消费者增长,剩下 30% 是人才和算力储备。

这个分配比例说明:ElevenLabs 还没想清楚 consumer 怎么赚钱,但必须占住位置。音乐是高频、低客单价、高传播性的品类,最适合冷启动。

一个值得玩味的细节:ElevenMusic 的 7 首日限额,Pro 用户的 500 首月限额,数字都刻意避开整数。产品经理圈有个说法,非整数限额比整数更显「精打细算过的诚意」——就像 9.99 美元比 10 美元心理门槛更低。

ElevenLabs 的 CEO Mati Staniszewski 上个月在 LinkedIn 发了条动态,配图是 ElevenMusic 的日活曲线,配文只有一个词:「」。没解释,没庆祝,典型的克制。

这条动态下面,有个用户评论:「什么时候能让我用我自己的声音做歌?」Staniszewski 回了个 表情。ElevenLabs 的语音克隆技术,叠加音乐生成,想象空间是「人人都是虚拟歌手」——但这步棋什么时候下,取决于版权谈判的进度。

现在打开 ElevenMusic,Focus 歌单的第一首歌叫《Neural Lullaby》,播放量 12 万,创作者 ID 是一串随机字符。评论区有人写:「这是我失眠第三周的唯一解药。」另一条回复:「试试 remix 成 drum and bass,完全另一种药。」

如果 ElevenLabs 真的上线创作者分成,这串随机字符背后的人,会愿意透露真实身份吗?