ElevenLabs 7首歌日限背后：一家语音公司为何偷偷做音乐|elevenlabs|命令提示符|音乐

ElevenMusic 上线首周，App Store 音乐类排名从 400 名外冲进前 50。这个数字来自第三方监测平台 Sensor Tower，ElevenLabs 官方没发任何新闻稿——他们习惯这样，去年 8 月发音乐生成模型时也是静悄悄。

免费用户每天只能生成 7 首歌。不是 10 首，不是 5 首，是 7 首。这个精确的数字暴露了一件事：算力成本卡得很死。对比 Suno 免费版每天 10 首、Udio 每月 600 积分（约 20 首短歌），ElevenLabs 的门槛设得更克制。

一家估值 110 亿美元的语音 AI 公司，为什么突然做音乐？

答案藏在它的融资文件里。今年 2 月那轮 5 亿美元 C 轮融资，ElevenLabs 给投资人画了一张图：语音模型迟早 commoditize（商品化），必须提前卡位多模态。音乐是测试用户付费意愿的最低成本实验——比视频便宜，比纯语音有想象空间。

从"配音工具"到"创作平台"的惊险一跃

ElevenLabs 的发家史很简单：2018 年成立，靠语音克隆和文本转语音（TTS，Text-to-Speech）技术吃下播客、有声书、游戏配音三块市场。2023 年，他们的语音生成 API 被集成进 4000 多个应用，包括《纽约时报》的音频版、Character.AI 的对话角色。

但语音模型的护城河正在变浅。OpenAI 的 Whisper 开源了，Google 的 SoundStream 论文公开了，字节跳动的 Seed-TTS 今年 3 月直接放出演示视频。ElevenLabs 的 CTO Piotr Dąbkowski 去年在一次播客里承认：「纯语音技术领先窗口期，可能只剩 18 到 24 个月。」

音乐成了对冲风险的筹码。去年 8 月，ElevenLabs 发布首个音乐生成模型，强调「commercially safe」（商用安全）——意思是训练数据干净，不怕版权诉讼。今年 1 月，他们拉来格莱美提名制作人 Illmind 和 DJ Fresh，做了张全 AI 协作专辑《Convergence》。

这些动作都在为 ElevenMusic 铺路。但直到 4 月 1 日 App 正式上架，外界才意识到他们的野心不止于 B 端 API。

产品细节里的"产品经理思维"

打开 ElevenMusic，第一屏不是生成器，是「发现」页。Live stations、预置专辑、每日 mood 歌单——Focus、Energy、Relax、Late Night、Cosmic、Chill——这套交互几乎照搬 Spotify。顶部还有 Top Charts、Trending Now、New Releases，连 UI 配色都接近 Apple Music 的暗色模式。

这个设计选择很耐人寻味：它不是工具，是平台。

Suno 和 Udio 的首屏都是输入框，强调「你写词，AI 唱」。ElevenMusic 反过来，先让你听别人做的，再诱导你 remix。点击任意歌曲，右下角有个「Remix」按钮，输入文字就能改风格、换乐器、加歌词。每次 remix 消耗 1 次日限额——免费用户的 7 首歌就是这么被设计消耗的。

生成器的选项也做了取舍。长度可调、歌词开关、写作风格三选一，没有 Suno 复杂的流派标签系统，也没有 Udio 的手动编曲轨道。ElevenLabs 的产品经理显然做过减法：降低决策成本，提高完成率。

付费墙设在 $9.99/月或 $95.90/年。Pro 用户每月 500 首、500GB 云存、全风格解锁。这个价格带卡得很准——比 Suno 的 $10/月 Pro 便宜 1 美分，比 Udio 的 $12/月 Standard 低一档。年费折扣力度 20%，略高于行业平均的 15%，暗示 ElevenLabs 更想要长期订阅而非月抛用户。

藏在招聘启事里的下一步

ElevenLabs 的招聘页面有个没填满的岗位：Consumer Marketing Lead, Music Vertical。JD 里写着「设计创作者激励体系，探索版税分成模式」。这解释了为什么 App 里暂时没有创作者收益功能——基础设施还没搭完。

他们的思路可能参考了 ElevenReader。去年推出的有声书平台，让作者上传文本、AI 生成音频、按播放量分润。早期入驻的独立作者，月收入 reportedly 能达到四位数美元。ElevenMusic 大概率会复制这套：用户生成歌曲 → 进入平台曲库 → 被其他用户播放/收藏/remix → 创作者获得积分或现金。

但音乐比有声书复杂十倍。版权归属、采样检测、人声克隆授权，每个都是雷区。ElevenLabs 今年 1 月那张《Convergence》专辑，所有参与制作人都签了额外协议，明确放弃传统版税主张，换取一次性预付金。这种「买断制」能否规模化，是 ElevenMusic 能否跑通创作者经济的关键。

另一个变量是唱片公司的态度。Suno 和 Udio 去年被环球、索尼、华纳联合起诉，指控训练数据侵权。ElevenLabs 的「commercially safe」标签是主动避险，但安全不等于免疫。他们的音乐模型训练数据来自哪？官方只说是「licensed content and original compositions」，没给比例。

110 亿美元估值的算术题

按 2 月融资口径，ElevenLabs 的市销率（PS）约 25-30 倍。作为对比，Spotify 的 PS 是 3 倍，Adobe 是 10 倍。投资人赌的不是现在的收入，是「语音+音乐+视频」的多模态叙事。

ElevenLabs 今年 3 月发布的「全能创作工具」ElevenStudio，已经能一站式完成广告生成、配音、翻译、图像生成、视频剪辑、声音设计。音乐是其中唯一缺失的 consumer-facing（面向消费者）环节——ElevenMusic 补上了这块拼图。

但多模态的故事需要用户买单。ElevenLabs 的 B 端 API 收入占大头，consumer 产品 ElevenReader 和现在的 ElevenMusic 都是实验性质。一位接近公司的投资人透露，C 轮融资的 use of proceeds 里，40% 投向多模态模型研发，30% 做消费者增长，剩下 30% 是人才和算力储备。

这个分配比例说明：ElevenLabs 还没想清楚 consumer 怎么赚钱，但必须占住位置。音乐是高频、低客单价、高传播性的品类，最适合冷启动。

一个值得玩味的细节：ElevenMusic 的 7 首日限额，Pro 用户的 500 首月限额，数字都刻意避开整数。产品经理圈有个说法，非整数限额比整数更显「精打细算过的诚意」——就像 9.99 美元比 10 美元心理门槛更低。

ElevenLabs 的 CEO Mati Staniszewski 上个月在 LinkedIn 发了条动态，配图是 ElevenMusic 的日活曲线，配文只有一个词：「」。没解释，没庆祝，典型的克制。

这条动态下面，有个用户评论：「什么时候能让我用我自己的声音做歌？」Staniszewski 回了个表情。ElevenLabs 的语音克隆技术，叠加音乐生成，想象空间是「人人都是虚拟歌手」——但这步棋什么时候下，取决于版权谈判的进度。

现在打开 ElevenMusic，Focus 歌单的第一首歌叫《Neural Lullaby》，播放量 12 万，创作者 ID 是一串随机字符。评论区有人写：「这是我失眠第三周的唯一解药。」另一条回复：「试试 remix 成 drum and bass，完全另一种药。」

如果 ElevenLabs 真的上线创作者分成，这串随机字符背后的人，会愿意透露真实身份吗？