一年前,Suno的CEO Mikey Shulman在播客里放狠话,说“做音乐对大多数人来说并不享受,而Suno是音乐界的减肥药,人人都想用,但没人愿意承认。”

这话当时惹炸了锅,音乐人骂他是外行人破坏行业。

但数据不会撒谎:Suno已经攒了2500万用户,每天生成的歌曲比Spotify上架的新歌还多。

那么谁是中国版的Suno呢?有没有可能,我们本土的AI音乐平台可以更强?

就今天1月28号,昆仑万维发布了Mureka V8,旗下音乐大模型的又一成果。

他们抛出了一个比Suno更能定义行业的概念:"好的AI音乐是一种新的音乐品类"。

就像我们当年觉得,抖音神曲不算正经音乐、登不得大雅之堂,但现在谁也不敢否认它是一个独立品类了。

AI音乐,也正在经历同样的认知转变——从玩具变成日常,从替代品变成新物种。

打开网易新闻 查看精彩图片

01. Mureka V8到底能不能打?

要聊V8,避不开Suno V5。

Suno现在的江湖地位是实打实的,连我那个对科技毫无兴趣的音乐老师朋友,都在偷偷用Suno写歌。

而且据他说,搞音乐、做编曲的,都在偷偷用,而且用起来太爽了;音乐学校里学生老师都用,但老师更不好意思让人知道。

打开网易新闻 查看精彩图片

看盲测数据,Mureka V8的各项指标,音乐旋律性、人声表现力、编曲和结构、情绪表达与渲染,都超过了Suno,也超过了之前版本的自己。

前几天拿到了V8的内测权限,做了一个对比测试:把同样的Prompt分别喂给Suno V5和Mureka V8,然后发给两个做音乐的朋友盲听。

Prompt很简单:

孟菲斯说唱(Memphis Rap),男声,要像SKAI ISYOURGOD那种黑暗、缓慢、像咒语一样的Flow,要有铜管乐的阴郁感。

结果让我有点意外。Suno V5还是非常稳得,一开口就是那个味道——深不见底的Beat,人声处理得恰到好处,那股子地下嘻哈的狠劲是对的。

打开网易新闻 查看精彩图片

也有不好的地方,比较偏西方的暗黑阴间的风格,说实话我没有那么喜欢,可能因为训练语料的原因,不太有东方宫商角徵羽那种传统五声音阶的韵味。

而且最新V5版本也是需要付费解锁。

V8的表现不能说接近,是很不一样。

Suno是在还原风格,V8是在拆解情绪。V8生成的人声在句尾处理上更"脏",那种故意快要破音又没破的边缘感,很像人类歌手唱到激动时的反应,有点嘶吼。

我自己学了很多年民谣吉他,这两年又在弹电吉他,也喜欢一些乐队。

能听出来,在转音的处理上,V8没有Suno那么规矩,它会冒险做一些不太和谐的滑音,就像吉他手的现场solo一样。

从音乐理论上看可能不够正确,但听起来更真实、更有味儿。

真正拉开差距的是Hook,旋律的记忆点。

Suno V4.5之后的版本确实能写 catchy 的旋律,但那种 catch 是算法优化过的安全牌,听三遍能记住,但不会有"这旋律是从哪冒出来的"那种惊艳感。

V8在Hook写作上显得更大胆,它敢用更大的音程跳跃,敢在副歌前突然留白半拍。

就感觉,它知道什么时候该给你刺激,什么时候该让你悬空。

打开网易新闻 查看精彩图片

再就是,Mureka的多语言支持显然更友好,中文咬字的清晰度明显优于Suno那种假装懂中文的含糊感。

导出的形式也很丰富:从音频到视频,自动呈现的审美质感也很到位,有点小时候第一次用网易云的感觉。

打开网易新闻 查看精彩图片

如果想换语言,也可以直接修改切换。

打开网易新闻 查看精彩图片

中文曲目变成英文歌,节奏和效果依然非常稳定。

还有很值得注意的是V8的结构丰富性。

以前AI生成的歌像是搭乐高,A段-B段-A段-B段, 非常单一可预测,很多音乐裁缝,把歌写得都差不多。

V8开始做更复杂的叙事结构,比如突然插入一个Bridge,或者在第三分钟突然变调。

一首歌生成完毕,可以二次编辑,把音乐做结构化的调整和完善。

打开网易新闻 查看精彩图片

不仅能剪切或者延长,也可以把局部做修改。

打开网易新闻 查看精彩图片

像我之前用Suno,就会有很小的片段不满意的情况,现在在Mureka V8里,编辑就很灵活可控了。

打开网易新闻 查看精彩图片

这种能力对专业制作人、或者普通创作者来说,都是解放,因为拿到的不再是一个Demo框架,是一个有完整叙事的作品。

02. 因为Mureka V8,音乐创作流程变了

我有个音乐人朋友叫土豆,之前在接受采访的时候说,Suno还不能成为制作级的工具,因为如果提出个性又专业的需求,尤其本土特色的,它听不懂。

要特定的国内喜欢的和弦、特定的速度、特定的节奏型,它就懵了。

这话其实说出了AI音乐之前的痛点:它降低了门槛,但只降低到了爱好者级别,没触及到创作者的真正工作流。

后来Suno出了Studio模式,效果会好些。

打开网易新闻 查看精彩图片

再到Mureka V8的阶段,专业制作人不仅能用,更是可以重新定义创作这件事。

我用V8做了一个完整的创作测试:从灵感到成品。

输入的Prompt很模糊——"像夏天傍晚突然意识到青春结束了的感觉"。

V8给了我两个版本,一个偏英式摇滚,一个偏Dream Pop。

打开网易新闻 查看精彩图片

我选择了一个版本作为起点,然后进入Mureka Studio进行调整。

这里的交互逻辑和传统DAW工具完全不同。

我不用操作软件,只需要对话就好了,告诉它:"把好副歌前的吉他去掉,换成弦乐,情绪再压抑一点。"

打开网易新闻 查看精彩图片

很快,它就改好了。

这种感觉就像是,以前是自己辛辛苦苦学乐器、学乐理,现在变成了有一个超级音乐大师作为系统,可以附在身上。

之前做音乐,得学会乐理、学和声、学软件操作,相当于要先掌握一套复杂的语言体系才能表达。

现在更需要有审美和品味了,知道自己想要什么。

就像Mikey Shulman说,"品味是唯一重要的东西,技能将变得不重要",虽然这话听着很狂,但在V8的实际体验中,我确实感受到了这种趋势。

打开网易新闻 查看精彩图片

但这引发了一个问题:当技能不值钱了,那音乐人还剩下什么?

我在发布会现场也和朋友聊了这个问题。

一个做电子音乐的制作人,是这么说的:"我觉得自己反而更值钱了。以前花80%的时间在技术上,20%在创意上;现在我可以花100%的时间在创意上。AI是我的执行团队,而我变成了创意总监。"

还有更现实的。

像我自己,还有身边KOL朋友,之前为了找背景音乐,要么付费买版权,要么冒着侵权风险用流行歌。

现在很多都是用V8生成"梗曲"——

比如关于"春节前加班"的吐槽歌,输入关键词"过年、社畜、崩溃、想回家、电子舞曲",出来的作品直接可用,而且副歌那个不断攀升的合成器音色,也特别契合情绪的递进。

打开网易新闻 查看精彩图片

这条视频24小时破了百万播放。

这种快反馈也是V8最大的杀伤力:创作变得像发朋友圈一样无负担,但产出的质量却像录了十遍的正式单曲。

而且我发现,用Mureka V8写歌玩梗,或者临时场景助兴,特别有意思。

抖音火的时候,我就在想,在上面发音乐能不能成为社交货币?能不能在人际关系中流通?

现在看,抖音上的AI神曲,早就已经有了千万粉丝。

打开网易新闻 查看精彩图片

Suno刚刚兴起的时候,AI孙燕姿翻唱的各种稀奇古怪的歌,特朗普和拜登的声音生成的rap battle,都很火。

现在用V8,效果远远好于那时候。

核心还是趣味性和参与感。

Mureka V8,真的已经让所有人都可以参与到音乐创作、写歌玩歌的游戏里。

V8支持的声音克隆和风格迁移,喜欢的歌手、风格,就像之前生图、生视频里的垫图一样,可以把歌参考进去。

打开网易新闻 查看精彩图片

我找了一首Taylor Swift的新主打歌,The Fate of Ophelia,据说这首歌也是AI参与写成的。

打开网易新闻 查看精彩图片

作为参考曲目,放进来,然后还是可以自定义歌词、风格、元素等等。

实际效果我非常喜欢,就是严格保留了我想要的音乐特征,也加入了自己新的想法。

打开网易新闻 查看精彩图片

我还特意自己又编辑了封面和歌名,仪式感真的到位了。

已经快过年了,我和很多朋友过年期间还得加班工作。

于是我就搞了一首《新年加班列车》,送给自己和同事们。

打开网易新闻 查看精彩图片

不夸张说,这首歌我可以单曲循环听,而且立体音,戴上耳机以后的质感会更好。

感觉是能够春节档当《年会不能停》主题曲的那种。

以前AI生成的音乐,尤其海外产品,中文歌词的处理非常差,就像是周杰伦的曲,配上了小学生写的词。

现在虽然不一定达到了方文山的水准,但真的词已经能让人有共鸣了。

最后的低声哼唱,还有和声的处理以及和歌词的结合,都让我觉得自己仿佛可以原地出道了。

以前编这种歌,或者想要搞鬼畜,都需要大量的音频剪辑和对轨,是个技术活;

现在不管是表达个性,或者送给朋友一首专属的生日快乐歌,再或者是一个公司、一个班级创作一首共同的音乐,都很方便,而且都很想分享。

好玩、让人有共鸣、让人自发想传播,才是硬道理。

打开网易新闻 查看精彩图片

我还作了很多很搞怪有趣的歌,也给大家听一听~

不过说实话,Mureka V8相比Suno,还不是全方位碾压。

在有些需要精准复刻特定风格的领域,Suno的数据优势依然明显。V8生成的偶尔还是能听出一点点"塑料感",尤其是在高音区的混响处理上,没有Suno那么自然。

预计后面高质量音乐数据更加丰富以后,效果肯定可以变得更好。

03. 为什么生态才是护城河

单独聊产品、聊技术没意义,得看生态。

Suno现在估值24.5亿美元,但它最大的软肋是什么?是它的封闭性。

Mikey Shulman明确表示,他拒绝了所有AI视频公司的API合作请求,因为他不想Suno成为背景音乐供应商。

Mureka的策略不太一样。

V8发布当天,他们就推出了Mureka API和Mureka Studio,走的是"基础设施"路线。

打开网易新闻 查看精彩图片

有点像安卓对iOS的策略:你强任你强,我做水和电。现在的安卓生态也是非常强大。

Mureka API的定位是"最懂音乐生成需求的开放平台"。

我在想,未来的社交App、游戏引擎、短视频工具,都可以直接集成AI音乐生成能力。

想象一下,你在玩一个开放世界游戏,游戏里的背景音乐不是预设的,而是根据你的情绪、你的操作实时生成的;

或者你在用某个 dating app,系统根据你和对方的聊天记录生成一首"匹配主题曲"。

更狠的是Mureka Studio。

打开网易新闻 查看精彩图片

它不是要和Ableton或Logic抢专业用户,而是要重新定义DAW数字音频工作站。

传统的DAW是工具思维,给人一堆轨道和效果器,你自己去搭;

Mureka Studio是助手思维,把半成品扔进去,用自然语言告诉它你想要什么,它会帮你完成技术执行。

还有人人共创的社区逻辑。

用户生成的歌曲可以在平台内被二次创作、被传播、被进化。

打开网易新闻 查看精彩图片

这一首歌不再是静态的成品,可以分叉、可以变化、可以二创,像是真的活起来了。

Mureka的思路是,既然一切都是生成的,那就一切都是可再生的,建立一个基于创作行为而非作品所有权的新经济模型。

这是我觉得很像Spotify,未来非常有商业想象力的地方。

04. Mureka V8正在定义新的音乐品类

回到那个问题:为什么AI音乐不是"更好的工具",而可以是"新的艺术品类"?

摄影术刚发明的时候,画家们惊恐万分,认为这玩意儿会毁灭艺术。

结果怎么样?摄影没有消灭绘画,反而成为了独立的艺术门类,还催生了现代艺术对"真实"的重新思考。

再后来,电子合成器出现,传统乐手骂它是假音乐,没有人味。

结果呢?电子音乐不仅成为了最大的音乐品类之一,还催生了嘻哈、EDM等全新的文化形态。

AI音乐正在经历同样的过程。

它不是用来取代人类创作的,同样是开创了一种前所未有的音乐形态——实时生成的、高度个性化的、参与式的音乐。

打开网易新闻 查看精彩图片

发布会现场,高晓松说,AI取代不了人,因为AI没有心、没有洞、没有缺失。

他还说,自己也用AI编曲、做小样,但他觉得自己唱的难听,就用AI人声来唱。结果唱得过于好听了,让制作方不敢用,觉得市面上任何一个顶尖的歌手也达不到。

我在想,当我们听一首AI生成的歌,我们可能不在乎背后有没有一个真实的痛苦灵魂,我们只在乎它是否准确捕捉了我当下的心情,是否能成为我此刻情绪的容器。

我的朋友音乐人杨樾,之前总结过音乐圈对AI的四种态度:完全拒绝、观望、全力拥抱、偷偷用不承认。

他也说,第四种人最多,而且"他们的创作力突然变得特别旺盛"。

但V8和Mureka做的事,也正在证明,当AI音乐足够好、足够方便、足够成为日常,人们可以拥有一种新的创作身份,而AI音乐本身也可以成为新的品类。

打开网易新闻 查看精彩图片

我是98年的,身边95后、00后的朋友们,已经习惯了每天刷到几十首AI生成的音乐,到KTV唱歌,都会选AI音乐人“大头针”演唱的版本。

AI音乐让听众变成了玩家,每个人都可以在游戏中创造自己的音乐叙事,可以在此刻享受音乐的共鸣和快乐。

我只觉得,Suno打开了第一扇门,Mureka正在铺第一条轨道。

而我们都将成为这个新纪元的原住民——不再只是听众,真正开始成为无限音乐宇宙的创造者。

我们正站在新大陆的海岸线上,V8只是第一张地图,而音乐的探险,才刚刚开始……