打开网易新闻 查看精彩图片

新智元报道

编辑:桃子 好困

【新智元导读】AI音乐变天了!Mureka V8强势登顶AA榜,包揽人声与器乐双项冠军。而这仅仅是开始,下一代Mureka V9已在路上了!

双榜封顶,实至名归!

就在今天,AI音乐大模型Mureka V8在权威Artificial Analysis榜单上,强势登顶。

它一举斩获 vocal与instrument双榜单第一,综合实力碾压Suno V4.5、Udio v1.5 Allegro、Lyria 2主流模型。

打开网易新闻 查看精彩图片

榜单地址:https://artificialanalysis.ai/music/leaderboard/instrumental

打开网易新闻 查看精彩图片

榜单地址:https://artificialanalysis.ai/music/leaderboard/vocals

这不仅仅是一次简单的跑分超越,更是一次技术代差级的碾压。

戴上耳机,用三首风格截然不同的歌,自己判断V8的成色。

一首128 BPM的EDM电子舞曲,合成器旋律开场,四四拍鼓点配重低音Sub-bass,Drop段直接炸裂。派对该有的样子,V8给齐了。

一首独立民谣抒情曲,纯木吉他指弹,人声贴近麦克风,像在耳边呢喃。从EDM的狂热瞬间切到这种宁静私密,V8的风格跨度令人意外。

一首史诗级电影感抒情歌,低沉合成器与钢琴铺底,管弦乐团和打击乐逐层叠入。情绪悲壮但充满力量,闭上眼,画面感扑面而来。

从派对到深夜独处再到电影院级的震撼——三首歌,三种情绪,全部AI直出,零人工修饰。

Mureka V8双榜封神

中国AI发出最强音

要理解这次登顶的分量,必须先知道Artificial Analysis榜单的含金量。

Artificial Analysis被业界誉为「AI领域的Gartner」。

它是当前全球AI大模型评测中,最具影响力的独立第三方机构之一。

打开网易新闻 查看精彩图片

它的苛刻在于绝对的独立性:所有关于模型性能、价格、速度的标准化测试和横向对比,均由内部独立完成,不依赖各家AI实验室的包装数据。

正因如此,其成果曾被OpenAI、Anthropic、谷歌等全球顶级AI巨头高度认可和引用。

能在这张榜单上登顶,代表的不仅是Mureka V8顶尖实力,更是来自第三方的硬核认证。

vocal和instrument,恰恰是AI音乐两个最核心、最本质的维度——

人声,是音乐灵魂所在;器乐,是音乐骨骼的构成。

Mureka V8在这两张榜单上同时摘冠,意味着它已经彻底打通了从「感性表达」到「理性编排」的任督二脉。

打开网易新闻 查看精彩图片

这是一个中国AI模型,在一个不容掺水的国际顶级竞技场上,交出的一份最具说服力的答卷。

可以说,Mureka V8的登顶,是一次中国AI向世界发出的最强音。

过去几年,全球AI音乐赛道一直是硅谷公司的主场。

Suno、Udio背后拥有雄厚的资本与一流的工程人才,Lyria 3更是谷歌DeepMind直接出品,代表着全球顶尖AI研究机构的最高水准。

这些都是行业标杆级的存在,曾长期主导AA等权威榜单。

打开网易新闻 查看精彩图片

Mureka V8的出现,彻底打破了这一格局。

一个总部位于北京的黑马公司——昆仑万维,凭借自研技术路线,在全球最权威的评测中超越了所有对手。

这个事实,有着远超技术本身的象征意义。

它证明了,中国AI在内容生成这个最依赖「感性理解」的赛道上,已经具备了引领全球的实力。

更深层次来看,这背后是北京这片科创热土所孕育出的磅礴力量。

从一个内测版「SkyMusic 1.0」起步,到登顶全球权威双榜,Mureka只用了两年时间,走出了一条令人信服的技术跃升曲线。

这背后,是北京人工智能产业在全球AI赛道上日益显现的核心竞争力,也是「科创北京」建设的一个真实注脚。

全球AI音乐赛道上,中国位置从未如此清晰。

技术解密,V8究竟做对了什么?

一个模型能登顶权威榜单,必然有其内在的技术逻辑。Mureka V8的突破,绝不是运气使然。

今年1月,Mureka V8正式面向全球首发。

一首顶流女团的开场单曲,节奏响起的瞬间,几乎所有人都被拉进了万众瞩目的舞台现场。

打开网易新闻 查看精彩图片

那种抓耳的质感,仿佛是刚刚空降Billboard榜首的顶流女团新单。

但事实是,这竟是一首「纯血」的AI音乐。网友们纷纷惊叹,「这完全不像拼凑出来的,就是演出来的」。

打开网易新闻 查看精彩图片

即便是阅曲无数的资深制作人,盲测之下恐怕也难辨真伪。

回顾过去的AI音乐模型,人们常常会陷入一种「恐怖谷效应」——

声音听起来像音乐,但旋律毫不发展;

编曲堆砌了各种元素,但情绪毫无推进;

人声虽然存在,但根本不像在「唱」一首歌;

听感看似干净,却严重缺乏空间感与专业制作的完成度。

以上正是真实音乐创作中最致命的痛点。直到Mureka V8的出现,才打破了这些桎梏。

它出品的每一首音乐,都在宣告同一件事:AI音乐已从「能生成」向「可发布」完成了终极跃迁。

MusiCoT:让AI真正「懂音乐」

Mureka V8的核心技术引擎,是团队自研的MusiCoT(Music Chain-of-Thought) 技术体系。

所谓的CoT,已成为当今大模型最重要的推理范式之一。

不是直接给出答案,而是先把推理过程链条化、结构化,让模型在生成之前先「想清楚」。

MusiCoT把这一范式引入音乐生成,本质上是让模型在「落笔」之前,先对音乐结构、段落逻辑、情绪推进和表达意图进行深层建模。

结果惊人惊喜,模型不再「拼接声音」,而是以更接近人类音乐家的创作逻辑来完成旋律发展、情绪铺陈与结构收束。

可以说,这是一个从「生成工具」到「创作主体」本质性的跃迁。

从「能听」到「能发」,最后一块拼图补上了

在外部音乐专家参与的盲测评估中,Mureka V8在以下五个关键维度中,获得了压倒性的正向反馈。

音乐性:更抓耳,更有记忆点

V8生成的旋律不再是「随机好听的片段」,而是真正具备记忆点的创作。副歌一响,旋律就能钻进耳朵,让人忍不住跟着哼。

听这首流行摇滚:主歌只有木吉他轻扫,情绪压到最低,副歌瞬间失真电吉他全面爆发。注意那个切换的瞬间——旋律在爆发点上一击即中。

人声表达:更有表现力,更符合创作预期

V8在人声音色、性别匹配与唱法选择上更加贴合提示词,演唱更自信,同时保持流畅度与清晰度,整体表现更具「主唱存在感」。

这首复古灵魂乐,嗓音沙哑的女歌手从主歌的慵懒转音,一路推到副歌的高音撕裂。注意听气声的细节和咬字的颗粒感,这是AI最难伪装的东西。

编曲层次:更丰富,但依然清晰有序

V8的配器更加饱满,和声层次更抓耳,情绪推进更自然,但同时依然清晰有序,不陷入混乱。

这一「丰富而不凌乱」的平衡,正是区分专业作品与业余产出的核心标准。

这首前卫电子管弦乐,八音盒、大提琴、合成器琶音、铜管组、史诗打击乐同时轰进来。音墙极其宏大,但仔细听,每种音色的位置和层次依然清晰可辨。

空间感:更接近专业制作

在混音与声场表现上,V8的人声更清楚,混响比例更协调,空间层次更立体,整体音质已接近专业制作水准。

听这首Dream Pop:人声悬浮在正中央,像在空旷教堂里演唱,吉他泛音在左右耳之间来回穿梭。低频温暖包容,高频丝滑透亮,整体已经是母带级的听感。

结构叙事:真正有起承转合

此前的AI音乐最被人诟病的,就是「听了30秒就能猜到3分钟后的样子」。V8彻底告别了这种无限循环。

它生成的作品具备完整的叙事弧线——主歌克制蓄力,预副歌积蓄能量,副歌高潮释放,桥段转折收束,层次分明、对比强烈。

这首另类摇滚直接走完了一整条情绪弧线:单音钢琴起头→军鼓滚奏逐渐变密→副歌瞬间爆发→桥段节奏和声突然变调→百人合唱终极高潮→一声钢琴和弦戛然而止。

从听感上说,这已经是「一首歌该有的样子」。

技术之外的底气

技术以外,2026年1月28日,Mureka V8 发布会上,昆仑万维还与太合音乐集团正式签约战略合作。

AI音乐进入主流音乐产业的制作和发行流程,这是一个标志性的信号:AI音乐不再只是极客玩具,而是真正走进了产业链条。

打开网易新闻 查看精彩图片

目前,Mureka开放平台已为全球8000余家客户提供稳定服务,是全球首个、也是首批开放官方AI音乐API平台提供商。

打开网易新闻 查看精彩图片

长期主义的胜利

罗马不是一天建成的。

Mureka V8今天的双榜封神,是昆仑万维在AI音乐领域死磕底层的长期主义胜利。

翻开Mureka的大事记,这完全是一部AI音乐的狂奔史:

2024年2月,SkyMusic内测1.0起步,跑通训练与推理的基础闭环;

4月,2.0版本上线天工验证稳定迭代;

8月,完成首个超大规模版本跃迁;

11月,5.0/5.5走向多语种工程化。

打开网易新闻 查看精彩图片

直到2025年,Mureka团队做出了最关键的一步——

将自研的MusiCoT与系统化评测、后训练、强化学习跑成了完整的闭环,让模型进入了「有节奏、有方向」的长期进化。

最终,在2026年1月,V8横空出世,如今一战封神。

这一路走来,Mureka其实只在做一件事:把偶然的「好听」,变成一种可控、可复现的系统工程能力

小彩蛋:Mureka V9预告来袭

如果你以为V8已是终局,那就大错特错了。

此次榜单的成绩,实际上是为即将在3月27日,中关村论坛专场发布的Mureka V9进行的一场华丽预热。

V9的升级,将是一次直击AI生成领域「圣杯」的终极探索——创作意图的可控表达。

如果说V8解决了「能不能生成一首好歌」的问题,那么V9要解决的就是「能不能按你想的方式写出来」。

在过去的创作流中,创作者常常感到无力:歌词意思是对的,但落不到具体的段落;人声在唱,但抓不住情绪的重点。

V9正是为了消灭这种「表达偏差」而生。

敬请期待一下吧。

参考资料:

https://artificialanalysis.ai/music/leaderboard/instrumental

https://artificialanalysis.ai/music/leaderboard/vocals