你已经习惯了在ChatGPT、Gemini或Grok等生成式AI工具中输入提示词,来获取答案、图像甚至视频。现在,谷歌希望你用同样的方式来创作音乐。通过Lyria 3,你只需输入文字描述、上传音频或图片,这个模型就能在几秒钟内将你的想法转化成一首歌曲。
Lyria 3于今年2月正式发布,是谷歌目前最先进的音乐生成模型。3月,谷歌又推出了能力更强的Lyria 3 Pro。
在AI音乐创作领域,Suno和Udio一直占据着主导地位。如今,谷歌也想从中分一杯羹。谷歌此前已在音乐模型领域有过探索,而Lyria 3和Lyria 3 Pro的目标是生成更长、音质更好、结构更完整的歌曲。
Lyria 3是什么
Lyria 3是谷歌DeepMind推出的最新多模态音乐AI模型,能够处理多种类型的输入,包括文字、音频和图像,并根据视觉内容的情绪和时间节奏生成匹配的配乐。
该工具能够生成高保真音乐,音符之间的过渡更加自然,且能在整首曲目中保持旋律、节奏和风格的一致性。
Lyria 3已集成在Gemini中,所有谷歌AI套餐均可使用,付费用户享有更高的使用上限。Lyria 3 Pro则覆盖更广,可在Vertex AI、Google AI Studio、Gemini API、Google Vids、Gemini应用以及ProducerAI等平台上使用。其中,ProducerAI是一个音乐创作平台,谷歌已于今年2月将其纳入Google Labs旗下。
与一键生成歌曲的工具不同,ProducerAI更像是一个创意伙伴——你不仅可以生成完整歌曲,还可以单独创作特定元素,如节拍、旋律或钩子,并持续打磨完善。
如何上手Lyria
在Gemini中使用Lyria 3相当简单。你只需描述想要的歌曲风格,或上传一张图片,Gemini便会生成一段30秒的音轨,并附带AI生成的封面。如果选择Thinking模型,还可以生成更长的曲目。
在谷歌的开发者工具和云产品中,Pro模型能更好地处理歌曲结构,包括前奏、主歌、副歌、桥段和尾奏。通过Gemini API,Lyria 3片段模型可生成30秒、48kHz的立体声音频。
两款模型都提供了对音乐性的深度控制,允许用户指定复杂的流派、编曲方式,甚至音色年代感,例如"70年代模拟磁带的温暖质感"。
谷歌表示,Lyria 3 Pro在一定限制条件下支持多轮对话编辑,即你可以在同一对话中持续迭代,而无需每次都从头开始。不过,如果模型的生成方向出现偏差,重新开始往往比不断修改更为高效。
掌握提示词技巧
提示词是释放Lyria 3创作潜力的关键。简单的关键词罗列也能生成一首歌,但谷歌建议使用以下框架来更精准地控制生成效果:【曲风与风格】+【情绪】+【编曲】+【节奏与律动】+【人声风格与语言】+【歌词】。
你也可以参考谷歌官方的提示词指南获取更详细的说明,或者让聊天机器人帮你构思提示词。
"文字和音乐之间没有一对一的转换关系,"音乐学校Futureproof Music School的CEO约翰·冯·塞格恩告诉我,"你没办法靠输入'给我一首朗朗上口的流行歌'就得到你想要的,结果总会跑偏。"
他认为,人们更愿意"用AI来创作一些小的音乐模块……而不是单靠文字来塑造一整首作品"。
歌词与语言支持
Lyria 3目前支持8种语言的人声和歌词生成,包括英语、西班牙语、法语、德语、葡萄牙语、印地语、日语和韩语。生成的人声并非你惯常听到的机械旁白,而是带有情感起伏的演唱,能够匹配你所指定的音乐风格。
在歌词处理上,你有两种主要方式:可以描述具体的主题或情绪,让工具自动生成并演唱歌词;也可以在提示词中提供自己写好的歌词。此外,你还可以对歌词进行时间轴对齐,精确控制歌词的起止时间。
Lyria 3同样支持翻译和跨语言演唱风格。如果你用英文下达指令,但指定歌曲以某种支持的语言演唱,工具会自动完成翻译和演唱,例如"用韩语演唱一首K-pop风格的歌曲"。
谁适合使用Lyria
谷歌正努力将Lyria 3定位为一款灵活的创意工具,而不仅仅是供爱好者把玩的玩具。最典型的使用场景包括:数字创作者和社交媒体博主为短视频、播客、演示和社交帖子配乐。
"我觉得它更适合这样的场景:'我在做一个三分钟的YouTube视频,需要一些普通的背景音乐。'这种情况下它完全够用,"冯·塞格恩说。
但如果你想靠提示词一步登天成为下一个大明星,目前还为时尚早。"如果你想要更精细的控制,那你就得在某种程度上真正懂音乐,"他补充道。
谷歌还建议将其作为实验和教育工具,尤其适合那些没有乐器资源或缺乏完善音乐课程的学生。
音乐质量如何
互联网上已经充斥着大量AI生成的低质内容,我们最不需要的就是再多一波粗制滥造的音乐。相比文字或图像,音乐可能是更难攻克的领域,因为人们与音乐之间存在情感连接,这让Lyria 3这样的工具既引人关注,也更受苛刻审视。
冯·塞格恩认为Lyria 3的音频质量"相当不错",但在原创性方面令他失望,"它听起来相当普通,"他说。
版权与所有权问题
美国版权局2025年1月发布的报告指出,AI生成的作品只有在人类加入了有实质意义的创意贡献时,才可能获得版权保护,而仅靠提示词生成的作品则不能。
"所谓'实质意义'本身存在解读空间,但它仍然需要有人类的创作成分,"贝劳斯律师事务所及The Trademark Channel创始人雷拉尼·贝劳斯告诉我。
在你开始盘算如何将AI生成的音乐变现之前,贝劳斯建议大家先三思而后行——在发布前,务必了解相关条款和法律风险,并咨询专业法律人士。(贝劳斯特别说明,以上内容是法律见解,而非法律建议。)
"每当出现颠覆性技术,诉讼就会随之而来,"贝劳斯说,并指出诉讼中人们总会盯着"口袋最深的那个"。
诉讼确实已经开始了。今年3月,一群独立音乐人和词曲作者起诉谷歌,指控谷歌在未获许可、未支付报酬的情况下,使用了从YouTube抓取的"至少4400万段片段、共28万小时的音乐"来训练Lyria 3。
谷歌则表示,Lyria 3模型的训练所使用的素材,均在YouTube和谷歌依据服务条款、合作协议及适用法律有权使用的范围之内。
贝劳斯指出,创作者往往从艺术角度而非商业角度看待自己的工作,这在合同、管理和资金问题出现时,容易让他们陷入被动。"音乐人没有得到应有回报,这有着深刻的历史背景,"她说。
谷歌表示,在Gemini中生成的音乐均嵌入了SynthID水印——这是一种直接嵌入AI生成音频内容的不可见、不可听的水印技术。谷歌还表示,Lyria 3 Pro在设计上会主动避免模仿现有艺人的风格。
"你无法对一种风格申请版权……就像西部牛仔片的故事背景一样。但当涉及旋律和独特元素时,那才是音乐版权专家出场的领域,"贝劳斯说。
她还指出,合理使用原则作为版权法的一部分,被广泛误解,它并非侵权的挡箭牌。"合理使用不是一项权利,而是一种肯定性抗辩,意思是你确实实施了侵权行为,但你有正当理由为此辩护。"
AI音乐的未来走向
谷歌表示,其相信应该与艺术家携手合作,增强人类的创造力,而非取而代之。
格莱美奖得主、音乐人韦克里夫·让在创作歌曲《Back From Abu Dhabi》期间,就将Lyria 3作为创意工具。他说:"有一件事是我们超越AI的,那就是灵魂;有一件事是AI超越我们的,那就是无限的创造力。"他将两者的结合称为"无敌"。
与此同时,也有一些艺人——如Grimes——表示不介意将自己的音乐用于AI训练或融合创作,但前提是要获得相应的报酬。
也有人试图将这项技术引向灰色地带。2025年,Spotify下架了一首以1989年去世的乡村歌手布雷兹·福利名义上传的AI生成歌曲。
"我认为这里面存在巨大的不确定性和风险,需要加以平衡,这将在未来数年内随着新技术的发展逐步厘清,"贝劳斯说。她还注意到,各类许可协议正在发生变化,与AI相关的条款正被陆续加入合同之中。
Lyria 3在技术层面令人印象深刻,在特定场景下也具有实用价值。但音乐是私人的情感体验。AI音乐若想真正立足,就必须超越"无灵魂的背景噪音"这一标签。
Q&A
Q1:Lyria 3支持哪些语言的歌词生成?
A:Lyria 3目前支持8种语言的人声与歌词生成,分别是英语、西班牙语、法语、德语、葡萄牙语、印地语、日语和韩语。生成的人声带有情感起伏,能够匹配用户指定的音乐风格。如果你用英文输入指令,但要求歌曲以韩语演唱,Lyria 3会自动完成翻译并以相应语言的演唱风格呈现。
Q2:用Lyria 3生成的音乐有版权吗?
A:根据美国版权局2025年1月发布的报告,仅靠提示词生成的AI音乐不能获得版权保护,只有人类加入了有实质意义的创意贡献时,才可能享有版权。专业律师建议,在发布AI生成的音乐作品之前,务必了解平台条款及潜在法律风险,并咨询专业法律人士,因为相关法律仍处于演变之中,诉讼风险不容忽视。
Q3:Lyria 3 Pro和Lyria 3有什么区别?
A:Lyria 3是集成在Gemini中的基础音乐生成模型,所有谷歌AI套餐均可使用,可生成30秒的音轨。Lyria 3 Pro是更高级的版本,能更好地处理完整的歌曲结构(包括前奏、主歌、副歌等),支持多轮对话编辑,并可在Vertex AI、Google AI Studio、Gemini API等多个开发者平台上使用,付费用户享有更高的使用上限。
热门跟贴