国家知识产权局信息显示,广州科技贸易职业学院;广州市音籁智慧科技有限公司申请一项名为“基于大语言模型的钢琴曲多模态生成方法及其系统”的专利,公开号CN121862057A,申请日期为2026年3月。
专利摘要显示,本发明提供基于大语言模型的钢琴曲多模态生成方法及其系统,属于人工智能音乐生成技术领域,该方法包括:多模态编码步骤,对文本、哼唱、图像、参考曲目进行编码;跨模态对齐映射步骤,通过注意力机制将异构输入统一映射至音乐语义空间;意图理解步骤,通过微调大语言模型解析创作意图;符号序列生成步骤,采用钢琴专用Transformer自回归生成包含完整演奏信息的符号序列;音乐性验证步骤,进行和声、声部、演奏可行性三维验证,本发明解决了现有技术输入模态受限、意图理解缺失、生成专业性不足等问题,支持零音乐基础用户的直觉化钢琴曲创作与专业创作者的高效灵感实现。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
热门跟贴