国家知识产权局信息显示,脸萌有限公司申请一项名为“视频到音乐机器学习模型”的专利,公开号CN121438774A,申请日期为2025年7月。
专利摘要显示,本公开的实施例涉及视频到音乐机器学习模型。一种计算系统包括被配置为接收输入视频的一个或多个处理设备。在包括视频编码器和自回归解码器的视频到音乐机器学习模型中,所述一个或多个处理设备在视频编码器处至少部分地基于输入视频来计算视频特征张量。所述一个或多个处理设备在自回归解码器处至少部分地基于视频特征张量自回归地生成音乐标记。所述视频到音乐机器学习模型已经使用训练数据集进行了训练,所述训练数据集包括训练输入对,每个训练输入对包括训练输入视频和训练背景音乐。所述训练还使用了损失函数,所述损失函数包括视频‑音乐对比损失项和自回归损失项。所述一个或多个处理设备将音乐标记转换为与输入视频相关联的背景音乐。所述一个或多个处理设备输出背景音乐。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
热门跟贴