国家知识产权局信息显示,西藏查瓦云科技有限责任公司申请一项名为“基于深度学习的语音合成方法”的专利,公开号CN121545491A,申请日期为2025年11月。
专利摘要显示,本发明涉及语音合成领域,具体是基于深度学习的语音合成方法,本发明采用一种基于多维度的自适应注意力机制融合方法将语音特征融入待合成语音,通过注意力对齐解决了传统全局嵌入的平均化问题,引入可学习的门控单元,自适应、精细地平衡局部细节与全局韵律,使用高效的条件机制进行特征层面的条件融合,最终形成更加真实的合成语音;本发明将单一的语音降噪任务扩展为一个以降噪为主,语音增强和基频预测为辅的分层多任务学习框架,通过辅助任务的约束,引导UNet学习到更具判别性和物理意义的语音表征,动态地、有选择地从辅助信息中汲取对当前降噪上下文最有用的部分,从参考语音中提取更为纯净的无噪声语音,增加合成语音的清晰度。
天眼查资料显示,西藏查瓦云科技有限责任公司,成立于2021年,位于拉萨市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本1000万人民币。通过天眼查大数据分析,西藏查瓦云科技有限责任公司专利信息11条。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
热门跟贴