金融界2025年1月16日消息,国家知识产权局信息显示,北京捷通华声科技股份有限公司申请一项名为“一种语音合成方法、装置、设备和存储介质”的专利,公开号 CN 119296512 A,申请日期为2024年8月。
专利摘要显示,本申请实施例提供了一种语音合成方法、装置、设备和存储介质,接收用户输入的待合成语音的文本;将文本对应的音素序列输入语音合成模型中的预处理部分,得到中间向量;将维度规整后的中间向量输入多相正交镜像分析滤波器,得到分析信号;将分析信号输入语音合成模型中的耦合层,以对分析信号进行逆向变换得到逆变换信号;将逆变换信号输入多相正交镜像合成滤波器,得到合成信号;将维度逆规整后的合成信号输入语音合成模型中的解码器,根据语音波形,合成目标语音。本申请实施例通过在归一化流的耦合层中引入多相正交镜像滤波器,可以显著提高语音合成模型整体的稳定性和鲁棒性,进而提升应用归一化流技术合成的语音质量的稳定性。
天眼查资料显示,北京捷通华声科技股份有限公司,成立于2000年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本6674.2475万人民币,实缴资本6674.2474万人民币。通过天眼查大数据分析,北京捷通华声科技股份有限公司共对外投资了14家企业,参与招投标项目288次,知识产权方面有商标信息39条,专利信息453条,此外企业还拥有行政许可7个。
本文源自:金融界
作者:情报员
热门跟贴