金融界2025年3月22日消息,国家知识产权局信息显示,中电信人工智能科技(北京)有限公司申请一项名为“一种语音合成方法、装置、设备及存储介质”的专利,公开号 CN 119649797 A,申请日期为2024年12月。
专利摘要显示,本申请实施例涉及数据处理技术领域,具体而言,涉及一种语音合成方法、装置、设备及存储介质,旨在提升语音合成的表现力。所述方法包括:接收目标文本;从所述目标文本中获取对应的文本特征,所述文本特征中包含有音素信息、词边界信息以及句子信息;将所述文本特征输入预训练的语义模型中,得到所述文本特征对应的音素级别的语义特征;对所述语义特征进行多层级表征融合,得到多层级语义特征;对所述多层级语义特征进行单词与持续时间的对齐,以及,通过多头注意力机制对所述多层级语义特征进行音素与持续时间的对齐,得到对齐处理后的所述多层级语义特征;根据对齐处理后的所述多层级语义特征,得到所述目标文本对应的语音。
天眼查资料显示,中电信人工智能科技(北京)有限公司,成立于2023年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本300000万人民币,实缴资本50000万人民币。通过天眼查大数据分析,中电信人工智能科技(北京)有限公司参与招投标项目265次,专利信息167条,此外企业还拥有行政许可1个。
本文源自:金融界
作者:情报员
热门跟贴