金融界2024年12月19日消息,国家知识产权局信息显示,腾讯科技(深圳)有限公司申请一项名为“一种基于语音对齐的时延确定方法及相关装置”的专利,公开号 CN 119132336 A,申请日期为2023年6月。
专利摘要显示,本申请公开一种基于语音对齐的时延确定方法及相关装置,在语音对齐场景中,将标准通道的标准语音信号和参与通道的参与语音信号分别切分为多个标准信号段和多个参与信号段;对每帧信号进行基音周期计算,得到多个标准信号段对应的多个标准基音周期串和多个参与信号段对应的多个参与基音周期串。针对多个标准基音周期串中待匹配基音周期串和多个参与基音周期串中多个候选基音周期串,动态时间规整得到待匹配基音周期串与多个候选基音周期串的多个距离。当多个距离中最小距离符合预设相似条件时,通过待匹配基音周期串的第一对齐点时间和最小距离对应的候选基音周期串的第二对齐点时间,确定参与通道相对标准通道的更准确的时延。
本文源自:金融界
作者:情报员
热门跟贴