金融界2024年10月18日消息,国家知识产权局信息显示,度小满科技(北京)有限公司申请一项名为“语音特征处理方法、语音识别方法、装置及电子设备”的专利,公开号CN 118782020 A,申请日期为2024年7月。
专利摘要显示,本公开实施例提供一种语音特征处理方法、语音识别方法、装置及电子设备,其中语音特征处理方法包括:对第一语音特征序列进行第一编码处理,以得到第二语音特征序列;识别第二语音特征序列中的语义帧和空白帧;根据空白帧与语义帧之间的时序关系,确定第二语音特征序列中的关键帧集合,其中,关键帧集合至少包括语义帧;对关键帧集合进行第二编码处理,以得到第三语音特征序列。采用本公开实施例,能够在保证识别性能不损失的情况下,实现自适应压缩语音特征序列长度,能够减少对冗余信息进行编码,达到更快的推理速度。
本文源自:金融界
作者:情报员
热门跟贴