金融界2024年3月16日消息,据国家知识产权局公告,科大讯飞股份有限公司申请一项名为“语音识别方法、装置、设备及存储介质“,公开号CN117711379A,申请日期为2023年12月。

专利摘要显示,本申请实施例公开了一种语音识别方法、装置、设备及存储介质,对语音进行特征提取,得到语音的各个语音帧的特征;通过端到端网络对各个语音帧的特征进行编码,得到各个语音帧的编码特征;通过端到端网络对各个语音帧的编码特征进行解码,得到多个字序列;通过第一解码网络对多个字序列进行解码,得到第一词序列;通过基于热词激励的第二解码网络对各个语音帧的编码特征进行解码,得到第二词序列;在第一词序列和第二词序列中筛选出置信度高的词序列作为语音识别结果。本申请提高了特定业务场景下热词的语音识别效果,实现了整个识别系统在通用语音识别效果与个性化需求之间的平衡。

本文源自金融界