金融界 2024 年 12 月 12 日消息,国家知识产权局信息显示,国网浙江省电力有限公司营销服务中心申请一项名为“多方言语音识别方法、装置、设备及介质”的专利,公开号 CN 119107936 A,申请日期为 2024 年 10 月。

专利摘要显示,本发明公开了一种多方言语音识别方法,涉及语言处理技术领域,用于解决现有多方言识别困难的问题,该方法包括以下步骤:获取方言数据;提取所述方言数据的特征,并将所述特征表征为语音表征;将所述语音表征输入基于稀疏性偏置计算模式的 Transformer 编码器提取方言表征;根据所述方言表征信息进行方言分类,得到方言分类结果;将所述分类结果与所述语音表针输入多专家集成系统进行预测,得到语音识别结果。本发明还公开了一种多方言语音识别装置、电子设备和计算机存储介质。本发明通过基于稀疏性偏置计算模式编码器结合多专家集成系统,实现多方言的准确高效识别。

本文源自:金融界

作者:情报员