金融界2024年10月18日消息,国家知识产权局信息显示,联通(山西)产业互联网有限公司申请一项名为“智能语音分离与识别的会议转录方法、装置及系统”的专利,公开号CN 118782073 A,申请日期为2024年7月。

专利摘要显示,本发明属于语音识别技术领域,公开了一种智能语音分离与识别的会议转录方法、装置及系统。该方法包括通过麦克风阵列捕捉与会人员的语音信息;通过端到端语音分离模块对捕捉到的语音信息进行分割,得到多个子语音信息;将所述子语音信息和与会人员语音信息库进行匹配,以确定各个子语音信息对应的发音对象;将各个子语音信息通过语音识别模块转换为发音对象的文本输出。通过上述方式,结合高效的语音分离算法,能够有效地分离和识别重叠的语音信号,使得能够区分与会人员的角色并且每个与会人员的说话内容都能够被准确地识别出来,提高工作效率,改善沟通交流体验,并为用户提供更加便捷、安全和高效的服务。

本文源自:金融界

作者:情报员