金融界2024年12月21日消息,国家知识产权局信息显示,歌尔科技有限公司申请一项名为“远场拾音方法、装置、设备及介质”的专利,公开号CN 119152873 A,申请日期为2023年6月。

专利摘要显示,本申请公开了一种远场拾音方法、装置、设备及介质,属于远场拾音技术领域。本申请聚焦提升远距离拾音质量,提升语音识别或翻译效果,提出一种远场拾音方法的技术方案,首先,在确定需要对获取到的原始音频进行音频处理之后,定位原始音频的声源位置,并基于声源位置和采集原始音频的麦克风位置生成音频波束;然后,在确定音频波束存在高噪之后,对音频波束进行噪声抑制,从而输出目标音频。基于麦克风阵列的信号处理技术,自动估计目标说话人方位,主波束聚焦说话人方向并抑制其他干扰,并通过降噪模块进一步消除噪声,提升语音清晰度。以此,识别风噪、高噪、安静或小噪声场景以进行不同的音效处理,更为细致地提升不同场景下的语音识别正确率

本文源自:金融界

作者:情报员