金融界2024年12月5日消息,国家知识产权局信息显示,大众问问(北京)信息科技有限公司申请一项名为“语音分离方法、装置、设备和存储介质以及语音转写方法”的专利,公开号 CN 119068900 A,申请日期为 2023 年 6 月。

专利摘要显示,本申请涉及一种语音分离方法、装置、计算机设备和存储介质以及语音转写方法。所述方法包括:获取多通道混合语音数据;从多通道混合语音数据中分离得到单路语音数据;从单路语音数据中确定不同说话人的身份转变的时间点,根据时间点将单路语音数据分割为多个不同说话人的语音短片段;对多个不同说话人的语音短片段进行分类,得到属于同一说话人的语音短片段;对同一说话人的语音短片段进行说话人聚类处理,得到属于同一说话人的分离后语音数据。采用本方法能够提高语音分离的准确性,进而提高语音转写的准确性。

本文源自:金融界

作者:情报员