国家知识产权局信息显示,慧点智科(广东)技术有限公司申请一项名为“多路语音流实时分离与内容检索方法”的专利,公开号CN121459791A,申请日期为2025年11月。

专利摘要显示,本发明提供多路语音流实时分离与内容检索方法,包括:利用注册语音样本构建本地声纹库,通过深度声纹编码器提取并归一化目标说话人声纹特征;对混合语音信号进行帧级特征分析,计算当前语音帧与目标声纹的语义距离并生成动态置信度分数;结合置信度阈值与去抖动机制进行特征冲突检测,触发冲突感知注意力门控模块,实现频带增强与抑制;基于滑动窗口动态识别持续性特征混淆区域,并通过局部重构与时频掩码优化迭代提升混淆区域的分离精度。最终采用逆变换及边界平滑技术输出高质量目标语音,本发明实现了混合语音中目标说话人语音的高精度识别与分离,有效抑制非目标成分,提升分离效果与鲁棒性。

天眼查资料显示,慧点智科(广东)技术有限公司,成立于2021年,位于广州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本1008万人民币。通过天眼查大数据分析,慧点智科(广东)技术有限公司共对外投资了1家企业,参与招投标项目6次,财产线索方面有商标信息2条,专利信息1条,此外企业还拥有行政许可7个。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

本文源自:市场资讯

作者:情报员