国家知识产权局信息显示,深圳市友杰智新科技有限公司申请一项名为“训练语音识别模型的样本集生成方法、装置和计算机设备”的专利,公开号CN121438814A,申请日期为2025年12月。

专利摘要显示,本发明涉及语音识别技术领域,旨在解决重口音语音识别模型训练样本匮乏的问题。提供一种训练语音识别模型的样本集生成方法、装置和计算机设备,其中方法包括:将目标命令词解码为无声调原始拼音序列;基于常见非标准发音规律构建的重口音规则库(重口音指声母/韵母变化的非标准发音),编码转换生成重口音拼音序列;经文本到语音音频生成工具生成重口音音频;音频输入预设识别模型得识别结果并转换为识别拼音序列;以原始和/或重口音拼音为基准构建筛选规则,比对识别拼音序列筛选音频;收集符合要求的音频组成训练样本集。本发明通过规则化生成与精准筛选,高效获取高质量重口音样本,可提升模型重口音识别性能。

天眼查资料显示,深圳市友杰智新科技有限公司,成立于2018年,位于深圳市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本1359.7205万人民币。通过天眼查大数据分析,深圳市友杰智新科技有限公司共对外投资了5家企业,参与招投标项目1次,财产线索方面有商标信息22条,专利信息157条,此外企业还拥有行政许可7个。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

本文源自:市场资讯

作者:情报员