金融界2025年6月28日消息,国家知识产权局信息显示,广州创力信息科技有限公司申请一项名为“一种基于大数据的数字人语言训练方法及系统”的专利,公开号CN120216988A,申请日期为2025年03月。

专利摘要显示,本发明涉及数字人技术领域,具体公开了一种基于大数据的数字人语言训练方法及系统,所述的方法包括以下步骤:S1:获取训练文本,获取训练文本的文本向量,对文本向量进行聚类得到聚类簇;S2:获取聚类簇中文本向量的数量,确定聚类簇是否为削减簇;对削减簇中的文本向量进行排序得到第一排序,去除第一排序中的若干文本向量,获取新的聚类簇;S3:记录第一簇被标记为第二簇的总次数,当总次数超过总次数阈值时,标记为异常簇;删除异常簇的第一排序中首位的文本向量,直到异常簇不再被判定为异常簇;S4:基于目标簇生成数据集,对数字人进行语言训练。

天眼查资料显示,广州创力信息科技有限公司,成立于2012年,位于广州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本100万人民币。通过天眼查大数据分析,广州创力信息科技有限公司参与招投标项目4次,财产线索方面有商标信息18条,专利信息5条,此外企业还拥有行政许可2个。

本文源自金融界