金融界2024年12月18日消息,国家知识产权局信息显示,北京百度网讯科技有限公司申请一项名为“数据处理方法、装置、电子设备和存储介质”的专利,公开号CN 119129751 A,申请日期为2024年9月。

专利摘要显示,本公开提供了数据处理方法、装置、电子设备和存储介质,涉及数据处理领域,尤其涉及深度学习及NLP技术等领域。具体实现方案为:获取训练数据集,训练数据集包括至少一个子数据集,每个子数据集对应一种数据类型;根据每个子数据集对语言模型进行独立训练,在训练过程中,针对每一条数据进行反向传播,得到语言模型中各层次参数的梯度信息;根据语言模型中各层次参数的梯度信息,对语言模型中的多个层次进行可解释性分析,得到训练数据集中不同数据类型的数据与语言模型中不同层次参数梯度之间的映射关系;基于该映射关系,生成定制化的数据筛选工具。本公开可以在更细的粒度上评估数据对模型各层参数的影响,进而实现模型的可解释性分析

本文源自:金融界

作者:情报员