金融界2024年10月18日消息,国家知识产权局信息显示,阳光慧碳科技有限公司申请一项名为“一种基于强化学习的知识推理方法、装置、设备、介质和产品”的专利,公开号 CN 118780363 A,申请日期为2024年5月 。

专利摘要显示,本发明实施例公开一种基于强化学习的知识推理方法、装置、设备、介质和产品。该方法包括:基于多源碳领域原始数据构建碳领域知识图谱;获取问答知识训练集;基于碳领域知识图谱、问答知识训练集以及预设强化学习算法对大模型进行训练得到最优大模型;获取用户输入的待推理碳领域知识问题,根据最优大模型和碳领域知识谱图对待推理碳领域知识问题进行知识推理,得到最优推理答案。本发明实施例,通过构建碳领域知识图谱,基于碳领域知识图谱、问答知识训练集和预设强化学习算法对大模型进行训练得到最优大模型,以通过最优大模型和知识谱图进行知识推理,能够确保知识推理的可信度和推理质量,提升知识推理的能力和效率。

本文源自:金融界

作者:情报员