金融界 2024 年 12 月 2 日消息,国家知识产权局信息显示,北京中科睿途科技有限公司申请一项名为“一种基于大模型的知识点提取方法及系统”的专利,公开号 CN 119047465 A,申请日期为 2024 年 8 月。专利摘要显示,本发明公开了一种基于大模型的知识点提取方法及系统,其包括:获取待提取知识文本,并通过大模型预处理得到文本重要词;对预处理得到的文本重要词向量化处理得到文本词向量,并通过集合得到文本向量数据集;对文本向量数据集聚类分析,将文本向量数据集划分为不同的簇;对文本词向量分析,从每个簇中选取出代表该簇主题的关键词作为该簇的知识主题;分析各簇中每个文本重要词与知识主题的关联程度,并将其达到预设条件的文本重要词提取出作为每个簇的知识点;对每个簇中提取出的知识点不断集合和更新得到最终知识点集合。本发明可以从文本数据中提取出有用的知识信息,并且通过不断的更新和完善知识点集合,帮助更好地理解文本数据的内容和主题。
本文源自:金融界
作者:情报员
热门跟贴