金融界2025年4月29日消息,国家知识产权局信息显示,南京领行科技股份有限公司申请一项名为“文本处理方法、检索方法、装置、电子设备及存储介质”的专利,公开号CN119884342A,申请日期为2024年12月。
专利摘要显示,本发明提供一种文本处理方法、检索方法、装置、电子设备及存储介质,所述处理方法包括:获取待处理的原始文档;确定所述原始文档中的各标题或伪标题与对应文本块的位置关系;对所述位置关系进行标题层级关系分析,得到文本块之间的标题层级结构;基于所述标题层级结构中每层的标题或伪标题与对应索引文本块的映射关系,构建文本层级树;将所述文本层级树上每个节点的节点信息扁平化存储到向量数据库中,以便于检索时通过文本块之间的映射关系检索到完整的文本。本发明优化了向量入库之前的文本处理过程,引入原始文档已有的结构信息,方便检索时基于文本块之间的关联关系,使检索的文本更完整,提高了文本召回率的准确率。
天眼查资料显示,南京领行科技股份有限公司,成立于2019年,位于南京市,是一家以从事研究和试验发展为主的企业。企业注册资本841408.6154万人民币。通过天眼查大数据分析,南京领行科技股份有限公司共对外投资了18家企业,参与招投标项目79次,财产线索方面有商标信息154条,专利信息541条,此外企业还拥有行政许可5607个。
本文源自:金融界
作者:情报员
热门跟贴