金融界2024年12月19日消息,国家知识产权局信息显示,南京中孚信息技术有限公司申请一项名为“文档摘要的提取方法、系统、电子设备及存储介质”的专利,公开号 CN 119131829 A,申请日期为2024年11月。
专利摘要显示,本发明实施例提供一种文档摘要的提取方法、系统、电子设备及存储介质,属于导航技术领域。该方法包括:将待提取摘要的文档解析为片段,生成片段集;并进行光学字符识别形成初步语义文本,并确定第一token序列;对片段集中的插图进行图像类型识别,形成结构描述文本,并确定第二token序列;识别待提取摘要的文档的行业或领域标签,并确定对应的编码;将第一第二token序列及标签对应的编码输入至预先构建的摘要提取模型,获得摘要文本。基于循环神经网络的图文型文档摘要生成方案,利用关键语义提取、文档结构提取、文档行业或领域识别,从企业文档中提炼关键语义和关键插图,形成图文型的文档摘要,其具有针对性,概括能力强。
本文源自:金融界
作者:情报员
热门跟贴