金融界 2024 年 7 月 16 日消息,天眼查知识产权信息显示,金现代信息产业股份有限公司申请一项名为“用于解析型 PDF 的非完整框线表格识别方法及系统”,公开号 CN202410541441.6,申请日期为 2024 年 4 月。
专利摘要显示,本发明提供了一种用于解析型 PDF 的非完整框线表格识别方法及系统,包括对待识别的 PDF 文档进行直线和矩形提取,并将提取的矩形转化为若干直线;基于获得的若干直线,通过构建连通域获得表格区域及表格区域对应表格线集合;基于获得的表格区域,获得表格区域的四周框线;基于所述四周框线是否存在于表格线集合的判断结果,将不存在的四周框线添加入表格线集合中;基于获得的表格线集合,获取表格区域的表格线横线和竖线的交点坐标,基于获得的交点坐标,进行表格区域内单元格区域的识别;基于获得的表格区域及表格区域内部的单元格区域,实现表格的识别。
本文源自:金融界
作者:情报员
热门跟贴