金融界2025年1月22日消息,国家知识产权局信息显示,四川语言桥信息技术有限公司申请一项名为“一种PDF转Word页眉页脚提取方法、装置及计算机可读存储介质”的专利,公开号 CN 119272716 A,申请日期为2024年10月。

专利摘要显示,本发明属于PDF文件解析技术领域,提供了一种PDF转Word页眉页脚提取方法、装置及计算机可读存储介质,方法包括以下步骤:步骤S1:对PDF文件进行前置处理,完成字符与图形的嵌套、布局处理和元素排序,得到每一页内容都有序的PDF预处理文件;步骤S2:页面拆分:将PDF预处理文件拆分为奇数页文件和偶数页文件;步骤S3:识别并划定每页文件的页眉和页脚的有效区域;步骤S4:在有效区域内,从第二页开始匹配每一页的公共元素,并判断PDF页面的页眉和页脚类型;步骤S5:判断所有页面的页眉页脚类型:步骤S6:根据所有页面的页眉页脚类型,生成每一页的页眉页脚信息,实现页眉页脚提取。本发明可以实现高效率的完成页眉、页脚的识别。

天眼查资料显示,四川语言桥信息技术有限公司,成立于2009年,位于成都市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本2000万人民币,实缴资本2000万人民币。通过天眼查大数据分析,四川语言桥信息技术有限公司共对外投资了11家企业,参与招投标项目841次,知识产权方面有商标信息50条,专利信息50条,此外企业还拥有行政许可5个。

本文源自:金融界

作者:情报员