金融界2025年1月22日消息,国家知识产权局信息显示,上证所信息网络有限公司申请一项名为“一种基于信创环境的配置化word数据提取方法”的专利,公开号CN 119272727 A,申请日期为2024年12月。

专利摘要显示,本发明涉及信息处理技术领域,具体来说是一种基于信创环境配置化word数据提取方法,所述方法如下:S1.构建提取内容模版及查询定位规则;S2.构建目标段落集;S3.文本及表格解析处理;S4.提取结果后处理;S5.提取结果输出。本发明同现有技术相比,其优点在于:采用openjdk poi技术来解析Word文档,通过高度的配置化和灵活性,允许用户根据需要定制提取规则,并通过正则表达式和同义词字典来精确定位和处理文档中的数据。通过JSON和Kafka的集成,实现了数据的标准化输出和高效的数据流处理。本发明的技术方案在信创麒麟环境下的适配性体现在其能够与国产操作系统和软件环境兼容,满足国内用户对数据处理和信息安全的需求。

天眼查资料显示,上证所信息网络有限公司,成立于2003年,位于上海市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本15000万人民币,实缴资本15000万人民币。通过天眼查大数据分析,上证所信息网络有限公司共对外投资了6家企业,参与招投标项目278次,知识产权方面有商标信息214条,专利信息57条,此外企业还拥有行政许可10个。

本文源自:金融界

作者:情报员