金融界2025年3月29日消息,国家知识产权局信息显示,天清数安(天津)科技有限公司申请一项名为“一种基于版面分析的OCR提取优化方法”的专利,公开号 CN 119693950 A,申请日期为2025年2月。
专利摘要显示,本发明公开一种基于版面分析的OCR提取优化方法,涉及信息处理技术领域,包括以下步骤:图像数据预处理、图像版面布局检测、识别并区分区域大小、对各区域进行OCR文本提取、按顺序读取并拼接文本;本发明通过对图像的像素优化处理,可显著提升后续OCR识别和版面布局分析的效果,并结合布局检测与OCR,依照坐标进行大小区域区分并进行相关的处理,实现对复杂排版的图像的信息抽取,能准确保持原有的文本顺序和结构,并保证信息抽取的准确性,针对不规整模糊的布局也能保证较好的检测效果,且能避免信息重复。
天眼查资料显示,天清数安(天津)科技有限公司,成立于2023年,位于天津市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本100万人民币,实缴资本100万人民币。通过天眼查大数据分析,天清数安(天津)科技有限公司财产线索方面有商标信息8条,专利信息5条,此外企业还拥有行政许可1个。
本文源自:金融界
作者:情报员
热门跟贴