国家知识产权局信息显示,中图科信数智技术(北京)有限公司申请一项名为“基于多模态大模型的期刊目录提取整合方法”的专利,公开号CN121787378A,申请日期为2025年12月。
专利摘要显示,本发明公开了基于多模态大模型的期刊目录提取整合方法,首先采用多模态大模型解析PDF,提取页面编号、文本框坐标及内容,经空白字符统一、非核心字符过滤处理后,通过多维度规则校验统计目录特征行,再以双阈值判定机制定位目录页范围;随后对目录页灰度图执行组合滤波去噪、自适应阈值二值化及形态学后处理,生成高质量二值化图;依据文本框坐标裁剪并通过垂直投影法分行,经OCR识别得到单行文本;基于页码位置、长度规则筛选候选页码行,借助大语言模型语义校验排除误匹配,输出结构化数据。最后针对不同排版,采用不同合并方法,整合为完整目录条目。
天眼查资料显示,中图科信数智技术(北京)有限公司,成立于2015年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本1000万人民币。通过天眼查大数据分析,中图科信数智技术(北京)有限公司共对外投资了1家企业,参与招投标项目42次,财产线索方面有商标信息67条,专利信息45条,此外企业还拥有行政许可1个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
热门跟贴