国家知识产权局信息显示,南昌航空大学;江西洪都航空工业集团有限责任公司申请一项名为“一种文档版面阅读顺序识别方法”的专利,公开号CN121686495A,申请日期为2026年2月。
专利摘要显示,本发明公开了一种文档版面阅读顺序识别方法。方法包括:收集文档图像,构建阅读顺序识别数据集;构建阅读顺序识别模型;阅读顺序识别模型包括图像预处理模块、多模态嵌入模块、编码器模块、自回归解码器模块;对阅读顺序识别模型的参数进行初始化得到第一阅读顺序识别模型;利用阅读顺序识别数据集训练第一阅读顺序识别模型得到第二阅读顺序识别模型;基于文档图像进行版面分析得到版面元素的类别、位置、文本内容信息,输入第二阅读顺序识别模型进行推理,得到表示版面元素阅读顺序的序列结果。本发明通过多模态嵌入模块融合版面元素的文本内容、位置坐标和类别信息,有效提升在复杂版式文档中阅读顺序识别的准确率和鲁棒性。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
热门跟贴