金融界2024年9月26日消息,国家知识产权局信息显示,上海蜜度数字科技有限公司申请一项名为“训练数据获取方法及系统、文本识别方法、设备及介质”的专利,公开号CN 118692093 A,申请日期为2024年6月。
专利摘要显示,本申请提供一种训练数据获取方法及系统、文本识别方法、设备及介质,所述训练数据获取方法包括:获取输入信息;所述输入信息包括文本行集合、文本框集合、参考图片与背景图像;基于所述文本行集合、所述文本框集合与所述参考图片获取文本特征矩阵;基于所述文本行集合与所述背景图像获取背景特征矩阵;基于所述文本特征矩阵和所述背景特征矩阵获取文本行潜在特征和图像潜在特征;基于所述文本行潜在特征和所述文本行集合获取文本识别训练数据;以及基于所述图像潜在特征和所述文本框集合获取文本检测训练数据。本申请能够同时获取文本识别的识别训练数据集和检测训练数据集。
本文源自:金融界
作者:情报员
热门跟贴