金融界2025年1月31日消息,国家知识产权局信息显示,北京三狮科技有限公司申请一项名为“一种文本图像二值化的方法”的专利,公开号CN 119380351 A ,申请日期为2024年5月。
专利摘要显示,一种文本图像二值化的方法,在U‑Net的架构下引入MobileViTblock构建文本图像二值化的模型。该U‑Net的架构的左半部分主要是通过卷积,MV2和Mobile ViT block的操作,以及下采样的特征提取过程;模型的底部使用了自注意力机制模块;右半部分主要是通过上采样卷积操作来恢复图像的大小,左半部分和右半部分之间存在五次跳跃连接;最后通过Softmax激活函数得到最终二值化灰度图像。本发明模型引入轻量级的Mobile ViT模块来更好地学习提取文本图像的全局信息特征,在两个数据集上的测试结果(DIBCO2012和DIBCO2017)达到了目前最佳水平。且本发明提出的文本图像二值化方法是简单的端到端模型,无需额外图像预处理或后处理。
天眼查资料显示,北京三狮科技有限公司,成立于2015年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本500万人民币,实缴资本5.9692万人民币。通过天眼查大数据分析,北京三狮科技有限公司参与招投标项目1次,专利信息6条,此外企业还拥有行政许可4个。
本文源自:金融界
作者:情报员
热门跟贴