金融界2025年3月26日消息,国家知识产权局信息显示,抖音视界有限公司申请一项名为“种文本识别方法装置设备及介质”的专利,公开号CN 119672733 A,申请日期为2024年12月。
专利摘要显示,本公开实施例涉及一种文本识别方法、装置、设备及介质,其中该方法包括:获取待识别文本图像;将待识别文本图像输入多模态识别模型中进行识别,得到已知字符结果和第一未知字符结果;基于第一未知字符结果从待识别文本图像中提取未知字符图像;将未知字符图像输入字符识别模型中,得到第二未知字符结果;将已知字符结果和第二未知字符结果确定为待识别文本图像的识别结果。本公开通过多模态识别模型定位未知字符之后进一步利用字符识别模型对未知字符进行矫正,充分结合大小模型的能力,有效实现未知字符的精确识别,并且既能保证文本识别的准确性和鲁棒性,又能有效降低模型优化的训练成本。
天眼查资料显示,抖音视界有限公司,成立于2012年,位于北京市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本30000万美元,实缴资本30000万美元。通过天眼查大数据分析,抖音视界有限公司共对外投资了5家企业,参与招投标项目59次,财产线索方面有商标信息5000条,专利信息5000条,此外企业还拥有行政许可8个。
本文源自:金融界
作者:情报员
热门跟贴