国家知识产权局信息显示,广州像素数据技术股份有限公司申请一项名为“基于检测和字符切分的大模型答题卡OCR识别方法及系统”的专利,公开号CN121545173A,申请日期为2026年1月。
专利摘要显示,本发明涉及光学字符识别技术领域,具体涉及一种基于检测和字符切分的大模型答题卡OCR识别方法及系统。方法包括:获取答题卡图像并构建微调数据集;基于该数据集微调多模态大模型;将微调后的模型部署至边端设备;执行轻量化文本检测获取每行文本框区域;对过宽的文本行进行字符间隔切分,利用垂直投影算法检测字符间长空白区域并动态确定切分点;将切分后的子图按原始顺序进行高分辨率拼接,生成满足边端设备固定输入尺寸的图像片段;通过大模型进行OCR识别并将字符级识别结果按原始位置重排。本发明实现了大模型在边端设备上对高分辨率答题卡图像的高效处理,解决了显存受限与语义信息丢失的矛盾,显著提升了OCR识别速度与准确率。
天眼查资料显示,广州像素数据技术股份有限公司,成立于1998年,位于广州市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本2286万人民币。通过天眼查大数据分析,广州像素数据技术股份有限公司共对外投资了2家企业,参与招投标项目560次,财产线索方面有商标信息10条,专利信息67条,此外企业还拥有行政许可15个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
热门跟贴