楔子

楔子

研究分析工作者们都会遇到一个“老大难”问题——图片内数据提取。

当你需要就某一行业整理一份报告,首先需要参考市场中的研报、论文或智库报告。在参考源中,数据素材绝大多数都是图片或pdf格式,不可以直接复制进表格内重新编辑,你想复用的话就会面临处理麻烦,誊写缓慢,容易出错等等问题,也因此大家都会对OCR识别辅助软件产生迫切需求。

目前主流的OCR软件一般是网页在线与本地客户端两种模式,按照识别精确程度与使用次数收取软件费用。操作步骤一般需要用户将目标图片上传或导入,识别得出结果,复制进表格内开始编辑或制图。

痛点在于:

一是识别准确率不高;

二是识别性能较好的软件需要下载客户端;

三是识别结果不可直接编辑。

种种使用困难,仍在降低研究人员的工作效率。

对此现状,WarrenQ智能投研平台从使用的便捷性与识别准确率入手,提出了自己的优化方案。

解析识别功能

解析识别功能

WarrenQ智能投研平台内部支持解析研报,可以直接抽取研报中全部图表,抽取出的图表都可以进行OCR识别;同时,本地上传的报告也支持解析抽取。

01 精确高效的OCR

01 精确高效的OCR

目前WarrenQ智能投研平台的OCR功能支持对各类图表进行解析,纯表格,折线图,柱状图,面积图都可以进行精确识别数据,OCR识别准确率超90%,可满足商业办公需求。

以下图为例,WarrenQ识别的数据精确,所有数据保真,同时识别结果支持使用者直接进行编辑处理,或存入笔记进行在线存储,或复制到本地进行整理,使用便捷,操作人性化。

打开网易新闻 查看精彩图片

目前最新版本的OCR功能已经支持无标注的图表识别,即使图片内未明确标志数据,也可通过Y轴刻度线进行数值估计,来帮助研究人员进行更多场景下的数据整理

打开网易新闻 查看精彩图片

02 便捷的数据存储

02 便捷的数据存储

图表识别的数据内容,可以结合WarrenQ智能投研平台内置的笔记、脑图写作进行在线编辑整理。

图表的OCR识别结果可直接在表格内部修改编辑,编辑结果支持一键转存入笔记内,生成文字表格,并按照研究员需要装入对应的工程管理内,形成数据收集、整理、存储的闭环操作。

同时表格素材也可直接插入脑图写作内,形成研究报告的支撑素材,无须重新编辑,一键操作。

丹渥智能最新WarrenQ智能投研平台现已上线,欢迎各位用户搜索官网咨询,谢谢!