金融界 2025 年 5 月 12 日消息,国家知识产权局信息显示,北京网藤科技有限公司申请一项名为“一种文本坐标定位和遮罩层实现 pdf 高亮的方法及系统”的专利,公开号 CN119962481A,申请日期为 2025 年 4 月。
专利摘要显示,本发明公开了一种文本坐标定位和遮罩层实现 pdf 高亮的方法及系统,涉及 pdf 文件处理领域。具体公开了对若干个 pdf 文件进行预处理;按照页码遍历读取各文件的文字和坐标数据;采用多种文本分行切分策略对文本进行分割得到多行文本;将多行文本拼接成文本块,并对每行文本数据的坐标数据进行组合计算;将处理后的文本数据和对应的坐标数据存储到向量数据库;根据问题检索到相关文本数据,获取对应的文件名称、页码和坐标数据并传递给前端的预览页面;按照每个页码进行遍历是否包含关键句;对包含关键句的页面的坐标数据进行遍历;为每个关键句创建高亮的遮罩层。本发明能够在应用大语言模型进行 pdf 文件检索时,方便用户查看对应召回知识。
天眼查资料显示,北京网藤科技有限公司,成立于2016年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本1653.4862万人民币。通过天眼查大数据分析,北京网藤科技有限公司共对外投资了5家企业,参与招投标项目121次,财产线索方面有商标信息6条,专利信息113条,此外企业还拥有行政许可14个。
本文源自:金融界
作者:情报员
热门跟贴