国家知识产权局信息显示,吉旗(成都)科技有限公司申请一项名为“多模态检索方法、装置、设备和存储介质”的专利,公开号CN122019584A,申请日期为2025年12月。

专利摘要显示,本发明提供一种多模态检索方法、装置、设备和存储介质,该方法包括:根据待处理文档的渲染特性确定解析策略;基于解析策略对其进行解析,提取得到待处理文档中的图像内容,并生成图像内容对应的图像描述文本;将图像内容和图像描述文本通过原位语义注入方式,融合回文本内容对应的文本流中的原始逻辑位置处,形成图文融合的中间表示;基于语义完整性约束对中间表示分块处理,基于各文本分块和图像关联元数据构建多模态知识库;基于用户查询,在多模态知识库中进行向量检索,召回包括相关图文语义的文本向量块,并生成融合图像引用的目标答案。本发明有效解决了多模态检索时知识库文档中图片无法准确解析召回的问题。

天眼查资料显示,吉旗(成都)科技有限公司,成立于2017年,位于成都市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本10600万美元。通过天眼查大数据分析,吉旗(成都)科技有限公司参与招投标项目1次,专利信息155条,此外企业还拥有行政许可2个。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

本文源自:市场资讯

作者:情报员