金融界2024年3月11日消息,据国家知识产权局公告,中国电信股份有限公司申请一项名为“视频文本的检索方法、装置及电子设备“,公开号CN117668295A,申请日期为2023年11月。

专利摘要显示,本申请公开了一种视频文本的检索方法、装置及电子设备。其中,该方法包括:通过视频文本检索模型中的文本编码器对输入的待检索文本信息进行特征提取处理,得到待检索文本特征,其中,视频文本检索模型用于依据文本信息查询视频特征,且视频文本检索模型忽略与文本信息无关的冗余信息;从视频特征库中确定与待检索文本特征的相似度大于预设阈值的目标视频特征,其中,视频特征库为使用视频文本检索模型中的图像编码器和视频编码器对视频数据进行特征提取后得到的;返回目标视频特征所对应的目标视频。本申请解决了相关技术中的视频文本检索模型包含于文本语义无关的冗余信息,存在检索准确率低的技术问题。

本文源自金融界