金融界2025年4月22日消息,国家知识产权局信息显示,西安电子科技大学和OPPO广东移动通信有限公司申请一项名为“视频文本检索模型的训练方法、装置、设备及存储介质”的专利,公开号CN119848294A,申请日期为2023年10月。

专利摘要显示,本申请公开了一种视频文本检索模型的训练方法、装置、电子设备及存储介质,该方法包括:获取训练样本;对原始视频和文本数据进行特征提取,得到视频帧特征和文本特征,其中,视频帧特征包括全局视频帧特征和局部视频帧特征;根据视频特征和文本特征对视频文本检索模型进行训练,并得到进行训练时的损失函数,其中,损失函数基于第一相似度值和第二相似度值确定,第一相似度值基于局部视频特征和文本特征进行训练得到,第二相似度值基于全局视频特征和文本特征进行训练得到;在根据损失函数确定训练完成的情况下,得到训练好的视频文本检索模型。提高了视频检索匹配的准确性。

本文源自:金融界

作者:情报员