金融界2024年10月29日消息,国家知识产权局信息显示,深圳元戎启行科技有限公司申请一项名为“一种多模态长尾数据挖掘方法、系统、车辆及存储介质”的专利,公开号CN 118823474 A,申请日期为2024年7月。

专利摘要显示,本发明公开了一种多模态长尾数据挖掘方法、系统、车辆及存储介质,基于参数微调后的CLIP模型对长尾数据进行数据挖掘,得到长尾数据的数据挖掘结果;其中,CLIP模型的参数微调的步骤为:利用预先训练的CLIP模型对多个样本图像进行单目标分类,得到单目标分类预测结果,接收对单目标分类预测结果中多个语义类别的标注信息,得到标注样本集,基于标注样本集得到参数微调的CLIP模型。本实施例方法通过人工标注增加语义类别数据,以人工标注的语义类别数据对CLIP模型进行微调,利用微调后的CLIP模型对长尾数据进行挖掘,从而实现更有效的挖掘出预定义语义类别,提高了长尾数据挖掘的准确度

本文源自:金融界

作者:情报员