国家知识产权局信息显示,天津师范大学和天津艾思科尔科技有限公司申请一项名为“一种基于文本增强视觉语言模型的行人重识别方法”的专利,公开号CN121617043A,申请日期为2026年2月。

专利摘要显示,本发明公开了一种基于文本增强视觉语言模型行人重识别方法,该方法包括:构建视觉特征提取模块,提取得到RGB行人图像的视觉特征;构建文本特征提取模块,提取得到行人文本描述的文本特征;构建文本摘要模块,生成行人文本描述的摘要特征;构建损失计算模块,得到最优行人重识别模型;构建行人检索模块,利用最优行人重识别模型得到行人图像检索结果。本发明有效地通过引入文本摘要模块,生成更具判别力的行人文本描述的摘要特征,为充分利用行人文本描述的摘要特征又提出了摘要特征约束损失函数,从而进一步提高了行人重识别的准确率。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

本文源自:市场资讯

作者:情报员