国家知识产权局信息显示,中国电子科技集团有限公司电子科学研究院申请一项名为“一种基于自适应约束生成的多模态视觉理解方法”的专利,公开号CN121280784A,申请日期为2025年10月。

专利摘要显示,本发明涉及一种基于自适应约束生成的多模态视觉理解方法,方法包括通过第一模型对被识别图像进行粗筛识别,粗筛识别输出被识别图像中的各被识别对象的基础类别信息;获取识别质量评估结果,识别质量评估结果包括对粗筛识别的识别质量进行评估后得到的结果;根据识别质量评估结果以及基础类别信息形成识别约束;其中,当识别质量评估结果不符合预期结果时,识别约束在粗筛识别所识别出的基础类别的基础上放宽;通过第二模型在识别约束的约束下对被识别图像进行二次识别,二次识别被允许在识别约束所限制的类别范围内识别出新的对象,并按照指定的格式要求输出二次识别结果。上述方法使得识别模型在保持开放性的同时确保输出的可靠性和一致性。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

本文源自:市场资讯

作者:情报员