国家知识产权局信息显示,哈尔滨工业大学(威海);上海龙垣科技有限公司申请一项名为“基于文本引导混合专家机制的多模态视频序列分割方法”的专利,公开号CN121725393A,申请日期为2025年12月。
专利摘要显示,本发明涉及深度学习语义分割技术领域,具体涉及一种基于文本引导混合专家机制的多模态视频序列分割方法;方法包括:将所述多模态融合特征矩阵输入至预训练大模型的解码器,预测生成分割掩码,并进行可视化处理,输出语义分割图;将预测生成的分割掩码和文本特征矩阵输入文本引导的记忆编码器中,编码得到多模态记忆特征矩阵;将所述记忆特征矩阵存储至记忆库,在下一轮解码时,从记忆库中通过注意力机制进行关键时刻的语义补充;通过文本引导专家选择路由实现跨模态精准融合,结合记忆编码与历史语义补充强化时序一致性,解决纯视觉语义混淆、多模态适配差及时序连贯性不足的问题。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
热门跟贴