国家知识产权局信息显示,哈尔滨工业大学(威海);上海龙垣科技有限公司申请一项名为“基于双重注意力多模态融合的文本生成方法”的专利,公开号CN121580983A,申请日期为2025年11月。
专利摘要显示,本发明涉及自然语言处理技术领域,具体涉及一种基于双重注意力多模态融合的文本生成方法,包括:利用视觉特征提取器获取图像特征,并通过文本嵌入模块对可选输入文本进行语义编码;将视觉特征输入双重注意力增强模块,由位置注意力和通道注意力分支并行处理;将视觉特征、注意力模块输出及文本嵌入结果进行融合,并送入Transformer编码器进行深度表示;结合引导记忆生成器维护历史信息,通过上下文引导归一化机制动态调整解码器参数;最后在解码器中通过自回归与交叉注意力生成文本。本发明在多模态信息融合中兼顾空间与通道维度特征,提升生成准确性和连贯性,解决了现有技术中文本生成质量不佳的问题。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
热门跟贴