国家知识产权局信息显示,上海奥腾计算机科技有限公司申请一项名为“一种基于扩散模型的渐进式跨模态图像文本对齐方法”的专利,公开号CN121279319A,申请日期为2025年9月。
专利摘要显示,本发明涉及一种基于扩散模型的渐进式跨模态图像文本对齐方法,属于人工智能技术领域。其中,该方法包括:通过预训练的视觉编码器提取输入图像的层级化特征表示;将文本描述映射为标记序列,生成初始噪声文本表征;构建基于去噪扩散概率模型的文本生成网络;建立词汇生成与特定图像区域的显式关联并生成初始噪声文本表征;基于初始噪声文本表征进行逆扩散;依赖全局注意力稳定生成语句主干成分,通过局部注意力优化实体修饰词及空间关系描述;当逆扩散过程完成时,将最终去噪输出的标记序列通过词汇解码器转换为自然语言描述。能够有效捕捉图像中的细粒度信息,并将其与文本描述中的关键元素进行关联,从而提升跨模态理解的准确性。
天眼查资料显示,上海奥腾计算机科技有限公司,成立于2001年,位于上海市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本500万人民币。通过天眼查大数据分析,上海奥腾计算机科技有限公司共对外投资了1家企业,参与招投标项目87次,财产线索方面有商标信息2条,专利信息6条,此外企业还拥有行政许可1个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
热门跟贴