国家知识产权局信息显示,支付宝(杭州)数字服务技术有限公司;浙江大学申请一项名为“通过文本生成图像的方法及装置”的专利,公开号CN121482180A,申请日期为2025年9月。
专利摘要显示,本说明书实施例提供一种通过文本生成图像的方法及装置,在基于文本生成图像的过程中,对于待生成的目标图像的描述文本,可以基于其中的实体在预先构建的多模态知识图谱中检索,得到相应的扩展子图,然后从扩展子图中提取多模态特征并融合,得到相应的扩展向量。然后,基于扩展向量和描述文本编码得到的文本向量作为条件,生成目标图像。其中,多模态知识图谱用于描述从文本中提取的实体之间的关联关系,图像作为实体的属性进行记录。如此,在扩展过程采用通过文本中的实体检索图像的方式,有利于减小计算开销,提高在大规模数据集上的泛化能力。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
热门跟贴