国家知识产权局信息显示,广州数说故事信息科技有限公司申请一项名为“一种基于多模态大模型的细粒度视觉识别方法”的专利,公开号CN121053481A,申请日期为2025年7月。

专利摘要显示,本申请涉及计算机视觉的技术领域,提出一种基于多模态大模型细粒度视觉识别方法;所述方法包括:构建数据集;基于预设的若干种维度,利用多模态大模型对数据集的每张图片的各个维度分别进行描述,得到每张图片的图片描述;基于所述图片描述,利用多模态大模型生成对比学习数据集;基于所述图片描述,利用多模态大模型生成推理模型数据集;利用所述对比学习数据集和所述推理模型数据集训练所述多模态大模型,得到训练好的多模态大模型;将细粒度识别对象的待识别图片输入训练好的多模态大模型,训练好的多模态大模型输出待识别图片的细粒度识别结果;采用本方法能够提升细粒度识别结果的精度。

天眼查资料显示,广州数说故事信息科技有限公司,成立于2015年,位于广州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本2593.4086万人民币。通过天眼查大数据分析,广州数说故事信息科技有限公司共对外投资了17家企业,参与招投标项目110次,财产线索方面有商标信息46条,专利信息67条,此外企业还拥有行政许可32个。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

本文源自:市场资讯

作者:情报员