国家知识产权局信息显示,中国大唐集团科技创新有限公司;清华大学申请一项名为“基于多智能体协作的视觉大模型数据集生成方法及装置”的专利,公开号CN121723169A,申请日期为2025年12月。
专利摘要显示,本申请涉及计算机视觉和多模态大模型技术领域,特别涉及一种基于多智能体协作的视觉大模型数据集生成方法及装置,其中,方法包括:从预先设置的测评场景中获取深度搜索任务相关的视觉数据,根据视觉数据生成测评数据集,深度搜索任务包括视觉理解推理任务和多模态搜索任务;将测评数据集输入预先构建的智能体生态系统,智能体生态系统输出合成数据;根据合成数据和真实数据生成训练数据集,利用训练数据集对预先构建的视觉大模型进行监督微调,利用监督微调后的视觉大模型执行深度搜索任务。由此,解决了相关技术中,多模态基座模型的搜索工具调用能力薄弱、搜索能力增强的数据构造有瓶颈、搜索智能体强化学习可扩展性未探索等问题。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
热门跟贴