国家知识产权局信息显示,北京邮电大学、上海芯问科技有限公司申请一项名为“基于对话引导的目标检测模型训练方法、抓取位姿生成方法及装置”的专利,公开号CN121438019A,申请日期为2025年10月。
专利摘要显示,本发明提供一种基于对话引导的目标检测模型训练方法、抓取位姿生成方法及装置。通过构建含场景图像与多轮对话的样本集,并为多轮对话中的引导提示和目标检测框坐标标注反馈类别;微调阶段,以生成语句与引导提示的交叉熵损失优化模型对话生成能力;以反馈为引导提示或检测框坐标的分类损失使模型学习输出类型的决策能力;以检测框预测损失提升检测框定位精度,得到能够理解模糊意图、主动澄清并精确定位目标的视觉语言模型。基于该模型输出的检测框结合深度图像信息进行点云重建与遮挡补全,生成完整物体点云,并通过抓取策略网络生成最优抓取位姿。本发明解决了现有模型无法处理模糊指令的问题,提升了机械臂在复杂场景下的抓取成功率。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
本文源自:市场资讯
作者:情报员
热门跟贴