在无人机高空搜索中,目标过小看不清或被遗漏的问题,将在这项新技术的加持下成为历史。近日,中国科学院上海微系统与信息技术研究所仿生视觉系统实验室李嘉茂研究员、朱冬晨研究员团队,在机器视觉弱小目标检测领域取得重要进展,具身智能即将拥有一双明察秋毫的“超级眼睛”。
团队方法对复杂街景进行目标检测能够显著提升小目标检出率
据介绍,目标检测是具身智能实现场景理解与环境交互的基石。在无人机图像探测等典型应用中,受观测视角、拍摄距离、传感器分辨率等成像条件限制,所获取的图像中常包含大量微小且密集的关键目标。与常规尺寸目标相比,弱小目标因像素占比极低,在检测任务上存在明显的性能瓶颈。
“我们提出了一种名为DAWDet的创新方法,可以把它想象成一个视力超强、又特别细心的人工智能眼睛,经过专门训练,可在无人机航拍、自动驾驶摄像头拍摄的复杂图像中,精准地找出那些非常小、非常模糊又挤在一起的目标,比如远处的小型车辆、密集的人群、微小的故障点等等。”朱冬晨解释说,DAWDet通过设计多项针对性机制有效提升弱小目标检测性能,可根据图像内容智能调整“关注力”,在不同层面对小目标进行精细捕捉,此外,还将弱小目标进行增强,同时抓取整体轮廓和局部细节,让小目标不再模糊难辨 。
团队方法在RGBT-Tiny数据集(2025)上达到最优性能
该模型在无人机场景数据集Visdrone-2019、可见光-热红外数据集RGBT-Tiny以及驾驶场景数据集SODA-D上,性能全面超越目前先进目标检测器,在检测精度和运算效率等方面均体现明显优势。“这意味着,未来,即使在夜晚、大雾等复杂的环境和天气中,都可以更精细、更准确、更可靠地识别到弱小的目标,为无人机探测识别、自动驾驶、智能机器人等领域带来更强大的技术支持。”朱冬晨表示。
该成果被模式识别与人工智能领域的国际顶级期刊 《模式识别》(Pattern Recognition)刊发,这一研究也得到了科技部科技创新2030、中国科学院青促会、上海市优秀学术带头人等项目支持。
通讯员: 王荣会
编辑:吴宇卿
点赞分享给身边的人
热门跟贴