来源:市场资讯

(来源:计算机视觉研究院)

计算机视觉研究院

打开网易新闻 查看精彩图片

公众号ID|计算机视觉研究院

学习群|扫码在主页获取加入方式

https://pmc.ncbi.nlm.nih.gov/articles/PMC12656552/pdf/sensors-25-07088.pdf

计算机视觉研究院专栏

Column of Computer Vision Institute

本文提出的RMH-YOLO模型,在保持轻量高效的同时,大幅提升航拍小目标检测精度。

PART/1

痛点

无人机航拍视角下的小目标(通常<32×32 像素)检测,面临四大核心挑战:

  1. 像素极少:目标特征微弱,传统模型难以提取有效信息
  2. 尺度剧变:飞行高度、角度动态变化,目标大小跨度大
  3. 背景复杂:植被、建筑、道路等干扰强,目标易被淹没
  4. 光照多变:强光、阴影、弱光环境大幅降低特征辨识度

现有 YOLO 系列模型在这类场景下,漏检、误检问题突出,且难以兼顾精度与嵌入式部署的轻量化需求。

PART/2

创新

RMH-YOLO 以 YOLOv8n 为基线,通过4 项核心改进,专为无人机航拍小目标优化,实现特征增强、高效融合、轻量推理、精准定位。

打开网易新闻 查看精彩图片

【RMH-YOLO 模型结构】

  1. 精细特征模块 RFM融合通道 + 空间双注意力机制,嵌入骨干网络,强化小目标弱特征表达,保留上下文信息,解决低分辨率下特征丢失问题。

  2. 多尺度聚焦扩散 MFFD 网络替代传统 PAFPN,通过聚焦 - 扩散双路径,保留浅层高分辨率空间细节,将细粒度信息传递到深层语义特征,杜绝小目标特征稀释。

  3. 轻量 CS-Head 检测头采用参数共享卷积,去除冗余计算,适配无人机嵌入式平台,在不损失检测能力的前提下,大幅降低参数量与计算量。

  4. 优化损失函数组合NWD 归一化瓦瑟斯坦距离与InnerCIoU,解决小目标框回归不稳定、定位不准的问题,提升复杂场景下的框精度。

PART/3

实验

实验验证:精度飙升,轻量高效

团队在VisDrone2019(无人机主流检测数据集)与TinyPerson(超小目标数据集)上完成全面验证,结果亮眼:

1. 核心指标对比 YOLOv8n

打开网易新闻 查看精彩图片

【整体模块消融实验结果】

  • 精度:53.0%(+8.8%)

  • 召回率:40.4%(+7.4%)

  • mAP50:42.4%(+9.2%)

  • mAP50:95:25.7%(+6.4%)

  • 参数量仅1.3M,计算量 16.7G FLOPs,极致轻量化

2. 完胜主流 YOLO 系列

打开网易新闻 查看精彩图片

【与 YOLO 系列模型对比】

RMH-YOLOv8n/v8s 在精度、召回、mAP 全维度超越 YOLOv8/10/11/12,同时参数量更低,兼顾性能与部署性。

3. 可视化效果:复杂场景稳准检测

打开网易新闻 查看精彩图片

【各场景检测结果对比】

复杂背景、远距离密集目标、低光 / 强光场景下,RMH-YOLO 漏检率远低于基线,小目标识别更稳定。

打开网易新闻 查看精彩图片

【模型注意力热力图对比】

热力图显示,模型能精准聚焦小目标区域,不受复杂背景、光照干扰,注意力分配更合理。

PART/4

总结

RMH-YOLO 实现了高精度 + 轻量型的完美平衡,完美适配无人机机载嵌入式部署,可广泛应用于:

  • 城市交通巡检:行人、非机动车小目标精准识别

  • 应急救援:复杂环境下人员、物资快速定位

  • 安防监控:高空全域小目标实时监测

  • 基建巡检:小型缺陷、隐患精准捕捉

该模型为无人机航拍小目标检测提供了全新解决方案,兼顾学术创新与工程落地价值,推动无人机视觉监测向更精准、更高效方向发展。

有相关需求的你可以联系我们!