来源:市场资讯

(来源:计算机视觉研究院)

计算机视觉研究院

打开网易新闻 查看精彩图片

公众号ID|计算机视觉研究院

学习群|扫码在主页获取加入方式

https://pmc.ncbi.nlm.nih.gov/articles/PMC13027672/pdf/jimaging-12-00140.pdf

计算机视觉研究院专栏

Column of Computer Vision Institute

传统检测方法受限于无人机像素占比小、易与鸟类 / 飞机混淆、易被遮挡等问题,精度与速度难以兼顾。基于此,本文提出YOLOv11n‑ResCBAM+P2检测框架,在保证实时推理的同时,大幅提升小目标检测精度。

PART/1

痛点

  • 像素占比极小:远距离无人机在画面中仅占少量像素,细节极易丢失。
  • 易混淆干扰:外观与鸟类、小型飞机高度相似,易造成误检。
  • 复杂环境干扰:遮挡、光照变化、背景杂乱大幅降低检测稳定性。
  • 精度速度失衡:高精度模型推理慢,轻量化模型检测小目标能力弱。

PART/2

技术创新

技术创新:两大升级破解检测难题

1. 残差注意力模块 ResCBAM

  • 融合通道注意力 + 空间注意力,精准聚焦无人机关键特征。

  • 引入残差连接,避免特征过度抑制,保留原始上下文信息。

  • 解决传统 CBAM 易丢失小目标细节的问题,提升特征判别力。

2. 高分辨率 P2 检测头

  • 新增stride=4 的 P2 检测头,特征分辨率提升至 160×160。

  • 保留下采样前的精细空间信息,大幅改善小目标定位精度。

  • 适配 YOLO 部署流程,兼顾架构简洁性与计算效率。

模型架构对比:
打开网易新闻 查看精彩图片
模型架构对比:

(YOLOv11n‑ResCBAM+P2 整体架构)

打开网易新闻 查看精彩图片

(通道注意力 + 空间注意力结构)

PART/3

实验数据

1. 数据集构建

  • 自建数据集:4917 张原图→增强后 11733 张,覆盖无人机、鸟类、飞机 3 类。

  • 场景丰富:昼夜、阴晴、城市 / 乡村 / 天空等复杂环境,含大量遮挡样本。

数据集详情:
打开网易新闻 查看精彩图片
数据集详情:

(数据集类别与数量分布)

2. 核心性能指标

  • 精度(Precision):0.968

  • 召回率(Recall):0.921

  • mAP@0.5:0.969

  • mAP@0.5–0.95:0.845(较基线 YOLOv11n 提升 7.9%)

  • 推理速度:50.51 FPS(远超 30 FPS 实时标准)

消融实验对比:
打开网易新闻 查看精彩图片
消融实验对比:

(不同模块组合性能结果)

3. 类别检测效果

无人机 mAP@0.5 达0.982,飞机0.982,鸟类0.844,三类目标区分清晰,误检率极低。

类别性能详情:
打开网易新闻 查看精彩图片
类别性能详情:

(三类目标逐类检测结果)

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

(F1、精确率 - 召回率、混淆矩阵)

4. 跨数据集验证

在 VisDrone2019‑DET、UAVDT 公开数据集测试,mAP@0.5 分别达0.943、0.912,泛化能力优异。

跨数据集结果:
打开网易新闻 查看精彩图片
跨数据集结果:

(多数据集验证性能)

5. 主流模型对比

优于 Faster R‑CNN、SSD、YOLOv8/v10/v12 等模型,在小目标定位精度上表现突出,平衡精度与速度。

模型对比详情:
打开网易新闻 查看精彩图片
模型对比详情:

(与 SOTA 模型精度、速度、参数量对比)

打开网易新闻 查看精彩图片

PART/4

总结

1. 落地场景

  • 重点区域安防:机场、核电站、政府驻地低空防护。

  • 城市低空管控:无人机违规飞行实时监测与预警。

  • 反制系统前端:为无人机干扰、拦截提供精准目标定位。

2. 现存不足

  • P2 头带来一定计算开销,速度较基线有所下降。

  • 数据集以日间 RGB 为主,夜间、红外场景仍需优化。

3. 未来规划

  • 模型压缩(剪枝、量化)提升推理速度。

  • 扩充多模态、复杂天气数据集,增强鲁棒性。

  • 融合时序信息,实现视频流无人机跟踪。

结语

YOLOv11n‑ResCBAM+P2 为复杂空域小型无人机实时检测提供了高效解决方案,以7.9% 的精度提升与50.51 FPS 实时推理,兼顾安防场景的高精准需求与工程落地可行性,为低空安全筑牢智能防线。

打开网易新闻 查看精彩图片

有相关需求的你可以联系我们!