来源:市场资讯
(来源:计算机视觉研究院)
计算机视觉研究院
公众号ID|计算机视觉研究院
学习群|扫码在主页获取加入方式
https://pmc.ncbi.nlm.nih.gov/articles/PMC13027672/pdf/jimaging-12-00140.pdf
计算机视觉研究院专栏
Column of Computer Vision Institute
传统检测方法受限于无人机像素占比小、易与鸟类 / 飞机混淆、易被遮挡等问题,精度与速度难以兼顾。基于此,本文提出YOLOv11n‑ResCBAM+P2检测框架,在保证实时推理的同时,大幅提升小目标检测精度。
PART/1
痛点
- 像素占比极小:远距离无人机在画面中仅占少量像素,细节极易丢失。
- 易混淆干扰:外观与鸟类、小型飞机高度相似,易造成误检。
- 复杂环境干扰:遮挡、光照变化、背景杂乱大幅降低检测稳定性。
- 精度速度失衡:高精度模型推理慢,轻量化模型检测小目标能力弱。
PART/2
技术创新
技术创新:两大升级破解检测难题
1. 残差注意力模块 ResCBAM
融合通道注意力 + 空间注意力,精准聚焦无人机关键特征。
引入残差连接,避免特征过度抑制,保留原始上下文信息。
解决传统 CBAM 易丢失小目标细节的问题,提升特征判别力。
2. 高分辨率 P2 检测头
新增stride=4 的 P2 检测头,特征分辨率提升至 160×160。
保留下采样前的精细空间信息,大幅改善小目标定位精度。
适配 YOLO 部署流程,兼顾架构简洁性与计算效率。
(YOLOv11n‑ResCBAM+P2 整体架构)
(通道注意力 + 空间注意力结构)
PART/3
实验数据
1. 数据集构建
自建数据集:4917 张原图→增强后 11733 张,覆盖无人机、鸟类、飞机 3 类。
场景丰富:昼夜、阴晴、城市 / 乡村 / 天空等复杂环境,含大量遮挡样本。
(数据集类别与数量分布)
2. 核心性能指标
精度(Precision):0.968
召回率(Recall):0.921
mAP@0.5:0.969
mAP@0.5–0.95:0.845(较基线 YOLOv11n 提升 7.9%)
推理速度:50.51 FPS(远超 30 FPS 实时标准)
(不同模块组合性能结果)
3. 类别检测效果
无人机 mAP@0.5 达0.982,飞机0.982,鸟类0.844,三类目标区分清晰,误检率极低。
(三类目标逐类检测结果)
(F1、精确率 - 召回率、混淆矩阵)
4. 跨数据集验证
在 VisDrone2019‑DET、UAVDT 公开数据集测试,mAP@0.5 分别达0.943、0.912,泛化能力优异。
(多数据集验证性能)
5. 主流模型对比
优于 Faster R‑CNN、SSD、YOLOv8/v10/v12 等模型,在小目标定位精度上表现突出,平衡精度与速度。
(与 SOTA 模型精度、速度、参数量对比)
PART/4
总结
1. 落地场景
重点区域安防:机场、核电站、政府驻地低空防护。
城市低空管控:无人机违规飞行实时监测与预警。
反制系统前端:为无人机干扰、拦截提供精准目标定位。
2. 现存不足
P2 头带来一定计算开销,速度较基线有所下降。
数据集以日间 RGB 为主,夜间、红外场景仍需优化。
3. 未来规划
模型压缩(剪枝、量化)提升推理速度。
扩充多模态、复杂天气数据集,增强鲁棒性。
融合时序信息,实现视频流无人机跟踪。
结语
YOLOv11n‑ResCBAM+P2 为复杂空域小型无人机实时检测提供了高效解决方案,以7.9% 的精度提升与50.51 FPS 实时推理,兼顾安防场景的高精准需求与工程落地可行性,为低空安全筑牢智能防线。
有相关需求的你可以联系我们!
热门跟贴