参数量砍半、精度涨 2.8%！专为无人机打造的轻量化小目标检测模型 BPD-YOLO 来了|人工智能模型|基线|无人机|检测模型|计算量

来源：市场资讯

（来源：计算机视觉研究院）

计算机视觉研究院

公众号ID｜计算机视觉研究院

学习群｜扫码在主页获取加入方式

https://pmc.ncbi.nlm.nih.gov/articles/PMC12397394/pdf/41598_2025_Article_16878.pdf

计算机视觉研究院专栏

Column of Computer Vision Institute

本文基于 YOLOv8 提出了一套专为无人机小目标检测设计的轻量化方案 ——BPD-YOLO。它通过重构特征金字塔网络，在 VisDrone 数据集上实现了mAP50 提升 2.8%，同时参数量从 2.92M 砍到 1.50M，真正做到了又轻又准。

PART/1

痛点

无人机航拍图像分辨率高、细节多，但小目标占比极高，检测难度远大于普通场景，核心有三大痛点：

：小目标仅占几个像素，极易和背景混淆，漏检率高；

：人群、车流密集排布，相互遮挡容易造成误检；

：同一张图里大小目标并存，普通模型很难兼顾。

从数据分布就能直观看到：普通数据集中大目标占比超 68%，而无人机专用数据集里，极小 + 小目标占比超过 68%，TinyPerson 数据集更是 80% 以上都是极小目标。

传统的 FPN 特征金字塔虽然能融合深浅层特征，但存在两个硬伤：一是深层大量堆叠残差块，计算冗余严重；二是深浅层直接融合存在 “语义鸿沟”，深层抽象语义会冲散浅层细节，反而拖累小目标检测效果。

PART/2

创新

针对上述问题，团队设计了全新的L-FPN（轻量化特征金字塔网络），替代 YOLOv8 原生的 FPN+PANet 结构，以此为基础打造了 BPD-YOLO 检测器。

整个方案围绕 “浅层保细节、深层做融合、减参不减效” 的思路，核心包含四大关键设计：

1. 双阶段渐进特征融合机制（DAFF）

不同于 AFPN 把浅层细节往深层传的思路，L-FPN 反向优化信息流，让深层语义高效流向浅层，专门服务小目标检测。

2. 深度空间金字塔融合模块（DSPF）

用 DSPF 替代深层的残差块，专门负责语义融合，大幅降低计算量：

3. 解耦式特征提取 - 语义整合机制（DEI）

把 “特征提取” 和 “语义融合” 拆解开，分层执行：

4. 轻量化动态上采样 DySample

替换传统的双线性 / 最近邻上采样，采用 DySample 动态调整采样点位置：

PART/3

实验

团队在无人机检测经典数据集 VisDrone2019 和极小目标数据集 TinyPerson 上做了全面实验，基线为 YOLOv8n+P2。

1. VisDrone 数据集：全面超越基线与同类方案

核心数据亮点：

对比基线 YOLOv8n+P2：mAP50 从 35.3% 提升至 38.1%（+2.8%），mAP50-95 提升 1.4%，同时 GFLOPs 从 12.2 降到 11.4，参数量从 2.92M 降至 1.50M（减幅近 50%）；
对比 YOLOv8s：BPD-YOLOn 计算量降低 60%，精度基本持平；同计算量下，BPD-YOLOs 比 YOLOv8s+P2 的 mAP50 高出 2.1%；
对比 BiFPN、AFPN 等经典改进 FPN：在精度相当或更优的前提下，参数量和计算量大幅降低。

可视化效果上，BPD-YOLO 显著减少了密集人群、远处小目标的漏检，对遮挡目标的识别也更准确。