来源:市场资讯

(来源:计算机视觉研究院)

计算机视觉研究院

打开网易新闻 查看精彩图片

公众号ID|计算机视觉研究院

学习群|扫码在主页获取加入方式

https://pmc.ncbi.nlm.nih.gov/articles/PMC12293038/pdf/biomimetics-10-00451.pdf

计算机视觉研究院专栏

Column of Computer Vision Institute

在无人机巡检、安防监控、军事预警等场景中,红外小目标检测因目标像素少、纹理缺失、易被背景噪声淹没,一直是技术难题。近日,山东理工大学团队提出YOLO‑HVS 算法,基于 YOLOv8 融合人类视觉系统(HVS)特性,在复杂遮挡、低信噪比下实现高精度、轻量化实时检测。

PART/1

痛点

核心痛点:红外小目标检测的两大难题

现有算法要么精度不足,要么参数量大、速度慢,无法满足实时部署需求。

PART/2

方案

创新方案:两大核心模块,精准攻克难题

团队以 YOLOv8 为基线,打造YOLO‑HVS架构,核心升级两大模块:

1. MultiSEAM 多尺度空间增强注意力模块

  • 采用三分支并行(patch=6/7/8),兼顾局部细节与全局上下文。

  • 深度可分离卷积提取空间特征,逐点卷积融合通道信息。

  • 抑制背景噪声、增强被遮挡目标特征

    ,解决遮挡导致的漏检问题。

打开网易新闻 查看精彩图片

2. C2f_DWR 区域语义双残差模块

  • 替换 YOLOv8 原 C2f 模块,用膨胀卷积 + 双阶段残差(区域残差→语义残差)。

  • 扩大感受野,高效捕获多尺度上下文,降低计算量、提升检测效率。

打开网易新闻 查看精彩图片

DWR 模块网络结构

PART/3

数据集

数据集:自建更贴合真实场景

为验证泛化性,团队构建DroneRoadVehicles 红外数据集:

  • 1028 张红外图像,拍摄高度 70–300m,覆盖大 / 中 / 小多尺度目标。

  • 包含高速、停车场、十字路口等复杂场景,昼夜、晴雾天气全覆盖。

打开网易新闻 查看精彩图片
多场景示例
打开网易新闻 查看精彩图片
不同高度对比
打开网易新闻 查看精彩图片
目标类别

PART/4

实验结果

实验结果:精度提升、轻量高效

团队在公开数据集DroneVehicle与自建数据集上全面测试:

1. 关键指标(对比 YOLOv8)

  • DroneVehicle:mAP50 达 83.4%,提升 1.1%;参数量仅增 2.3M,GFLOPs 仅增 0.1G。

  • 自建数据集:mAP50 达 97.8%,提升 0.7%,遮挡与低信噪比场景优势显著。

    DroneVehicle 对比结果
    打开网易新闻 查看精彩图片
    DroneVehicle 对比结果
     自建数据集对比结果
    打开网易新闻 查看精彩图片
    自建数据集对比结果

2. 消融实验验证

  • MultiSEAM:提升抗遮挡能力,mAP50+0.4%。

  • C2f_DWR:优化多尺度提取,降低计算量 3.7%。

  • 组合使用:精度与效率双优。

打开网易新闻 查看精彩图片

消融实验结果

3. 可视化对比

  • 小目标 + 强噪声场景:YOLOv8 漏检,YOLO‑HVS 精准检出。

  • 常规目标:检测置信度显著更高,输出更可靠。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

检测效果对比图

PART/5

总结

YOLO‑HVS 以人类视觉机制为灵感,通过 MultiSEAM 与 C2f_DWR 双模块升级,在红外小目标、复杂遮挡、多尺度变化三大难点上实现突破,同时保持轻量化与实时性。

未来团队将进一步研究动态感受野调整,适配极端尺度变化场景,为无人机红外监控、安防预警等落地提供更强技术支撑。

有相关需求的你可以联系我们!