来源:市场资讯
(来源:计算机视觉研究院)
计算机视觉研究院
公众号ID|计算机视觉研究院
学习群|扫码在主页获取加入方式
https://pmc.ncbi.nlm.nih.gov/articles/PMC12293038/pdf/biomimetics-10-00451.pdf
计算机视觉研究院专栏
Column of Computer Vision Institute
在无人机巡检、安防监控、军事预警等场景中,红外小目标检测因目标像素少、纹理缺失、易被背景噪声淹没,一直是技术难题。近日,山东理工大学团队提出YOLO‑HVS 算法,基于 YOLOv8 融合人类视觉系统(HVS)特性,在复杂遮挡、低信噪比下实现高精度、轻量化实时检测。
PART/1
痛点
核心痛点:红外小目标检测的两大难题
现有算法要么精度不足,要么参数量大、速度慢,无法满足实时部署需求。
PART/2
方案
创新方案:两大核心模块,精准攻克难题
团队以 YOLOv8 为基线,打造YOLO‑HVS架构,核心升级两大模块:
1. MultiSEAM 多尺度空间增强注意力模块
采用三分支并行(patch=6/7/8),兼顾局部细节与全局上下文。
深度可分离卷积提取空间特征,逐点卷积融合通道信息。
- 抑制背景噪声、增强被遮挡目标特征
,解决遮挡导致的漏检问题。
打开网易新闻 查看精彩图片
2. C2f_DWR 区域语义双残差模块
打开网易新闻 查看精彩图片
DWR 模块网络结构
PART/3
数据集
数据集:自建更贴合真实场景
为验证泛化性,团队构建DroneRoadVehicles 红外数据集:
1028 张红外图像,拍摄高度 70–300m,覆盖大 / 中 / 小多尺度目标。
包含高速、停车场、十字路口等复杂场景,昼夜、晴雾天气全覆盖。
多场景示例
打开网易新闻 查看精彩图片不同高度对比
打开网易新闻 查看精彩图片目标类别
打开网易新闻 查看精彩图片
PART/4
实验结果
实验结果:精度提升、轻量高效
团队在公开数据集DroneVehicle与自建数据集上全面测试:
1. 关键指标(对比 YOLOv8)
DroneVehicle:mAP50 达 83.4%,提升 1.1%;参数量仅增 2.3M,GFLOPs 仅增 0.1G。
自建数据集:mAP50 达 97.8%,提升 0.7%,遮挡与低信噪比场景优势显著。
打开网易新闻 查看精彩图片DroneVehicle 对比结果
打开网易新闻 查看精彩图片自建数据集对比结果
2. 消融实验验证
MultiSEAM:提升抗遮挡能力,mAP50+0.4%。
C2f_DWR:优化多尺度提取,降低计算量 3.7%。
组合使用:精度与效率双优。
消融实验结果
3. 可视化对比
小目标 + 强噪声场景:YOLOv8 漏检,YOLO‑HVS 精准检出。
常规目标:检测置信度显著更高,输出更可靠。
检测效果对比图
PART/5
总结
YOLO‑HVS 以人类视觉机制为灵感,通过 MultiSEAM 与 C2f_DWR 双模块升级,在红外小目标、复杂遮挡、多尺度变化三大难点上实现突破,同时保持轻量化与实时性。
未来团队将进一步研究动态感受野调整,适配极端尺度变化场景,为无人机红外监控、安防预警等落地提供更强技术支撑。
有相关需求的你可以联系我们!
热门跟贴