来源:市场资讯
(来源:计算机视觉研究院)
计算机视觉研究院
公众号ID|计算机视觉研究院
学习群|扫码在主页获取加入方式
https://pmc.ncbi.nlm.nih.gov/articles/PMC12965699/pdf/pcbi.1014036.pdf
计算机视觉研究院专栏
Column of Computer Vision Institute
本文提出融合视觉运动 + 亮度双特征的 ml‑SOD 模型,攻克复杂背景下微小移动物体检测难题,
PART/1
创新
核心创新:运动 + 亮度双特征融合,颠覆传统思路
现有仿生模型大多只依赖亮度信号,忽略了视觉运动的关键作用。本次研究首次提出:视觉运动特征与亮度特征同等重要,二者协同才能实现高效小目标检测。
团队构建的ml‑SOD 模型分为三阶段:
提取全视野无方向视觉运动信号(模拟果蝇 T4/T5 细胞)
同视皮层位置,延迟运动信号 × 反极性亮度信号非线性融合
小叶柱状细胞(LC)时空平滑整合,输出检测结果
ml‑SOD 模型网络结构与三阶段处理流程
PART/2
优势
关键能力:超敏锐检测 + 强抗干扰,碾压传统模型
1. 超敏锐视觉:突破分辨率极限
模型能检测1×1 像素的超小目标,实现视觉超敏锐检测,远超模拟复眼的空间分辨率,这是传统模型难以实现的能力。
模型对超小目标的超敏锐检测响应
2. 强抗干扰:动态背景也能稳抓目标
面对移动背景、闪烁噪声,仅靠亮度的 ESTMD 模型极易失效;而 ml‑SOD 依托运动特征,高对比度小目标在全速度范围背景下都能稳定检出,抗干扰能力大幅提升。
动态背景下高对比度目标检测效果
3. 模型对比:性能全面领先
与纯 ESTMD 模型对比,ml‑SOD 在静态 / 动态背景、闪烁干扰、不同目标尺寸速度下,F 值、检测率全面占优,噪声更少、鲁棒性更强。
ml‑SOD 与 ESTMD 模型性能对比
4. 双臂 / 三臂运动检测器通用
替换为最新发现的果蝇三臂运动检测器,模型核心性能不下降,适配最新神经科学发现,通用性极强。
三臂检测器版本模型性能验证
PART/3
验证
真实场景验证:红外无人机、复杂视频全 hold 住
团队用RIST 真实场景数据集(复杂环境小目标)与IR 红外数据集(微弱无人机目标)全量测试:
ml‑SOD(双臂)检测率最高,假警率最低
处理速度超90 帧 / 秒,下采样后达260 帧 / 秒
无需训练、轻量化,适合边缘端部署
真实数据集测试结果
PART/4
研究意义与未来
这项研究首次系统证明视觉运动在小目标检测中的核心价值,为无人机安防、自动驾驶、工业检测等领域提供轻量化、高鲁棒性的仿生视觉新方案,也为解析昆虫视觉神经机制提供关键理论支撑。
未来团队将优化静态目标检测、深度自适应模块,让仿生视觉更贴近自然、更适配真实场景。
有相关需求的你可以联系我们!
热门跟贴