来源:市场资讯

(来源:计算机视觉研究院)

计算机视觉研究院

打开网易新闻 查看精彩图片

公众号ID|计算机视觉研究院

学习群|扫码在主页获取加入方式

https://pmc.ncbi.nlm.nih.gov/articles/PMC12965699/pdf/pcbi.1014036.pdf

计算机视觉研究院专栏

Column of Computer Vision Institute

本文提出融合视觉运动 + 亮度双特征的 ml‑SOD 模型,攻克复杂背景下微小移动物体检测难题,

PART/1

创新

核心创新:运动 + 亮度双特征融合,颠覆传统思路

现有仿生模型大多只依赖亮度信号,忽略了视觉运动的关键作用。本次研究首次提出:视觉运动特征与亮度特征同等重要,二者协同才能实现高效小目标检测。

团队构建的ml‑SOD 模型分为三阶段:

  1. 提取全视野无方向视觉运动信号(模拟果蝇 T4/T5 细胞)

  2. 同视皮层位置,延迟运动信号 × 反极性亮度信号非线性融合

  3. 小叶柱状细胞(LC)时空平滑整合,输出检测结果

ml‑SOD 模型网络结构与三阶段处理流程

打开网易新闻 查看精彩图片

PART/2

优势

关键能力:超敏锐检测 + 强抗干扰,碾压传统模型

1. 超敏锐视觉:突破分辨率极限

模型能检测1×1 像素的超小目标,实现视觉超敏锐检测,远超模拟复眼的空间分辨率,这是传统模型难以实现的能力。

模型对超小目标的超敏锐检测响应

打开网易新闻 查看精彩图片

2. 强抗干扰:动态背景也能稳抓目标

面对移动背景、闪烁噪声,仅靠亮度的 ESTMD 模型极易失效;而 ml‑SOD 依托运动特征,高对比度小目标在全速度范围背景下都能稳定检出,抗干扰能力大幅提升。

动态背景下高对比度目标检测效果

打开网易新闻 查看精彩图片

3. 模型对比:性能全面领先

与纯 ESTMD 模型对比,ml‑SOD 在静态 / 动态背景、闪烁干扰、不同目标尺寸速度下,F 值、检测率全面占优,噪声更少、鲁棒性更强。

ml‑SOD 与 ESTMD 模型性能对比

打开网易新闻 查看精彩图片

4. 双臂 / 三臂运动检测器通用

替换为最新发现的果蝇三臂运动检测器,模型核心性能不下降,适配最新神经科学发现,通用性极强。

三臂检测器版本模型性能验证

打开网易新闻 查看精彩图片

PART/3

验证

真实场景验证:红外无人机、复杂视频全 hold 住

团队用RIST 真实场景数据集(复杂环境小目标)与IR 红外数据集(微弱无人机目标)全量测试:

  • ml‑SOD(双臂)检测率最高,假警率最低

  • 处理速度超90 帧 / 秒,下采样后达260 帧 / 秒

  • 无需训练、轻量化,适合边缘端部署

真实数据集测试结果

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

PART/4

研究意义与未来

这项研究首次系统证明视觉运动在小目标检测中的核心价值,为无人机安防、自动驾驶、工业检测等领域提供轻量化、高鲁棒性的仿生视觉新方案,也为解析昆虫视觉神经机制提供关键理论支撑。

未来团队将优化静态目标检测、深度自适应模块,让仿生视觉更贴近自然、更适配真实场景。

有相关需求的你可以联系我们!