仿生视觉新突破！结合视觉运动与亮度特征，在仿生模型中提升微小运动目标检测性能。

新浪财经

2026-05-05 14:51 ·河北 ·优质财经领域创作者

来源：市场资讯

（来源：计算机视觉研究院）

计算机视觉研究院

公众号ID｜计算机视觉研究院

学习群｜扫码在主页获取加入方式

https://pmc.ncbi.nlm.nih.gov/articles/PMC12965699/pdf/pcbi.1014036.pdf

计算机视觉研究院专栏

Column of Computer Vision Institute

本文提出融合视觉运动 + 亮度双特征的 ml‑SOD 模型，攻克复杂背景下微小移动物体检测难题，

PART/1

创新

核心创新：运动 + 亮度双特征融合，颠覆传统思路

现有仿生模型大多只依赖亮度信号，忽略了视觉运动的关键作用。本次研究首次提出：视觉运动特征与亮度特征同等重要，二者协同才能实现高效小目标检测。

团队构建的ml‑SOD 模型分为三阶段：

提取全视野无方向视觉运动信号（模拟果蝇 T4/T5 细胞）
同视皮层位置，延迟运动信号 × 反极性亮度信号非线性融合
小叶柱状细胞（LC）时空平滑整合，输出检测结果

ml‑SOD 模型网络结构与三阶段处理流程

PART/2

优势

关键能力：超敏锐检测 + 强抗干扰，碾压传统模型

1. 超敏锐视觉：突破分辨率极限

模型能检测1×1 像素的超小目标，实现视觉超敏锐检测，远超模拟复眼的空间分辨率，这是传统模型难以实现的能力。

模型对超小目标的超敏锐检测响应

2. 强抗干扰：动态背景也能稳抓目标

面对移动背景、闪烁噪声，仅靠亮度的 ESTMD 模型极易失效；而 ml‑SOD 依托运动特征，高对比度小目标在全速度范围背景下都能稳定检出，抗干扰能力大幅提升。

动态背景下高对比度目标检测效果

3. 模型对比：性能全面领先

与纯 ESTMD 模型对比，ml‑SOD 在静态 / 动态背景、闪烁干扰、不同目标尺寸速度下，F 值、检测率全面占优，噪声更少、鲁棒性更强。

ml‑SOD 与 ESTMD 模型性能对比

4. 双臂 / 三臂运动检测器通用

替换为最新发现的果蝇三臂运动检测器，模型核心性能不下降，适配最新神经科学发现，通用性极强。

三臂检测器版本模型性能验证

PART/3

验证

真实场景验证：红外无人机、复杂视频全 hold 住

团队用RIST 真实场景数据集（复杂环境小目标）与IR 红外数据集（微弱无人机目标）全量测试：

ml‑SOD（双臂）检测率最高，假警率最低
处理速度超90 帧 / 秒，下采样后达260 帧 / 秒
无需训练、轻量化，适合边缘端部署

真实数据集测试结果

PART/4

研究意义与未来

这项研究首次系统证明视觉运动在小目标检测中的核心价值，为无人机安防、自动驾驶、工业检测等领域提供轻量化、高鲁棒性的仿生视觉新方案，也为解析昆虫视觉神经机制提供关键理论支撑。

未来团队将优化静态目标检测、深度自适应模块，让仿生视觉更贴近自然、更适配真实场景。

有相关需求的你可以联系我们！

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴