2 月 10 日,北京航空航天大学研究团队在《自然-通讯》发表研究称,其开发的视觉系统在运动处理速度上较现有主流光流技术快四倍,有望显著提升自动驾驶车辆、工业机器人和手术机器人等系统的反应速度

该成果源自神经形态工程。不同于传统芯片将存储与运算分开,神经形态硬件仿照大脑结构将二者融合,从而提高运算效率并降低能耗。长期以来,这一方向被视为弥合机器与人类感知差距的重要路径。

据外媒 TechSpot 报道,团队负责人高硕(音译)从大脑的外侧膝状体获得灵感。外侧膝状体位于视网膜与视觉皮层之间,既负责传递信息,也负责筛选信号。由于能够对时间与空间变化高度敏感,人类视觉系统可优先处理快速变化的对象。研究团队尝试将这种选择性注意机制在芯片中实现。

传统机器人视觉依赖摄像头拍摄连续静态帧,并通过光流算法追踪像素亮度变化来判断运动,但该方法处理一帧图像可能耗时超过 0.5 秒。对于高速行驶的自动驾驶车辆而言,这种延迟意味着在感知空窗期内,车辆就可能前进数米

研究人员开发的神经形态模块可直接检测光强随时间变化的区域,仅对发生变化的部分分配算力,实现实时运动识别。

在模拟驾驶和机器人操作测试中,该系统将延迟减少约 75%,并在复杂运动场景下将追踪精度提升一倍。

该系统仍依赖传统光流算法进行最终图像解析,且在多重运动交错场景中表现有限,不过整体性能已明显优于传统方案,显示未来机器视觉响应速度可能接近甚至超过人类。

▲ a. 示例应用场景。b. 所提出的神经形态运动提取硬件流水线与传统光流流水线的并排视图。c. 两种方法的处理时间和准确性比较。

熟悉该研究的专家认为,这项技术有望扩展机器人安全运行的环境范围,从道路到家庭场景。在家庭中,机器人需识别手势与细微表情,更快的视觉反馈将使人机互动更加自然。

下一阶段挑战在于扩大神经形态硬件规模,并在保持速度与精度的同时整合进现有 AI 系统。如果顺利推进,受生物启发的视觉架构可能改变机器人理解动态世界的方式与速度。

本文源自:IT之家