清华大学发布实时对象检测YOLOV10模型|yolov|信道|冗余|对象检测|尺度|清华大学

YOLOv10 是清华大学研究人员在YOLO软件包的基础上，引入了一种新的实时目标检测方法，解决了YOLO 以前版本在后处理和模型架构方面的不足。通过消除非最大抑制（NMS）和优化各种模型组件，YOLOv10 显著降低了计算开销，并实现了最先进的性能。大量实验证明，YOLOv10 在多个模型尺度上实现了卓越的精度以及速度。

YOLOv10 的结构建立在以前YOLO 模型的基础上，同时引入了几项关键创新。模型架构由以下部分组成：主干网YOLOv10 中的主干网负责特征提取，它使用了增强版的 CSPNet（跨阶段部分网络），以改善梯度流并减少计算冗余。颈部颈部设计用于汇聚不同尺度的特征，并将其传递到头部。它包括 PAN（路径聚合网络）层，可实现有效的多尺度特征融合。一对多头：在训练过程中为每个对象生成多个预测，以提供丰富的监督信号并提高学习准确性。一对一预测：在推理过程中为每个对象生成一个最佳预测，无需 NMS，从而减少延迟并提高效率。

主要功能设计：无 NMS 训练：利用一致的双重分配来消除对 NMS 的需求，从而减少推理延迟。整体模型设计：从效率和准确性的角度全面优化各种组件，包括轻量级分类头、空间通道去耦向下采样和等级引导块设计。增强的模型功能：纳入大核卷积和部分自注意模块，在不增加大量计算成本的情况下提高性能。轻量级分类头：通过使用深度可分离卷积，减少分类头的计算开销。空间信道解耦向下采样：将空间缩减与信道调制解耦，最大限度地减少信息损失和计算成本。梯级引导程序块设计：根据固有阶段冗余调整模块设计，确保参数的最佳利用