目前我国的苹果产业正面临苹果供给总量的提升、质量结构失衡以及生产成本逐年上升等结构性矛盾。在产业体系优化过程中,提升苹果采后分选分级技术是确保苹果分级定价、促进果农增收的关键。
在深度学习技术不断发展的背景下,机器视觉与深度学习的结合在农产品缺陷快速检测、外观品质检测、无人采摘以及表面损伤智能识别等方面表现突出。田间苹果在线检测面临的计算资源受限和环境不稳定等挑战对深度学习算法性能提出了较高的要求。尤其是田间小型品质分级设备结合深度学习算法时,目前未解决计算能力和实时性之间的平衡问题。本研究的目标是开发适用于果园现场环境下的苹果表面缺陷检测算法。该算法旨在满足计算资源有限、环境不稳定的条件下对苹果表面多种缺陷高效检测的需求。
江苏大学食品与生物工程学院的郭志明*、肖海迪和王陈等人以不同苹果表面损伤样本为对象,采集苹果表面图像信息,使用EffQAFPN和RepGhostNeXt算法改进YOLOv8基础模型,以期构建适用于果园现场的苹果表面缺陷检测模型,确保其在资源受限的现场环境中高效运行。
1
模型评价
1.1 模型整体结果
如图8a、b所示,原始YOLOv8在300 个训练轮次时mAP@0.5达到0.845,最终稳定在0.913,轻量版YOLOv8n的性能较弱,300 个训练轮次时mAP@0.5仅为0.627,500 个训练轮次时稳定在0.710,说明YOLOv8轻量化模型性能降低。改进模型性能优于YOLOv8n。YOLOv8+EffQAFPN在200 个训练轮次后mAP@0.5超过YOLOv8n,最终稳定在0.740,尽管简化的特征提取网络导致性能与YOLOv8有差距,但收敛速度明显提升。YOLOv8+RepGhostNeXt通过重参数化和多路径卷积,识别准确率达0.912,虽然收敛速度较慢,但得益于多尺度特征提取,其整体表现较好。最优组合模型YOLOv8+RepGhostNeXt+EffQAFPN在300 个训练轮次时mAP@0.5超过0.797,450 个训练轮次后稳定在0.902,表现优于其他改进模型,训练初期表现为快速增长而后进入性能饱和期。
如图8c、d所示,YOLOv8在收敛速度和识别准确率方面优于其他模型,400 个训练轮次后进入稳定期,最终召回率达0.920。相比之下,YOLOv8n准确率波动较大,召回率仅为0.845,且收敛较慢。引入EffQAFPN的YOLOv8在训练初期显著提升了召回率和准确率,但后期整体表现略低于YOLOv8。YOLOv8+RepGhostNeXt模型前期性能一般,但随着训练轮次增加,准确率和召回率持续提升,最终召回率达0.905,显示多路径特征提取对多尺度目标识别的优势。YOLOv8+RepGhostNeXt+EffQAFPN组合模型展现出协同增效效果,收敛更快,准确率和召回率均稳定提升,验证了主干网络和特征金字塔改进对模型性能的显著促进作用。
1.2 模型识别结果
模型训练完成后,使用测试集对5 个模型进行评估并生成了每类别的精密度-召回率(PR)曲线和混淆矩阵以观察各模型在苹果表面特征和缺陷识别中的表现。杂物标签用于增强模型对预期目标特征的识别能力。
如图9所示,总体来看,5 个模型在果柄、花萼、黑点和机械损伤等特征或缺陷的识别上表现良好,AP值较高,例如YOLOv8在花萼检测中的AP值达到0.944。相比之下,腐烂、褐斑和裂纹等类别的识别效果存在较大差异。YOLOv8+RepGhostNeXt在腐烂检测中的AP值为0.781,优于YOLOv8n,后者在裂纹检测上的AP值仅为0.611,且在褐斑和裂纹等缺陷的检测方面整体表现不佳。此外,YOLOv8+RepGhostNeXt在部分缺陷类别(如IoU=0.5)下的识别准确率仍有提升空间。YOLOv8+EffQAFPN和YOLOv8+RepGhostNeXt+EffQAFPN两种改进模型在大多数缺陷类别上表现稳定,尤其在IoU≤0.9时能保持较高的识别准确率,表明EffQAFPN结构在降低计算复杂度的同时有效提升了多种缺陷的检测性能。
如图10所示,YOLOv8在多个特征的识别上表现优异,特别是在花萼和腐烂检测中,准确率分别达到95%和91%。由于形态相似性和特征干扰,该模型在褐斑和周围杂物的识别上存在误判,而在裂纹和机械损伤识别中也同样存在误判,这源于二者的纹理特征相似且尺度特征相近,模型无法准确判断。YOLOv8n在果柄和机械损伤等结构性类别上表现突出,准确率分别为94%和92%。改进模型中,YOLOv8+EffQAFPN在果柄、机械损伤和裂纹类别上表现优异,准确率较高,但在褐斑、杂物、黑点和腐烂等表面纹理类缺陷识别上存在误判。YOLOv8+RepGhostNeXt通过提升多尺度特征识别能力,提升了结构缺陷(果柄、裂纹)和褐斑识别的准确率(分别为94%、91%和89%)。然而,该模型在腐烂与黑点混淆以及花萼边缘误判上仍存在问题。误判的主要原因是特征纹理相似性,在小尺寸或残缺样本较少的情况下尤为明显。
YOLOv8+RepGhostNeXt+EffQAFPN的组合模型通过改进主干网络和特征提取结构,提升了果柄、机械损伤和腐烂的识别准确率(≥94%)。但该模型在裂纹、褐斑和杂物识别方面存在不足,其中较为突出的原因是杂物、褐斑和裂纹3 类的样本数量分别为555(占比3.34%)、1 253(占比7.54%)和1 356(占比8.16%),低于腐烂、日灼等类别,属于训练集中的小样本类别。这导致模型对这些类别的特征学习有限,尤其是杂物类别,样本极少,极易造成识别能力不足,且图像分辨率的限制使得部分微小裂纹和杂物在下采样后特征表达不充分,影响了模型对小目标的检测精度。在模型架构方面,RepGhostNeXt 1/16的下采样操作造成裂纹末端细节丢失,EffQAFPN的通道注意力权重标准差大小及跨层特征相似度高(主要为特征金字塔中的P3~P5层3 个特征图的余弦相似度),削弱了纹理区分与多尺度解耦能力。尽管构建的EffQAFPN结构提升了多尺度特征融合能力,但在处理高相似性纹理和形态特征时,特征金字塔的特征解耦和区分能力仍有提升空间,导致模型在褐斑与杂物等易混类别上的区分效果不理想。同时人工标注误差也是影响因素之一,部分褐斑与裂纹的边界较为模糊,标注边界存在一定主观性,增加了模型判别难度。
RepGhostNeXt与EffQAFPN组合显著提升了模型对多尺度特征的识别能力,精密度达94.9%,较YOLOv8提升1.6%(表4)。该组合模型对果柄和日灼等类别的识别准确率有所提高,误判率下降;其中EffQAFPN的应用提升对苹果黑点的识别能力,RepGhostNeXt在同类轻量化模型中在机械损伤分类上表现优异,而组合模型改善了YOLOv8n这类轻量化模型出现的花萼误判问题。
如图11所示,YOLOv8n存在缺陷漏检和对褐斑、机械损伤识别不准确的问题,而基于YOLOv8的改进模型能够有效识别各类特征,YOLOv8+RepGhostNeXt+EffQAFPN改进模型在识别能力和置信度方面与YOLOv8相似,表现稳定。该模型在黑点与苹果表面具有明显颜色差异的情况下,实际黑点直径为1.5 mm时可实现80%以上的置信度。对于黑点、腐烂、果柄、花萼等高对比度缺陷的检测限为1.5 mm。对于日灼、较小磕碰损伤、褐斑等与背景颜色差异较小的缺陷,尽管其面积较大,模型的检测置信度和召回率仍然较低。模型在低对比度缺陷上的检测限相对较高。改进模型的检测限不仅与缺陷的实际尺寸有关,还受到缺陷与背景之间颜色、纹理等特征对比度的影响。
2
模型效果评估
如表4所示,YOLOv8+RepGhostNeXt+EffQAFPN模型在精密度、召回率和mAP@0.5方面与YOLOv8相当,准确率为94.9%,召回率为93.8%,推理时间为128.10 ms,FPS为7.81 帧/s,优于YOLOv8和YOLOv8n,表明模型改进有效提升了特征识别能力并加快了推理速度。尽管该模型的识别准确率略低于YOLOv8,但其推理时间缩短了42.87%,表明在保证表面特征提取的同时,模型改进设计有效提升了推理效率。
如图12所示,YOLOv8和YOLOv8n模型在识别效率上表现较差,推理延迟较高。应用EffQAFPN的模型在100 ms的推理时间内实现了85%左右的准确率,而RepGhostNeXt结构通过重参数化技术有效提升了边缘设备的能效比。EffQAFPN与RepGhostNeXt相结合的改进模型在120 ms的推理时间内达到了90%的准确率,表明该模型在苹果表面缺陷识别和检测效率方面具有显著优势。进一步地,将优选的YOLOv8+RepGhostNeXt+EffQAFPN模型部署于差距双螺旋辊子传输机构,在经过苹果图像采集、增强和背景分割等流程后将处理后图像输入模型,实际应用结果表明,模型能够准确检测多种表面特征和缺陷(图13),验证了其在果园现场小型化分选分级应用中的实用性与可靠性。
结论
本研究在实验室条件下复现各类常见的苹果表面缺陷,利用静态机器视觉装置采集了5 500 张苹果表面特征和缺陷样本图像并完成标签标注,构建了苹果表面缺陷图像数据库。为解决样本标签数量不均衡问题,采用5 折交叉验证训练了YOLOv8、YOLOv8n、YOLOv8+EffQAFPN、YOLOv8+RepGhostNeXt和YOLOv8+RepGhostNeXt+EffQAFPN 5 个模型。模型的分类效果使用精密度、召回率、mAP@0.5、推理时间和FPS进行评估,并借助混淆矩阵与PR曲线分析各模型对8 种苹果表面特征或缺陷上的识别效果。综合比较,YOLOv8+RepGhostNeXt+EffQAFPN模型表现最佳,准确率为94.9%,召回率为93.8%,推理时间为128.10 ms。该模型可满足资源受限环境下的苹果在线缺陷检测需求,验证了RepGhostNeXt和EffQAFPN对YOLOv8主干网络和特征提取网络的改进能够提高模型的特征提取能力和推理速度。研究所采用的改进方法可为田间苹果表面缺陷的在线快速检测与分类提供技术参考。
引文格式:
郭志明, 肖海迪, 王陈, 等. 苹果在线分级的多尺度轻量化改进YOLOv8表面缺陷检测模型[J]. 食品科学, 2025, 46(22):1-12. DOI:10.7506/spkx1002-6630-20250415-117.
GUO Zhiming, XIAO Haidi, WANG Chen, et al. Improved YOLOv8 model with multi-scale lightweight for surface defect detection in online apple grading[J]. Food Science, 2025, 46(22): 1-12. (in Chinese with English abstract) DOI:10.7506/spkx1002-6630-20250415-117.
通信作者:
郭志明 教授
江苏大学食品与生物工程学院
郭志明,教授,博士生导师,现任江苏大学集成电路学院副院长,从事食品无损检测与物联网监测技术及装备研发。入选农业农村部首批“神农青年英才”和江苏高校“青蓝工程”优秀青年骨干教师等,兼任中国农业机械学会农副产品加工机械分会副秘书长、中国食品科学技术学会果蔬加工技术分会理事、江苏省食品科学与技术学会理事兼副秘书长等。专注食品智能检测与加工,在食品快速无损检测、食品光学传感评价、食品质量安全物联网、人工智能算法等方面取得了突出成效。近年主持了国家重点研发计划项目、课题,国家自然科学基金面上、国合研究和青年项目,江苏省重点研发计划等国家及省部级项目20余项。第一发明人授权发明专利12 件、登记软著8 件;第一/通信作者发表SCI论文70余篇,其中ESI高被引论文7 篇。研究成果获教育部自然科学二等奖、江苏省科学技术一等奖和中国商业联合会科技进步特等奖等。
实习编辑:魏雨诺;责任编辑:张睿梅。点击下方阅读原文即可查看全文。图片来源于文章原文及摄图网
热门跟贴