鸡蛋粉产品包括全蛋粉、蛋黄粉、蛋清粉等。蛋清粉的蛋白质量分数可高达80%,同时具有低脂肪低碳水的特点,特别适合生长发育期、老年人、术前术后、肥胖者或者是运动人群食用。目前,在蛋粉生产过程中部分企业掺入廉价的植物蛋白粉或者面粉等,以次充好,不但扰乱了蛋粉市场的秩序,也给食品安全带来了极大隐患。相较于全蛋粉和蛋黄粉,蛋清粉蛋白质含量较高,市面上价格较贵,其掺杂情况更加严重。

近红外光谱是一种快速、无损、绿色的检测技术,其原理为通过物质在近红外波段的吸收与散射特性,获取有机物中含氢基团(如C—H、N—H、O—H)的信息。该检测方法已经广泛应用于粉末状食品的真实性检测中,如淀粉、花生粉、辣椒粉等。

近年来,一维卷积神经网络(1D-CNN)在多维数据上展现了强大的数据特征提取能力,在回归预测、定性检测等各个场景应用中获得了较大的成功。针对近红外光谱数据处理,该方法已运用于食品分类、含量预测、作物成分检测等场景中,并取得了良好的效果。基于此,本研究拟应用1D-CNN模型,并基于近红外光谱数据对蛋清粉进行真实性检测。

针对蛋清粉全近红外光谱信息复杂、原数据存在较多噪声、低浓度掺杂难以检测等问题,华中农业大学工学院的祝志慧、李沃霖、韩雨彤等在主干网络加入有效通道注意力模块(ECA),提高模型对特征的敏感度,减少近红外光谱噪声及无用波段对蛋清粉鉴别的干扰。同时,运用一维全局平均池化(1D-GAP)技术,替代原1D-CNN结构中的全连接层,在实现有效提取光谱整体特征、减少模型过拟合的同时,降低模型的计算量,更好地将模型部署在嵌入式设备上。该模型可实现基于全近红外光谱数据,对蛋清粉的真伪进行快速、准确的鉴别,以期为开发针对蛋粉质量检测的便携式近红外光谱检测仪提供一定的理论基础。

1 原始光谱数据分析

1.1 纯蛋清粉与掺杂蛋清粉光谱分析

从图4a可知,不同产地蛋清粉光谱图的变化趋势十分相似,波峰、波谷位置相同。由图4b可知,纯蛋清粉与掺杂蛋清粉的原始光谱图的变化趋势,波峰、波谷位置也十分相似,吸光度随着波数的增加而逐渐减小。纯蛋清粉与掺杂蛋清粉的光谱高度重叠,无法仅通过光谱图进行鉴别,需要通过相应的鉴别模型提取有效信息,实现对样本快速、准确的鉴别。

1.2 不同掺杂种类蛋清粉光谱分析

5 种掺杂物与纯蛋清粉的原光谱图对比如图5a所示。淀粉与大豆分离蛋白两种增量剂掺杂物在4 200~4 850 cm-1与6 400~7 100 cm-1范围内吸光度区分明显;三聚氰胺和尿素两种含氮类化合物相比于增量剂,光谱区分度更大,在4 250~5 150、5 400~7 100 cm-1范围内吸光度大小区分明显;对于甘氨酸,在4 950~7 200 cm-1范围内吸光度变化趋势有很大的差异。图5b~d分别为单组分、二组分掺杂和三组分掺杂与纯蛋清粉的光谱图,红框标出的光谱变化区间分别对应着各类掺杂物质的光谱变化特征。通过对比可以得出以下结论:1)掺杂物的种类及浓度决定了光谱图变化的区间及程度,其光谱图变化直观表现了掺杂样本的种类及浓度特征,也直观表现了掺杂样本与纯蛋清粉样本的特征差异;2)掺杂物浓度决定了光谱特征区间的畸变程度,掺杂浓度越大,光谱畸变越明显,低掺杂浓度的光谱畸变轻微,无法通过肉眼观察光谱图判断;3)多种掺杂物混合掺杂会导致光谱图多处区间发生变化,且二组分和三组分掺杂变化的区间及程度为混合掺杂中每一种掺杂物质单独掺杂时各自产生光谱变化特征的叠加;4)由于掺杂物所含的成分与蛋清粉不同,掺杂导致蛋清粉样本的主要成分(C—H键、N—H键和O—H键)发生了变化,进而产生光谱畸变,以上波段的变化说明这些波段存在着C—H键、N—H键和O—H键倍频和合频的吸收峰,这些官能团与蛋清粉的蛋白质、水分等物质有紧密的联系,其中4 339 cm-1和5 851 cm-1对应的是C—H键的合频和一倍频,4 447 cm-1对应的是N—H键的合频,4 979 cm-1和6 869 cm-1分别对应O—H键的合频和一倍频。真实性检测模型的本质是准确学习有效光谱特征,对光谱数据按照学习的特征进行分类,这些结论为之后模型的训练及检测结果提供了理论依据。

2 模型消融实验结果

为研究改进方法对模型的优化效果,需进行消融实验。模型设定批大小(batch_size)为256,迭代次数(Epochs)为3 000 次,按照1.3.3节划分的训练集与验证集作为输入,对模型进行训练,按照1.3.3节划分的测试集作为输入进行模型的测试,其中训练集、验证集和测试集的光谱数据不经过预处理,直接进行相应的模型训练及测试。模型的评价指标按照1.4.3节进行计算,最终结果如表1所示。

从表1可以看出,经过ECA模块的优化,模型对于处理近红外光谱中蛋清粉真伪特征的能力得到了增强,如模型ECA-1D-CNN相比于原1D-CNN模型,FFPR下降了0.3 个百分点,FFNR降低了1.78 个百分点,AAR提升了1.03 个百分点。且引入了1D-GAP的模型,在检测速度指标上均得到了一定的提升,如模型GAP-1DCNN相比于1D-CNN模型和ECA-1D-CNN模型,其平均检测时间分别减少了0.000 2、0.000 3 s,模型大小减少了0.79、0.80 M,FLOPs减少了0.13、0.14 M。两种优化方法共同使用的模型效果最优,EG-1D-CNN相比于ECA-1D-CNN模型,总准确率得到了提升,模型大小减少了约39.8%。与GAP-1D-CNN模型相比,模型大小和FLOPs虽有所增高,但FFPR减少至0,总准确率提升了0.57 个百分点。

综上所述,运用了ECA与1D-GAP模块的EG-1DCNN模型,在准确度、检测速度及模型大小上相比原模型均有所提升,这说明ECA模型可增强对全近红外光谱数据的特征提取能力,进而提升了对蛋清粉的真伪鉴别能力,且1D-GAP能在保持模型准确率的情况下,降低了模型的复杂程度,进而提升了模型的检测速度,降低了模型大小。

3 预处理性能对比

为验证光谱数据预处理对模型精度的影响,分别采用归一化(NORM)、标准正态变换(SNV)、多元散射校正(MSC)、卷积平滑(SG)和去趋势(DT)5 种预处理方法处理1.3.3节划分的训练集、验证集和测试集,运用EG-1D-CNN模型进行训练测试,最终测试结果如表2所示。

由表2可知,对于EG-1D-CNN模型,分别经过5 种预处理方法后的AAR与原始数据的AAR差异不大,且原数据所达到的AAR最高。这说明预处理对EG-1D-CNN模型的性能几乎没有影响,且在原近红外光谱数据基础上训练的模型精度最高,故EG-1D-CNN模型无需对近红外光谱数据进行预处理即可达到理想的精确度。

综上所述,改进后的EG-1D-CNN模型可无需对原近红外光谱数据进行预处理。由于略去了预处理步骤,且对于传统机器学习算法,不同的检测对象所需的光谱预处理方法都不同,不合适的预处理方法会降低模型准确率,该模型相比于传统机器学习算法,无需光谱预处理的先验知识,其建模方法更加方便。

4 不同模型性能对比

为比较改进的EG-1D-CNN与其他算法的性能,分别以传统1D-CNN网络结构、SE(squeeze-andexcitation)+1D-GAP模块的1D-CNN网络结构、CBAM(convolutional block attention module)+1D-GAP模块的1D-CNN网络结构、偏最小二乘判别分析(PLS-DA)方法和集成学习(EL)建立模型,用与2.2节相同的训练集、验证集和测试集进行模型的训练及测试。最终的实验结果分别如表3与表4所示。

由表3可知,相比于原1D-CNN模型,改进的EG-1D-CNN模型性能更加优越。在 F FPR 和 F FNR 上分别减少了0.3 个和2.1 个百分点,且改进后的模型对于纯蛋清粉没有误检,在检测速度指标上具有优势,其平均检测时间减少了0.000 2 s,模型大小和FLOPs分别减少了0.77 M和0.12 M。相比于融合其他注意力模块的模型,EG-1DCNN在检测准确率指标和检测速度指标上均为最优,更适合应用在蛋清粉近红外光谱的真实性检测中。

由表4可知,相比于PLS-DA,EG-1D-CNN在FFPR和FFNR上分别减小了2.10、3.57 个百分点,AAR提高了2.82 个百分点,相比于EL,在FFPR和FFNR上分别减小了1.64、4.72 个百分点,AAR提高了3.13 个百分点,这说明该模型无需对原近红外光谱数据进行预处理即手动特征筛选,具有比传统机器学习算法更强的分类性能,且由于EG-1D-CNN相比两种传统机器学习方法,在测试时省去了光谱预处理与特征波段筛选步骤,其在AATS上分别减少了0.002 3 s与0.000 7 s,满足了快速检测的要求。

综上所述,改进后的EG-1D-CNN相比于其他改进1D-CNN模型及传统机器学习模型,检测准确率指标和检测速度指标上均为最优,其 F FPR 可达到0%, A AR 达到了98.93%, A ATS 达到了0.004 4 s,可实现对大批量的蛋清粉样本进行快速、准确的检测,且由于EG-1D-CNN相比于其他模型复杂度更低,其模型大小仅占用1.18 M,能以较低成本将模型部署在嵌入式设备中,进而为实现蛋清粉便携式近红外光谱质量检测仪的开发提供一定的基础。

5 改进模型测试结果

EG-1D-CNN模型的真伪鉴别结果如表5所示,对于纯蛋清粉样本无错检,对于掺杂蛋清粉,其漏检数仅为21 份,检测率可达到97.80%,单组分、二组分、三组分掺杂的FFNR均在2.63%以下,AAR均在99%以上,这说明EG-1D-CNN模型对单组分及多组分的掺杂均有较高的识别率。且通过2.1.2节中的分析可知,多组分的光谱的特征区间更多,光谱特征为多个掺杂物特征的叠加,其光谱畸变更加明显,更容易被检测出其掺杂特征,故多组分掺杂的AAR会比单组分高,二组分和三组分的AAR分别可达到99.68%和99.83%。

具体的掺杂种类真伪鉴别结果如表6所示,针对每种掺杂种类分别统计了在不同浓度下的漏检数以及LLRC。其中,LLRC在淀粉、大豆分离蛋白、三聚氰胺、尿素、甘氨酸上分别可达到1%、5%、0.1%、1%、5%,在多掺杂中可达到0.1%~1%。单组分的三聚氰胺特征由于其光谱图特征最为明显,鉴别率达到了100%,LLRC可达到0.1%,单组分、二组分、三组分掺杂的总LLRC分别可达到5%、1%、0.5%。

通过2.1.2节中的分析,对于单组分掺杂,由于三聚氰胺无论在低浓度和高浓度下,在6 800 cm-1左右处有明显的波峰,所以三聚氰胺的LLRC可达到0.1%,而大豆分离蛋白和甘氨酸在低浓度条件下的光谱区分度较低,故相应的检测精度较低,LLRC较高;由于富氮类化合物相比于增量剂掺杂物,光谱特征区域更广,光谱畸变更加明显,故富氮类化合物的总体检测精度较高,总体LLRC相对较低;对于多组分掺杂,由于多组分掺杂光谱图的特征区域更多,与单组分掺杂相比,该模型对于多组分掺杂有着更高的检测精度,且三组分相比于二组分,光谱特征区域多一组,模型可检测的特征区域更广,故三组分的最高LLRC更低。

综上所述,改进的EG-1D-CNN模型对于掺杂率超过5%的蛋清粉,可达到100%的鉴别率,针对部分富氮类(如三聚氰胺)掺杂物可达到0.1%的检测限,且由于模型提取的光谱特征区域更明显,针对多掺杂的检测精度更高,其最高 L LRC 更低。该模型在蛋清粉的真伪检测方面有较高的准确度及精确度,对于单组分和多组分的混合掺杂都有较好的判别性能。

6 结 论

本研究针对蛋清粉真实性检测问题,提出了一种改进EG-1D-CNN模型,可基于近红外光谱数据对蛋清粉进行真伪判别,该模型无需对原光谱进行预处理,且在原网络结构基础上增加了ECA与1D-GAP模块,分别改善了模型的精度及复杂度,最终对于不同类型的样本均实现了良好的判别效果:该模型的最终假阳性率(FFPR)可达到0%,对于掺杂蛋清粉的检测率可达到97.80%,总准确率(AAR)为98.93%,最低检测限(LLRC)在淀粉、大豆分离蛋白、三聚氰胺、尿素、甘氨酸上分别可达到1%、5%、0.1%、1%、5%,在多掺杂中可达到0.1%~1%,平均检测时间(AATS)可达到0.004 4 s,模型大小占用为1.18 M,由于多组分掺杂光谱图的特征区间及程度更明显,该模型在多组分掺杂的鉴别表现比单组分更优,且相比其他的算法,该模型的性能均为最优。改进后的EG-1D-CNN模型可实现对低浓度、多组分掺杂蛋清粉样本的准确检测,在蛋清粉的真实性快速检测中显示出巨大的应用潜力,且模型占用空间小,能以较低成本将模型部署于嵌入式设备中,为后续开发针对蛋粉质量检测的便携式近红外光谱检测仪提供一定的理论基础。

为了使模型具有更高的精度、更快的检测速度、更小的占用空间及更广的适用范围,未来的研究可以进一步优化1D-CNN的模型结构,如隐含层结构的优化,在保证准确度的同时,降低模型的复杂度,以优化模型的速度及占用空间;选择更多品牌的不同生产批次的蛋清粉、选择更多的掺杂物、扩大掺杂物样本数量,以提高模型的适用范围;由于蛋清粉掺杂种类繁多,仅针对几种的掺杂物检测无法有效覆盖市面上所有的掺杂物,为实现蛋清粉更广的掺杂种类检测范围,建立基于无监督学习的非定向检测模型也是之后蛋清粉真实性检测的一个重要研究方向。

作者简介

第一作者:

祝志慧 副教授

华中农业大学工学院

教育经历:

2005/9-2008/12,武汉大学,电力系统及其自动化,博士

2003/9-2005/6,华中农业大学,农业工程,硕士

1993/9-1997/6,武汉大学,电力系统及其自动化,学士

科研与学术工作经历:

2012/12-至今,华中农业大学,工学院,副教授

2010/3-2012/12,华中农业大学,食品科技学院国家蛋品加工技术研发分中心,博士后

2008/12-2011/12,华中农业大学,工学院,讲师

主要从事智能检测与信息处理、实时在线监测及自动控制技术等方面的科研工作,主讲《农产品无损检测技术》、《工程测试与信息处理技术》、《数学建模》等本科生与研究生重要课程。主持和参与中国博士后科学基金、湖北省自然科学基金,校青年创新基金、国家自然科学基金、公益性行业(农业)科研专项子课题、国家科技支撑计划项目、湖北省科技支撑计划等11 项科研项目。在国内外重要学术期刊和会议上发表科研论文30 余篇,其中 SCI/EI 检索 20 篇,出版学术专著2 部,授权发明专利6 项,授权软件著作权9 项。研究成果先后获“湖北省科技进步一等奖(排名第4)”、“湖北省科技技术发明二等奖(排名第2)”。

本文《基于改进一维卷积神经网络模型的蛋清粉近红外光谱真实性检测》来源于《食品科学》2025年46卷6期245-253页。作者:祝志慧,李沃霖,韩雨彤,金永涛,叶文杰,王巧华,马美湖。DOI:10.7506/spkx1002-6630-20240830-232。点击下方阅读原文即可查看文章相关信息。

实习编辑:陈丽先;责任编辑:张睿梅。点击下方阅读原文即可查看全文。图片来源于文章原文及摄图网

为贯彻落实《中共中央国务院关于全面推进美丽中国建设的意见》《关于建设美丽中国先行区的实施意见》和“健康中国2030”国家战略,全面加强农业农村生态环境保护,推进美丽乡村建设,加快农产品加工与储运产业发展,实现食品产业在生产方式、技术创新、环境保护等方面的全面升级。由 中国工程院主办, 中国工程院环境与轻纺工程学部、北京食品科学研究院、湖南省农业科学院、岳麓山工业创新中心承办, 国际食品科技联盟(IUFoST)、国际谷物科技协会(ICC)、湖南省食品科学技术学会、洞庭实验室、湖南省农产品加工与质量安全研究所、中国食品杂志社、中国工程院Engineering编辑部、湖南大学、湖南农业大学、中南林业科技大学、长沙理工大学、湘潭大学、湖南中医药大学协办的“ 2025年中国工程院工程科技学术研讨会—推进美丽乡村建设-加快农产品加工与储运产业发展暨第十二届食品科学国际年会”,将于2025年8月8-10日在中国 湖南 长沙召开。

长按或微信扫码进行注册