前言:
可溶性固形物含量(TSSC)是决定枇杷风味、口感与市场竞争力的核心指标。传统检测有损、耗时、难以适配规模化快速分级。
广东省农业科学院设施农业研究所联合多单位团队在《Agriculture》发表研究:搭建900–1700 nm 近红外光谱检测体系,融合光谱预处理、特征波长筛选、机器学习建模,并通过 SHAP 可解释 AI 解析模型机理,实现枇杷 TSSC 快速、无损、高精度定量预测。
一、实验材料与检测平台
样本:
广州果园156个商品成熟枇杷,4℃冷藏、20℃平衡8h;TSSC:6.4–13.8°Brix
光谱采集:
如海光电XS9214近红外光谱仪(现已升级为NIRPro),900–1700nm,分辨率3.5nm
采集参数:
积分时间50ms,平均次数100次,连续采集模式
理化参照:
ATAGO PAL-1手持糖度计
样本划分:SPXY算法3:1,校正集109 个,预测集47个
二、光谱预处理与优化
原始光谱存在噪声与基线漂移,研究对比7种预处理,以PLSR为评价基准。结果显示:SG(7)‑SNV‑DT三联预处理效果最优。
三、建模与结果分析
基于SG(7)-SNV-DT预处理后的数据,研究分别建立PLSR、BPNN、ELM三种模型并结合全波段与六种特征波长筛选方法进行对比,结果显示特征筛选建模效果整体优于全波段,其中SPA-PLSR组合表现最优,仅用26个特征波段便实现预测集相关系数Rp=0.9031、RMSEP=0.6171、RPD=2.2803,达到高可靠检测水平;ELM以UVE特征、BPNN以 VCPA-IRIV特征取得各自最佳效果,但整体精度与稳定性均低于SPA-PLSR,说明在枇杷TSSC近红外检测中,线性关系占主导,SPA特征筛选与PLSR建模的搭配更具实用价值
四、可解释AI(SHAP)机理分析
采用SHAP值可视化各波长对模型输出的贡献度,定位核心响应波段:PLSR‑SPA高贡献波段集中在950nm、1150nm、1410nm附近,与O–H、C–H倍频与合频吸收高度吻合,直接对应可溶性糖分子特征;SHAP正负值清晰区分:高反射率在1172/1260/1424 nm正向提升TSSC,在1450nm附近负向抑制预测,为波段优选提供机理解释。
五、研究结论
最优路线:
近红外光谱→SG(7)-SNV-DT→SPA→ PLSR→SHAP解释
核心性能:
仅26波段实现高可靠预测,RPD=2.28>2.0,满足产业分级
可解释性:
SHAP明确关键波段与贡献方向,模型透明可信
硬件支撑:
如海光电XS9214近红外光谱仪(现已升级为NIRPro)提供稳定、高质量光谱数据
六、文章来源
*免责声明:
如海光电账号发布内容(含图片、图表)来源于公开学术文献。文章版权、数据及所述观点归原作者所有。本文旨在分享科研应用案例,如有侵权请联系后台处理。
热门跟贴