风味物质在食品工业中的作用既复杂又关键。风味,包括味道和香气,是消费者偏好和选择的关键因素。机器学习(ML)技术的引入为风味分子的识别和分析打开了新的视野。 风味分析的重点是如何准确识别消费者感受到的香气和滋味相关的化合物。 随着计算技术的快速进步和食品风味领域数据的不断积累,ML模型已成为风味预测和调整的重要工具,以其高预测能力和准确性而闻名。 ML通过从数据中学习复杂模式以进行准确预测并减少主观性,提供了一种更有效的替代方案,比如通过ML的人工神经网络(ANN)在加工过程中快速筛选优质的啤酒。 近年来,用于预测食品风味的ML模型主要与红外光谱、电子鼻(E-Nose)、电子舌(E-Tongue)和气相色谱-质谱(GC-MS)等技术联用。 这些模型的预测基于风味化合物的分子结构和理化性质。 ML的出现给食品科学这一领域带来了重大进步,提供了理解复杂风味特征的新方法。
上海应用技术大学香料香精技术与工程学院的沈潇、王海涛、冯涛*等综述了在食品风味研究中广泛使用的ML模型,并介绍了ML在食品风味分析中的应用。旨在引起研究人员对应用ML改善食品风味和监测食品质量的重视,以促进食品的生产和食品工业的发展。
1食品风味分析中常用的ML方法
将人工智能融入食品科学代表着传统方法的重大飞跃。人工智能,特别是ML,已越来越多地应用于食品科学的各个方面,尤其是风味分析。不同的ML方法有助于从复杂的风味数据中提取有效数据,使研究者产生有意义的见解,使其成为现代食品行业产品开发、质量控制和感官评估的重要工具。通过应用ML技术,研究者可以更好地了解消费者的喜好,并创造出迎合消费者的特定风味产品。图1是从Web of Science中以ML和风味为主题,时间范围为2018—2023年,共检索到493 篇参考文献,将参考文献中的标题和摘要叠加可视化,相同的颜色代表相关性较强(结果由荷兰莱顿大学VOS viewer 1.6.19版本生成)。研究结果表明,近年来(2018年至今),ML在食品风味中与支持向量机(SVM)、随机森林(RF)、ANN和分子等信息有关,并且逐渐成为食品风味领域的关键信息处理工具,其具体算法示意图见图2。
1.1传统ML方法
在ML中,SVM是带有相关学习算法的有监督学习模型,可分析用于分类和回归分析的数据。除了执行线性分类外,SVM还能利用所谓的“核技巧”有效地执行非线性分类,隐式地将输入映射到高维特征空间。从根本上说,SVM在类别之间绘制边距,如图2a所示。边距的绘制方式使边距与类别之间的距离最大,从而使分类误差最小。SVM适用于处理非线性、小样本量和高维模式识别任务,在预测方面表现出色。SVM可以与传感器阵列相结合预测牛肉的风味,传感器阵列的数据通过PCA进行预处理,然后用作SVM的输入。采用径向基核通数的SVM预测显示出较高的准确率,达到了90%。然而SVM本质上是一个二分类器,当特征数量远大于样本数量时,SVM可能会表现不佳。此外,SVM的模型参数和核函数的选择对结果有很大影响,但这些选择往往不容易确定,需要专业知识和实验调整。另外,虽然SVM在处理高维数据方面很有效,但在大规模数据集上,SVM可能会非常耗时,尤其是在需要多类分类的情况下,对于风味物质分类问题,需要采用一对一或一对多的策略进行扩展,这可能会增加模型的复杂性。王国祥等基于Raman光谱和SVM回归框架建立白酒年份分析模型,研究发现可以有效地用于不同年份白酒的鉴定工作,同时可以用于有效预测白酒年份酒的贮存时间,这项研究说明SVM相比于其他常用回归分析方法具有明显的优越性,可以为白酒年份分析提供一定的技术支持。干佳俪等为了快速区分不同风味奶酪,用改进的密度最大值聚类算法对风味物质进行聚类,自动获取聚类中心形成具有风味表征的特征,然后利用SVM算法进行分类鉴别,准确率均在95%以上,高于原始特征、DBSCAN聚类特征、K-均值聚类特征的分类结果。
KNN是一种基本的ML算法,它通过测量不同特征点之间的距离执行分类或回归任务。KNN算法的核心思想是相似的数据点往往属于同一类别,如图2b所示。KNN首先计算每个数据点在多维空间的欧几里得距离,然后选择距离某个数据点最近的
K个示例,最后根据标签的平均值进行预测。KNN算法在食品风味分析中的一个主要优点是简单直观,易于实现,且不需要建立复杂的模型。然而,KNN在处理大规模数据集时,其效率可能会受到挑战,特别是需要实时分析的应用。此外,KNN对数据的尺度敏感,因此在应用前通常需要进行特征标准化。
DT是一种图形,以树的形式表示选择及其结果。图中的节点代表事件或选择,图中的边代表决策规则或条件。每棵树都由节点和分支组成。每个节点代表要分类的组中的属性,每个分支代表节点可以取的值,如图2c所示。DT的结构清晰,易于理解,树状图的形式使得非专业人士也能理解其决策过程,它可以识别出最重要的特征,从而简化模型。但是如果树太复杂,它可能会学习数据中的噪声,导致对数据的泛化能力差,同时对数据中的小变化可能非常敏感,而且对于复杂非线性关系的处理效果不好。Tuwani等使用了DT、RF和岭逻辑回归的ML模型,将苦味、甜味和无味分子的结构汇编,并用于ML模型的预测,从而比较了不同分子描述符的预测性能,并进一步确定风味特征,结果发现多种ML方法结合可以更好地对风味进行分析,这项研究为通过ML更好地理解分子与味道之间的相关性提供了理论基础。
RF可以集成多个模型,每个DT都是在数据集的一个随机子集上训练出来的,这些树的预测结果将被综合考虑,如图2d所示。它的引入具有随机性,每个DT在选择最佳分割时会从一个随机选择的子集中挑选,这种方法增加了模型的多样性,减少了过拟合的风险。RF因其易于实现、效果良好且对数据集的各种特性具有较强的鲁棒性而受到研究者的青睐。尽管RF在大型数据集上可能会消耗较多的计算资源,但其高准确率和易解释性使其成为一种非常受欢迎的ML工具。Sabilla等利用ML方法对番茄和辣椒进行分类,讨论了使用ML和对比度增强技术对辣椒(包括小米辣、卷曲辣椒、绿辣椒、红辣椒)和番茄(好的和坏的条件)进行分类,研究结果表明,RF在分类的准确度上较高。
极限学习机(ELM)需要标签数据训练模型,它主要用于分类和回归任务,并且已经被证明在很多情况下能够提供与传统神经网络相当或更好的能力,并且学习速度比传统流行的神经网络学习算法快数千倍。ELM在食品风味分析中与多种仪器分析结合使用,其可以处理来自E-Nose、E-Tongue或GC仪等仪器的复杂数据集,用于识别和分类食品样本的风味特征,并使用食品成分和加工参数等数据为输入变量,预测食品的风味属性。ELM可以和E-Nose联用预测樱桃番茄新鲜度。在质量控制应用中,ELM可用于检测食品中的异味或质量偏差,以确保产品质量的一致性,在分析不同加工方法生产的5 种草莓汁时,通过E-Nose使用ELM、学习矢量量化和SVM对草莓汁的香气化合物数据进行分类和回归。发现ELM表现出最好的性能,这表明ELM将是E-Nose数据处理的一个不错的选择,从而证实E-Nose可用于区分加工过的果汁,并预测果汁质量。Qiu Shanshan等比较了利用ELM、RF和SVM方法分析不同发育阶段温州蜜柑内部品质变化的E-Nose和E-Tongue数据,研究发现使用E-Nose和E-Tongue的系统,配合RF或ELM算法,可以快速、客观地检测水果内部品质的变化,这一发现为水果品质监控提供了新的技术途径。所以推测可以用ELM结合E-Nose和E-Tongue技术帮助研究人员开发新产品,通过分析和模拟不同食品配方的风味特性,快速找到理想的配方组合。由于ELM的快速学习能力和有效的性能,它在处理大规模和高维度的数据集时特别有用。然而,ELM也有其局限性,比如过拟合的风险以及隐层节点数量的选择往往需要依赖实验确定。在实际应用中,通常需要结合领域知识和实验不断调节优化参数,从而最大化ELM在食品风味分析中的效果。
SVM、KNN、DT、RF和ELM按照ML的方式分类都是监督学习。监督学习是指ML模型在标记数据的帮助下,理解输入变量及其相应输出之间的关系,然后在新的数据上测试模型的学习逻辑。从以上研究得出,每个ML方法都各有优缺点,当处理小样本的简单数据时,可以用SVM快速处理,用KNN简单直观地数据处理,用DT作出结构清晰、易于理解的图,对于复杂的大数据集,可以用RF和ELM进行处理,同时也可以多ML方法结合处理,可能效果会更好。
K-均值聚类算法是一种简单的、有监督的ML算法,可用于解决分类和回归问题,其目标是将数据点分成
K个类别,每个类别都有一个聚类中心。聚类中心通过最小化目标函数确定,该函数衡量了数据点与其所属聚类中心之间的距离的总和。在K-均值聚类中,通过迭代更新聚类中心和数据点的归属关系达到最小化目标函数的目的,如图2g所示。Ling Mengqi等对陈酿阶段的葡萄酒风味化合物进行了研究,使用了K-均值聚类算法将挥发性化合物分为波动组、增加组和减少组,具有较好的分类效果。K-均值聚类易于实现和理解,但有一个主要的缺点,即K-均值聚类需要事先给定聚类的数量,而在真实应用中有时候无法确定聚类数量,另一个问题是K-均值聚类算法受到初始化的影响。
层次聚类是一种将数据集中的对象按照相似性逐层聚合的方法。它通过构建一个层次化的树状结构(称为树状图或谱系图),将数据对象组织成一系列的聚类。在聚类过程中,相似性度量用来决定哪些对象应该聚在一起,从而形成一个聚类,如图2e所示。层次聚类的主要特点是它可以提供不同层次的聚类结果,每个层次都能够展示对象之间的相似性关系。它的缺点是在处理大数据集、识别聚类数量以及应对噪声和异常值方面存在一定的限制。在消费者应用偏好的实践上,可以运用聚类分析方法识别消费者对不同番茄品种的偏好。在区分不同风味并归类时,Huang Meigui等研究了各种中国传统甜面酱的香气成分、感官属性及其相关性,通过层次聚类分析,根据甜面酱的浓度和挥发性成分组成将不同种类的甜面酱分为3 个聚类,从而清晰地做出区分。这些研究为通过ML区分归类不同风味的食品提供了参考。
PCA是一种用于降低大型数据集维度、简化数据同时保留大部分重要信息的技术。在风味分析中,PCA可用于识别对整体风味特征最相关的变量。皮尔逊首次在统计学中提出PCA时,将其定义为“找到最适合空间中点系的线和平面”。具体而言,这意味着PCA试图通过一系列线性投影发现和描述数据的内在结构,从而捕捉数据集中最重要的特征和模式,如图2f所示。PCA在减少数据维度时可能会丢失对原始数据有意义的信息。虽然它可以去除噪声和冗余,但有时也可能移除数据中有用的变量。它在不同地理源头进行差异分析的实践中得到了较好的应用,对于不同产地松茸的风味指纹,研究者基于所鉴定挥发性化合物的信号强度进行PCA,结果清楚地显示不同样本在相对独立的空间中可以被很好地区分。Leng Peng等对不同包装的桃子在贮藏过程挥发性有机物进行研究,基于所鉴定挥发性有机物的信号强度进行PCA,结果显示,这些样本在相对独立的空间中可以很好地区分开来,这项研究为食品贮存方式提供了指导。
聚类分析(例如K-均值聚类、层次聚类)、降维技术(例如PCA)按照ML的方式分类都是无监督学习。无监督学习是指在没有预先标记的情况下分析数据,这对于识别新颖的风味特征比较有效。通过上述研究发现,无监督学习可以呈现出数据中有趣的结构,在食品科学中可以帮助研究人员从复杂且庞大的数据集中找到关键信息,主要用于聚类和特征还原。
1.2神经网络
神经网络是一类强大的计算模型,能够从输入数据中学习复杂的模式和表示。在强化学习中,神经网络通过与环境的交互来学习策略。ANN是一种模仿人脑神经元互连方式设计的计算系统,它通过一系列的层次结构对信息进行处理。这些层包括输入层、隐藏层和输出层,其中每个层都由许多处理单元或节点组成,如图2h所示。ANN的目标是学习和模仿大脑处理信息的方式,以解决特定的问题,如分类、预测和模式识别。在神经网络中,每个节点接收来自前一层的输入,经过加权和激活函数处理后传递到下一层。通过训练过程,网络能够调整权重和参数,以减少预测和实际结果之间的差异。可以通过ANN预测牛脂残渣经过美拉德反应后的风味,这项研究通过ANN的分析表明,多输入单输出模型比单输入单输出模型具有更好的性能,预侧准确率达到90%以上。Huang Xiao等使用多元线性回归和ANN模型根据水果中的矿物质元素预测可溶性固形物、酸含量以及可溶性固形物与可滴定酸的比率,该研究发现与多元线性回归(MLR)模型相比,用ANN预测具有更高的准确性和有效性。Singh等使用ANN对经过超高温处理的牛奶在储存过程中的变质过程数据进行建模,研究发现基于ANN的模型的预测性能优于动力学模型。
深度学习是一种特殊类型的神经网络,其使用深层神经网络,它包含多个隐藏层,能够捕捉更复杂的数据特征和模式。深度学习是ML的一个子集,它使用神经网络从大型数据集中学习。在过去几年中,深度学习在多个问题上取得了很好的性能,例如视觉识别、语音识别和自然语言处理(NLP)。Li Jian等基于深度学习对黄酒风味评价,选择了黄酒的乙醇体积分数、总酸、总糖和脱糖固形物作为输入特征,利用多层神经网络得到的黄酒风味评价结果较好。
深度学习又包括CNN(用于图像和视频处理)、递归神经网络(RNN)和其变体,如长短期记忆网络(LSTM)(用于处理序列数据如语音和文本)。CNN其名称来源于矩阵之间的数学线性运算,称为卷积。CNN有多个层,包括卷积层、池化层和全连接层,如图2i所示。卷积层和全连接层有参数,但池化层和非线性层没有参数。CNN在ML问题上表现出色,特别是处理图像数据的应用,如最大的图像分类数据集(Image Net)、计算机视觉和NLP,所取得的结果非常惊人。Chang Yutang等通过所提出的可视化方法聚焦图,呈现了深度卷积神经网络(DCNN)模型预测的风味类别和相应化学成分之间的潜在相关性。这项研究证明了将DCNN方法应用于研磨咖啡的近红外光谱预测特色咖啡风味的可行性。
循环神经网络(RNN)是一种处理时间序列数据的神经网络。与传统的前馈神经网络不同,RNN具有处理序列信息的能力。它通过在网络中引入循环,使得网络能够保持对先前信息的记忆。在RNN中,每一个节点的输出不仅取决于当前的输入,还受到前一步隐藏状态的影响。Qi Lulu等开发了一种鲜味肽的预测方法,称为Umami-MRNN,其构建了多层感知器和RNN的合并模型,然后开发了以6 个特征向量作为输入的预侧,测试表明Umami-MRNN的准确率达到90.5%。这为今后的风味预测提供了指导。然而RNN的主要挑战之一是训练过程中的梯度消失的问题。这是因为在传统的RNN中,随着时间的推移,梯度可能会指数级地增长或减小,这使得其难以学习长期依赖关系。为了解决这个问题,一种特殊类型的RNN——LSTM应运而生。LSTM通过引入门控机制控制信息的流动,从而有效地解决了梯度过度增长或减小的问题,使得其能够学习更长期的依赖关系。Miller等通过自动识别非结构化评论中的描述性术语,用于产品风味表征,构造的模型可以准确识别威士忌评论文本库中的描述符,测试准确率为99%。这项研究为感官科学领域做出了巨大贡献,传统方法是通过专家小组对多种食品品尝并定义描述性术语,这个过程十分耗时。通过模型,研究者可以利用现有数据自动识别和构建一种风味语言。CNN和RNN经常用于风味分析,因为它们能够处理复杂的高维数据并识别风味化合物的复杂组合。
2ML在食品风味分析中的应用
ML在食品风味中应用广泛。表1举例了近年来ML基于仪器分析和风味数据库在食品风味中的应用研究。
2.1预测食品风味
2.1.1预测风味化合物的合成
ML已被应用于预测化学反应或化学合成,科学机器学习(scientific ML,SciML)在计算化学领域打开了一条新路,可以在不需要合成的情况下预测化合物的属性。Jeleń等的研究表明,食品中可以检测到超过10000 种挥发性化合物,但只有5%~10%被认为是香气化合物。在食品风味研究中,分子结构与其感官特性之间的关系非常复杂,如醇类、酯类、羰基化合物、萜烯类和杂环化合物,这些化合物的物理化学性质,如分子结构和化学组成,对它们的感官感知起着决定性作用,不同的分子结构会导致不同的气味阈值。一般来说,不饱和支链酯比饱和支链酯具有更高的气味阈值。双键位置和构型对气味阈值有显著影响。在大多数情况下,在酸的C-2位添加双键会导致明显更高的气味阈值,而在远离酸羰基的位置添加双键对气味阈值的影响较小。Queiroz等提出了一种新的深度生成模型(deep generative mode,DGM)框架,用于设计新的风味分子。其利用DGM对分子进行了随机采样设计,并成功识别出已经在食品工业中使用的分子,包括那些作为风味剂或增香剂的分子。这表明该方法不仅能够识别出现有的风味分子,还能发现新的潜在分子。此外,这项研究还关注了风味工程领域的发展,这是一个将化学和感官科学结合起来的新兴领域。通过研究分子的化学属性与引发的风味感觉之间的关系,研究者们能够设计出新的风味分子,并在不需要合成的情况下预测这些分子的属性。总地来说,这项研究通过其创新的SciML方法,为风味工程提供了强大的工具,该工具不仅可以帮助识别和分析现有市场上的分子,还能设计新的风味分子,从而支持食品工业的发展和创新。
2.1.2风味概况建模
ML算法可以分析包括化学成分、加工条件和感官数据的复杂数据集,以建模和预测食品的风味特征。Boccorh等使用主成分回归得分作为输入,通过BPNN对3 个季节的黑加仑浓缩物的气相色谱数据和感官数据之间的关系进行建模,将预测结果与来自3 个季节的随机一种黑加仑浓缩液的全局模型进行比较。发现在预测总体风味强度方面,ANN模型表现优秀。Men Hong等将E-Tongue和E-Nose分别用于收集啤酒的味道和嗅觉信息。建立了基于SVM、RF和ELM的分类模型评估特征挖掘方法的效率。结果表明,基于变量累加的特征挖掘方法得到了影响啤酒风味信息的主要特征。Viejo等开发了两个基于ANN的ML模型(模型1和2),模型1以E-Nose数据为输入,将样品分为低、中、高的烘焙强度,模型2以E-Nose数据为输入,并通过GC-MS法测得的45 种香气的峰面积预测相对丰度,最终达到预测咖啡的香气特征和风味强度的目的。模型1预测咖啡风味强度的准确率很高(98%),模型2预测咖啡香气的决定系数为0.99,表现良好。综上所述,风味概况建模可以预测食品的风味特征,有助于提升产品的竞争力,满足消费者对食品风味多样性和质量的需求。
2.1.3风味分类和预测
通过使用GC-MS、E-Nose等技术分析挥发性化合物,ML模型可以对食品的香气特征进行分类和预测。Bi Kexin等采用基于GC-MS的CNN和PLSR预测花生油风味。利用GC-MS数据集创建食品的指纹模板,并通过指纹图像生成器进行处理。这些指纹图像随后被用作CNN模型的输入以预测风味。实验结果显示,CNN模型预测风味的准确率约为93%,而PLSR在预测花生油样品风味时的准确率仅为67%。这项研究实现了利用指纹图像对食品的香气特征预测,并证明了基于ML利用GC-MS数据的指纹图像预测香气的可行性。表明CNN在图像提取特征方面表现出强大的性能,但仍需改进模型以减少过拟合问题。Chen Cheng等使用了RF模型进行多分类任务的回归分析,可以在不事先识别MS图库中峰值的情况下进行感官模型的构建和预测。该研究展示了如何将固相微萃取-GC-MS技术与ML结合起来,有效地预测乳粉中的鱼腥味,并识别出导致该味道的关键化合物,为乳品行业提供了一种有价值的分析和质量控制工具。Tian Huaixiang等在研究中首先使用PCA、BPNN和RF模型可视化一组酸奶样品的风味质量分布,其中PCA未能区分满意与不满意的样品。然而,BPNN和RF模型则能清晰地区分这两种样品类型,准确率接近100%。相比BPNN模型,RF模型在区分风味不满意的3 个样品子集方面表现更佳,准确率达到93.75%。该研究表明,E-Nose和非线性化学计量模型的结合是解决食品风味分类的可靠工具。为了更好地对甜味剂分类,肖凌俊等使用改良的深度学习模型,首先对数据集进行了扩增和优化,生成分子指纹以及分子图片,然后将注意力机制加入到密集连接卷积网络结构中,对分子特征和提取的特征进行融合。实验结果表明,分类准确率为0.934,准确率波动幅度小于0.005,优于传统ML模型和常用的CNN模型,可以从大量分子中筛选并识别目标分子,能使相关研究人员更容易地筛选出潜在甜味剂,并为将来甜味剂的筛选提供了一种思路与方法。Wu Danli等使用E-Nose感应不同气味产生的信号,与CNN模型结合,模型由两个卷积层和一个全连接层组成,模型中的卷积层帮助识别和提取气味信号中的模式和特征,而全连接层则对这些特征进行分类,预测其愉悦度,结果发现模型与人类在愉悦度评分上的相关性超过90%,在区分绝对令人愉快和令人不快的气味方面也达到了99.9%的准确率。因此,E-Nose利用CNN不仅可以预测气味的愉悦度,还能用于气味的分类和检测。通过上述的应用可以发现,ML在香气分析中可以对食品风味精准的分类和预测,随着技术的进步,ML在食品香气分析领域的应用将更加广泛和深入。
2.2食品质量监测
2.2.1质量控制
在质量控制中,ML模型可以检测风味特征的偏差,有助于保持食品的一致性。Brendel等推出了顶空固相微萃取-气相色谱-质谱-离子迁移谱(HS-SPME-GC-MS-IMS)双检测系统原型,用于啤酒花质量控制领域的挥发性有机化合物分析,使用ML工具(PCA和聚类分析)对65 个不同啤酒花样品复杂的挥发性有机化合物谱进行非针对性筛选,结果发现预测的标准误差仅为1.04%。这项研究表明HS-GC-MS-IMS与ML相结合可以增强食品的质量保证。Liu Ming等使用便携式E-Nose客观地评估了20 种白酒,研究发现SVM具有区分不同香型白酒的能力。该研究表明,E-Nose结合ML可以作为白酒质量控制和风味评估的客观工具。Viejo等使用ML模型开发了一个客观的预测模型,通过颜色和泡沫相关参数的物理测量评估啤酒中感官描述符的强度水平,实验结果表明ANN回归模型显示出高度相关性,并表明可以使用ML预测啤酒感官描述符的强度水平,以此控制啤酒的质量。Ernest等使用E-Tongue根据可可豆的地理位置快速识别可可豆,发现SVM在5 个PC下的训练集和预测集中均对可可豆有100%的区分率。这些研究表明,ML可以提高对食品质量控制的效率,随着技术的不断发展,ML在食品质量控制领域的作用将更加显著。
2.2.2 识别食品掺假
ML不仅可以识别食品风味特征是否一致,也可以对不同区域产的食品作出准确区分,以此检测食品中是否有掺假行为。Tian Xiaojing等 为了预测掺假羊肉中猪肉的比例,使用E-Nose和E-Tongue收集数据并输入,采用MLR、偏最小二乘分析和BPNN回归模型,用于区分掺有不同比例猪肉的羊肉沫的感官特征,结果证明BPNN是预测猪肉比例最有效的方法,校准和验证数据集的
R2 均高于0.97。Bougrini等 使用E-Tongue区分不同地理和植物来源的蜂蜜样品,获得的数据通过PCA、SVM和层次聚类分析进行分析,研究发现可以对18 种不同地理来源的蜂蜜和7 种不同植物来源的蜂蜜进行分类,同时在检测掺假蜂蜜方面也取得了优异的效果。该研究表明不同ML方法与E-Tongue结合可以对食品质量的控制做出贡献。Ordukaya等 以E-Nose数据为原始数据,通过不同ML方法对橄榄油进行质量分析。第1种方法中,32 个输入被应用于分类器;第2种方法使用PCA将32 个输入最小化为8 个输入再应用于分类器,分类器使用朴素贝叶斯法、KNN、LDA、DT、ANN和SVM。结果发现第2种方法的准确率比第1种高,朴素贝叶斯法的准确率达到了70.83%。该研究表明朴素贝叶斯法在分类橄榄油方面表现出色。Ayari等 使用PCA和ANN分析牛酥油E-Nose数据,以识别掺假情况,E-Nose可识别在纯牛酥油中以不同比例混合的葵花籽油和牛体脂肪,发现PCA的精确度优于ANN。该研究表明应用PCA在识别纯牛酥油是否掺假中效果较好。倪金等 基于近红外光谱与KELM相结合,提供了一种陈化大米以及不同程度混掺大米的定性定量检测方法,其准确度和
R2 分别达到90%和0.8892。徐瑞煜等 将不同品牌浓香型白酒的三维荧光光谱经过二阶偏导的预处理后,结合PCA和SVM实现了不同品牌浓香型白酒的分类鉴别,最终较好地实现了不同品牌浓香型白酒的分类,准确率为100%,对市场上白酒的打假有一定的意义。根据上述研究可以得知,ML技术可以对掺假食品作出较好的区分,从而判断是否存在掺假的行为。
2.3感官反馈分析
2.3.1 消费者偏好分析
通过整合感官评估数据和消费者反馈,ML模型可以预测消费者对某些口味的偏好,有助于针对特定细分市场定制产品。Bi Kexin等使用自动编码器从专家评分的感官属性中提取产品特征,并通过SVM分析将获得的感官特征回归到消费者偏好。结果表明,深度学习模型可以保证较高的准确度,所反映的特征映射可以为生产者的产品设计或修改提供很大的帮助。对于视觉感官,Koyama等认为新鲜度的视觉感受是消费者购买果蔬时考虑的重要因素,然而,评估食品时进行小组测试既耗时又昂贵。其评估了基于图像处理的ML技术对菠菜新鲜度进行分类的能力。研究结果表明,使用SVM分类器和ANN模型有可能取代目前由未经训练的小组进行的新鲜度评估。对于预测消费者的感官偏好,Yang Huihui等提出了一种将融合电子感官分析技术与ANN相结合预测人类对果汁的感官享受的方法,其采用了定量描述分析和评分测试方法进行人体感官评价并对融合的电子感官特征与人类感官属性进行建模,建立人类感官属性和接受度的拟合模型,这项研究为ML对消费者感官分析的模型可行性进行了验证。Zhou Fan等通过ML连接2 种类型的主题(即用于动机的文本主题和用于购买行为的产品相关主题)建模消费者的动机与其购买行为之间存在的下游关系,以量化和解释消费者的选择。Pinheiro等分析了ML在乳制品感官分析中的应用,表明ML有助于揭示消费者偏好的驱动因素、描述感官特征和判断感官接受度,并分析情感特征与感官接受度之间的关系。ML在此领域的应用主要是评估物理和化学特征与感官接受度的关系,并预测基于描述性测试的消费者反应。通常ML一般使用对数回归、DT、ANN和SVM等算法识别消费者行为数据中的模式,通过这些算法创建一个数据模型,从而预测消费者的偏好。这些研究表明,通过ML可以更快速地预测消费者的偏好,为消费者提供更加满意和个性化的食品选择。
2.3.2 食品文本分析
使用NLP(ML的一个子集)分析消费者在社交媒体和在线平台上的评论和反馈,可以深入了解消费者对食品口味的看法。Hamilton等 进行了一项利用NLP技术进行快速和自动化感官分析的研究,通过NLP工具分析威士忌的非标准文本中的感官属性,这个工具允许分析更大量的自由文本,同时减少主观判断。最终的术语列表通过对应分析和聚类层次分析被分组到一个风味轮中,这项研究不仅在快速描述性方法领域取得了突破,而且在大数据、威士忌研究方法论以及ML应用方面也显示出其创新性和实用性。
2.4成分优化
ML还可以帮助优化成分组合,以实现所需的风味特征。这对于配制新食品或重新配制现有产品以满足不断变化的消费者偏好特别有用。在食品风味配方创新中,Al-Rifaie等利用进化计算技术将酿酒师所需的感官特性先映射到配料上,再模拟配料的用量和组合方法,从而设计出适合特定感官啤酒的新配方。Veeramachaneni等使用小组感官评测的数据预测由相同成分以新组合组成的其他口味,实验结果发现,通过ML预测出的新口味受到小组感官评测人员的认可。这些研究为研发新口味提供了参考,从而帮助食品行业风味创新,并满足了消费者的喜好,为行业焕发新的活力。
图3总结了ML在食品风味研究中的应用。通过预测食品风味、食品质量监测、感官反馈分析和成分优化,可以发现ML在增强对食品风味的理解和开发方面具有多功能性,是食品行业的宝贵工具。ML在食品风味方面显示出巨大的潜力,但是每个模型都有各自的优劣,没有可以统一分析使用的模板,需要根据实际的实验需求,因地制宜地选择适合的模型。同时,多种ML方法的组合往往比单一模型更能有效地预测食物风味,不同的仪器结合对于风味分析结果具有更高的准确性。未来对食品风味的研究需要足够的样本量,通过多种ML模型结合、多种仪器分析手段组合可以提高分析的准确性。
3 结 语
文章列举了几种常用的ML方法。当处理小样本的简单数据时,用SVM快速处理,KNN进行简单直观的数据处理,DT作结构清晰、易于理解的图;对于复杂的大数据集,用RF和ELM进行处理;在处理复杂的高维数据并识别风味化合物中的复杂模式时使用神经网络。还探讨了ML在食品风味中的应用,强调了ML在食品领域中的重要性。
ML在提高食品质量、安全性和消费者满意度方面具有重大的潜力,未来的研究可以通过不断地改善ML算法或使用多种算法组合提高模型预测效果,减少单一模型的弊端,从而增加数据的可信度,促进ML算法在食品风味研究中的应用。风味分析技术在近几年在不断地更新,未来还可以使用更新的分析技术(如GC×GC-TOF MS和质子转移反应质谱等)与ML模型相结合。通过ML模拟创造新的风味化合物十分有意义,可以为食品行业带来新的活力,同时对消费者的感官数据预测模拟,使新的风味物质与感官结合对未来食品风味的创新具有实用价值,可以进一步探索ML在食品科学领域的应用潜力。
本文《 机器学习在食品风味分析中的应用 》来源于 《食品科学》 2023年45卷第12期31-41页,作者: 沈潇,王海涛,姚凌云,孙 敏,王化田,宋诗清,李雪,冯涛*。 DOI: 10.7506 / spkx1002-20240104-040 。 点击下方 阅读原文 即可查看文章相关信息。
实习编辑:栾文莉;责任编辑:张睿梅。点击下方阅读原文即可查看全文。图片来源于文章原文及摄图网
热门跟贴