Simca是代谢组学数据分析时常用的第三方软件,也被直接嵌入到一些仪器厂商的数据分析软件中,如Waters公司的MarkerLynx Ezinfo,所以这里简单介绍一下软件基本操作。

由于个人并不是专业学习统计分析,所以这里介绍的都是用的基本操作,具体到参数的选择,以及分析的原理,还需要请教专业的老师

数据集的准备:

由LC-MS采集的原始数据,经过仪器配套软件的预处理(峰提取,对齐,归一化等)后,将含有样本名称,保留时间_质核比,以及离子强度的数据集导出为.csv格式(simca-p可以识别的数据格式很多,但是仪器可以导出的最常用的格式是.csv)。

数据集整理:

需要将数据整理成可以直接导入simca-p软件分析的模式。将导出的文件用Excel打开,按照下图整理数据。

数据集导入:

数据分析:

主成分分析(PCA)

参数更改

模型拟合

偏最小二乘判别分析(PLS-DA)

建立模型

自动拟合模型,查看得分图和载荷图(操作同PCA)

Permutation分析验证模型有无过拟合

正交偏最小二乘判别分析(OPLS-DA)

建立模型(同上述操作),在对样本分组之后选择OPLS-DA模型。

拟合模型,分析数据。