Simca-p是代谢组学数据分析时常用的第三方软件,并且也被直接嵌入到一些仪器厂商的数据分析软件中,如Waters公司的MarkerLynx Ezinfo,所以这里简单介绍一下软件基本操作。

由于个人并不是专业学习统计分析,所以这里介绍的都是用的基本操作,具体到参数的选择,以及分析的原理,还需要请教专业的老师

数据集的准备:

由LC-MS采集的原始数据,经过仪器配套软件的预处理(峰提取,排列,归一化等)后,将含有样本名称,保留时间_质核比,以及离子强度的数据集导出为.csv格式(simca-p可以识别的数据格式很多,但是仪器可以导出的最常用的格式是.csv)。

  • 数据集整理:

  • 需要将数据整理成可以直接导入simca-p软件分析的模式。将导出的文件用Excel打开,按照下图整理数据。

  • 数据集导入:

  • 数据分析:

  • 主成分分析(PCA)

  • 参数更改

  • 模型拟合

  • 偏最小二乘判别分析(PLS-DA)

  • 建立模型

  • 自动拟合模型,查看得分图和载荷图(操作同PCA)

  • Permutation分析验证模型有无过拟合

  • 正交偏最小二乘判别分析(OPLS-DA)

  • 建立模型(同上述操作),在对样本分组之后选择OPLS-DA模型。

  • 拟合模型,分析数据。

不足之处,还请指正。

原创文章,欢迎转载。^_^

欢迎点击文末原文链接,关注如沐风科研中医药平台(基础科研+直播课+文献),一起探讨学习!小编微信:1278317307。