卡方分析

卡方检验主要用于研究定类与定类数据之间的差异关系。

1. 数据类型

卡方检验要求X、Y项均为定类数据,即数字大小代表分类。

  • 如果X是定类数据,Y是定量数据,且X组别多于2组,则应该使用方差分析。

  • 如果X是定类数据,Y是定量数据,且X组别仅为两组,则应该使用T检验。

2. 研究目的

一般使用卡方检验进行分析的目的都是比较差异性。

如现状调查类问卷,以及一般调查问卷中,常使用卡方检验对样本背景信息题(性别、年龄等指标)与核心题项进行交叉分析,来说明样本背景这类指标对核心变量是否存在影响。

除了上述研究场景外,卡方检验还可用于研究配对数据的差异性,比如对同一组患者用两种方法诊断癌症,看两种方法的诊断结果是否有差异,则要使用配对卡方检验。

如果研究目的在于分析实际观测的比例与期望比例是否一致。比如实际抽样的男女比例,与预期比例是否存在差异,此时可使用卡方拟合优度。

3. 数据格式

定类数据涉及两种格式可供选择:原始格式和加权格式。

如果数据经过了统计整理,则需要整理为加权格式,分析时将频数列放入【加权项】即可,得到的结果与原始数据结果完全一致。

加权格式如何录入可以查看我们之前推送的文章:什么时候需要加权数据。

4. SPSSAU操作

(1)交叉卡方

SPSSAU-交叉卡方

如上图,分析不同性别的人群,使用理财产品的情况是否有差别?这里Y项也可以放入多个标题,一起分析。

分析时先看P值情况,P值小于0.05或0.01即说明X与Y之间呈现出显著性,然后可以再进一步比较括号中的百分比,对每一项进行描述。

如果P>0.05了,则代表没有统计学意义,一般就不再进行深入分析。

具体可参考SPSSAU输出的“分析建议”及“智能分析”。

SPSSAU-分析建议

SPSSAU-智能分析

(2)卡方检验

如果使用加权数据,就要用“实验研究”→“卡方检验”。

如下面例子:研究A、B两种药治疗感冒,两种药的疗效是否有差别?

放置位置和交叉卡方一样,只是多加了一个加权项。

  • 卡方检验增加了一些过程值的输出,原因在于实验研究中样本个数通常比较少,而默认使用的pearson卡方,要求总样本量n≥40,且所有的期望频数E≥5。

  • 当n≥40且存在任意一个1 ≤E<5,则使用yates校正卡方。

  • 当n<40,或E<1时,则用Fisher卡方。

这个选择过程SPSSAU会自动进行判断,并输出适合的卡方值及结果,直接使用该结果即可。

深入指标反映的是变量之间的相关程度,即在分析结果已经得出P<0.05,两种药物治疗感冒的疗效确实存在显著性差异时,进一步比较两种药品的疗效差异幅度究竟有多大。

SPSSAU提供了五个指标,分别对应不同的情况。可结合给出的”分析建议”进行选择,帮助手册中也有对应说明,不会时可以查阅。

由于篇幅原因,配对卡方与卡方拟合优度的操作说明,就不再展开说明,详细步骤可以查看帮助手册。

5. 其他说明

多选题卡方检验

多选题与其他题项的交叉分析也可采用卡方检验,只是SPSSAU将多选题单独设计为一个方法,方法上依然是卡方检验。

卡方检验的结果显示在左下角,P>0.05代表性别对于理财产品选择并不会呈现出差异性。

以上就是卡方分析的流程梳理。卡方检验无论是在问卷调研或是医学实验中,都是非常实用高效的方法,没有展开说明的部分建议大家查阅SPSSAU帮助手册进行学习。