转载自:惠Thinker

假设检验的定义

假设检验(hypothesis testing),又称统计假设检验,是用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。

显著性检验是假设检验中最常用的一种方法,也是一种最基本的统计推断形式,其基本原理是先对总体的特征做出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受做出推断。

常用的假设检验方法有Z检验、t检验、卡方检验、F检验等。

假设检验的假设

由定义可知,我们需要对结果进行假设,然后再利用样本信息判断这一假设是否成立。

所以在做假设检验时会提出两个假设:

原假设:

备择假设:

原假设与备择假设互斥,接受原假设意味着拒绝备择假设;拒绝原假设意味着接受备择假设。

显著性水平

显著性水平是指当原假设实际上正确时,检验统计量落在拒绝域的概率。这个值是我们做假设检验之前定好的。

当给定检验的显著水平

时,进行双侧检验的

进行假设检验利用的是小概率原理,小概率原理是指发生概率很小的随机事件在一次随机试验中几乎不可能发生。

一般认为等于或小于0.05或0.01的概率为小概率。

检验统计量

在参数的假设检验中,需要借助样本统计量来进行系统推断,这个统计量称为检验统计量。

拒绝域

拒绝域的功能主要用来判断假设检验是否拒绝原假设的。如果样本观测计算出来的检验统计量的具体数值落在拒绝域内,就拒绝原假设,否则不拒绝原假设。

给定显著性水平α后,查表可以得到具体临界值,将检验统计量与临界值进行比较,判断是否拒绝原假设。

打开网易新闻 查看精彩图片

检验统计量的确定

样本量大小是选择检验统计量的一个要求。

在样本量大的条件下,如果总体服从正态分布,则样本统计量服从正态分布;如果总体为非正态分布,则样本统计量渐近服从正态分布。

在这些情况下,我们都可以把样本统计量视为正态分布,这时可以使用

统计量,即在总体标准差

已知时,有

当总体标准差

未知时,进行检验所依赖的信息有所减少,这时只能使用样本标准差,应采用

统计量,则有

:样本均值

:假设的总体均值

:样本标准差

:总体标准差

:样本量

若计算得出统计量的值落入拒绝域时,则拒绝原假设,反之,则接受原假设。

两类错误

对于原假设提出的命题,我们需要作出判断,可以用“原假设正确”或“原假设错误”来表述,这是依据样本提供的信息进行判断的,也就是由部分来推断总体。

所以判断有可能正确,也可能不正确,也就是说,我们面临着犯错误的可能。所犯错误的类型如下有两种:

事实/决策

接受

拒绝

为真

(正确决策)

(弃真错误)

为假

(取伪错误)

(正确决策)

Ⅰ类错误也称

错误,指当

为真时,拒绝了

假设;

Ⅱ类错误也称

错误,指当

为假时,接受了

假设。

在假设检验中,需首先控制犯Ⅰ类错误。由于报告了本来不存在的现象,则因此现象而衍生出对后续研究的影响是不可估量的。

相对而言,Ⅱ类错误的危害则相对较小,若对自己的假设比较有信心,可以重新设计实验,再次来过,直到得到自己满意的结果。