SPSS-非参数检验

Thursday, April 1, 2021

单样本K-S检验

K-S检验是以俄罗斯科学家Kolmogorov-Smirnov命名的一种非参数检验方法。该方法利用样本数据推断样本来自的总体是否服从某一理论分布,适用于探索连续型随机变量的分布。SPSS中可以检测的分布包括正态分布,均匀分布,指数分布,泊松分布。

K-S检验的原理是在\(H_0\)前提下,计算各样本观测值在理论分布中出现的理论累计概率值\(F(X)\);然后计算样本观察值的实际累计概率值\(S(X)\),最后计算实际累计概率值与理论概率值的差\(D(X) = \max(|S(X_i) - F(X_i)|)\)。如果样本总体的分布与理论分布差异不明显,则\(D\)不应该较大。SPSS中会给出统计量\(D\)的观察值和对应的概率值\(p\)以此进行假设检验的推断。

可以使用分析-非参数检验-旧对话框-1-样本K-S来进行K-S检验。在输出前可以使用数据-拆分文件中选择按组组织输出来根据某个分类分组输出统计结果。Sig值小于0.05时,拒绝样本分布与理论分布相同的假设。当检测是否为正态分布时,可以借助P-P图辅助判断。

两独立样本的非参数检验

非参数统计方法通常不强调总体分布,而是将观察值的顺序及其性质作为研究对象,统计量的构造利用的次序关系,并非具体数值。一组样本数据\(X_1,X_2,...,X_n\),将其按照升序排列,得到序列\(X_{(1)} \le X_{(2)} \le X_{(3)} \le ... \le X_{(n)}\)。其中\(X_{(i)}\)是第\(i\)个顺序统计量,对顺序统计量性质的研究构成非参数检验的理论基础。

要认识非参数检验,我们还需要介绍的概念。对于一组样本数据\(X_1,X_2,...,X_n\),将其从小到大排序,排序编号\(i\)为秩,获得相应的秩统计量。许多情况下,数据中有相同的值,排序会出现并列现象,被称为数据中的结。例如"2,2,5,7,7,7,10"这个数据列中有两个结\(\tau_1=2,\tau_2=3\)

两独立样本的非参数检验是在总体分布不了解的情况下,通过对两组独立样本的分析,来推断样本来自的两个总体的分布是否存在显著差异的方法。在两独立样本的非参数检验方法中,Mann-Whitney U检验是应用最广的一种。其原假设是两组独立样本来自的总体样本分布无显著差异。

Mann-Whitney U检验将两组样本放在一起,根据观察值大小排序编号,谓之秩。将第一组样本秩相加,记为\(w_1\). 同样得到第二组样本秩和\(w_2\)。构造Mann-Whitney U检验统计量\(U=\min(U_1,U_2)\),其中\(U_1=nm+n(n+1)/2-w_1,U_2=nm+m(m+1)/2-w_2\)。其中\(n,m\)分别为两组样本的个案数。小样本下,U统计量服从Mann-Whitney分布,依据U观测值和概率值p, 检验假设。大样本下,U统计量近似服从正态分布。

还有一种方法被称为Wilcoxon秩和检验法。其原理如下图。

可以使用分析-非参数检验-旧对话框-2个独立样本进行检验。需要输入一组待检验变量以及一组分组变量。

多独立样本的非参数检验

多独立样本是指按独立抽样方式获得的多组样本。多独立样本的非参数检验通过分析多组独立样本数据,推断样本来自的多个总体的中位数或分布是否存在显著差异。

多独立样本通常用Kruskal-Wallis检验进行分析。多独立样本的Kruskal-Wallis检验实质上是两独立样本的Mann-Whitney U检验在多个独立样本下的推广,用于检验多个总体的分布是否存在显著差异。其原假设为多个独立样本来自的多个总体的分布无显著差异。

其基本思想是:

  1. 将多组样本数据混合并按升序排序,求各组每个观察值的秩。
  2. 求各组观察值秩的均值,检测秩均值之间是否存在显著差异。
  3. 若各组秩均值不存在显著差异,则是多组数据充分混合,数值相差不大的结果,可认为多个总体的分布无显著差异;否则,若各组秩的均值存在显著差异,则认为多个总体的分布有显著差异。

具体统计量为:

\[ K - W = \frac { 12 } { N ( N + 1 ) } \sum _ { i } ^ { k } n _ { i } \left( \bar { R } _ { i } - \bar { R } \right) ^ { 2 } \]

其中\(N\)为总样本个数,\(n_i\)为第\(i\)组样本个数,\(\bar { R } _ { i }\)\(i\)组秩平均,\(\bar {R}\)为总平均秩。该统计量服从Kruskal-Wallis分布。

在SPSS中,可以使用分析-非参数检验-旧对话框-K个独立样本来进行检验。具体步骤同上节。

两配对样本的非参数检验

两配对样本的非参数检验是在对总体分布不甚了解的情况下,通过需要对两组配对样本分析,推断两个总体的分布是否存在显著差异的方法。在这种情况下,要求两配对样本样本数一致,各样本值的先后次序是不能随意更改。两配对样本非参数检验主要有符号检验Sign以及Wilcoxon符号秩检验。

符号检验也称为正负号个数检验法,其检验原理是利用正负符号的个数进行检验。正负符号通过第二组样本的观察值-第一组样本观察值,差值为正记“+”,差值为负记“-”。检验法比较“+”与“-”的个数,若个数相当,则可认为第二组样本大于第一组样本的个数与小于第一组样本的个数大致相当。总体上讲两组配对样本的数据分布差距较小,反之差距大。

若采用二项分布检验的方法,问题转化单样本的二项分布检验,即检验正负号个数的分布是否服从p=0.5的二项分布。在小样本情况下,计算二项分布的精确概率。大样本情况下 ,采用修正了的Z统计量,近似正态分布。

两配对样本分布的差异显著性也可以采用Wilcoxon符号秩检验方法。其分别计算正号秩总和W+和负号秩总和W-,若二者大致相当则说明两组样本数据差的正负变化程度基本相当,两配对总体的分布无显著差异。小样本下检测统计量为\(W=\min(W+,W-)\),服从Wilcoxon符号秩分布。大样本近似服从正态分布,可利用\(W\)构造统计量\(Z\)

上述两种方法都可以使用分析-非参数检验-两个相关样本来进行检验。检测Sig值如果大于0.05,则说明两配对样本呢分布之间没有显著差异。

多配对样本的非参数检验

多配对样本通过分析多个配对样本数据,推断样本来自的多个总体的分布是否存在显著差异。多配对样本的非参数检验方法主要有三种。

Friedman 检验是利用秩实现对多个总体分布是否存在显著差异的检验。其原假设是多个总体的分布无显著差异。其原理是在区组内对观察值排序,得到区组内观察值的秩。如果样本间不存在显著差异,则每个区组的秩总和(或平均秩)应和其他各组的秩总和(或平均秩)基本一致。

由此构造Firedman检验统计量

\[ Firedman = \frac { 12 n } { k ( k + 1 ) } \sum _ { i = 1 } ^ { k } \left( \bar { R } _ { i } - \frac { k + 1 } { 2 } \right) ^ { 2 } \]

其中,\(n\)为样本量,\(k\)为区组数,\(\bar { R } _ { i }\)\(i\)区组平均秩。

Cochran’s Q 检验是用来检测多配对样本的分类变量(且不是有序分类变量)之间是否存在差异的方法,其原假设是各配对样本之间不存在显著差异。Kendall协和系数检验则常用于检测评价的一致性。 如果评价不相关,任一个被评价对象所得秩没有相关性,每个对象的秩和应该相差不大。但如果评论家的评价是一致的(正相关),则有的对象秩和较大,有些对象的秩和较小。其原假设是评价不具有一致性。Kendall W 协和系数取值在0~1区间,越靠近1,一致性越强,靠近0,一致性弱。在进行Kendall协和系数检验时,应将注意力放在W系数值的大小,而不是兼研究结果是否有统计学意义上。

非参数检验总结

  1. 稳健。因为对总体分布的约束条件放宽,不至于因为统计假设过分理想化而无法切合实际情况,不至于对于个别偏离较大的数据太敏感。
  2. 对数据的测量尺度无约束,对数据的要求不严格。
  3. 适用于小样本,无分布样本,数据污染样本,混杂样本

一般情况下,参数法的效率高于非参数法。但是,参数法需要实现假定分布类型,导致当数据违反假定时分析结果可能不准确。因此,这种情况下,就可以考虑采用非参数检验,以确保检验的准确性。

SPSS

SPSS-多因素方差分析

SPSS-卡方检验