小白学统计(67)非参数方法:秩次检验

秩次检验对总体分布无更多假定,由于没有充分利用样本信息,且功效较低,因而只有当参数方法不适用时才采用秩次检验。

基础准备

  • 参数方法与非参数方法区别:非参数方法:卡方检验的运用

秩次检验

前一篇介绍了卡方检验的应用(非参数方法:卡方检验的运用),今篇介绍的秩次检验也是非参数方法的一种。秩次检验对总体分布无更多假定,由于没有充分利用样本信息,且功效较低,因而只有当参数方法不适用时才采用秩次检验。

秩次检验,顾名思义就是排序的意思,其原理是基于总体中的所有个体以相等的数量(区域)分布在中位数的两侧。将样本与中位数(已知或假设)之差进行排序,进而得到样本在中位数两侧的数量(区域),根据数量(区域)的多少,即可检验假设的中位数是否正确,也可以验证抽取样本的总体是否等于某种分布。

秩次检验主要有以下几种:

  • 单样本检验:总体中位数是否等于某个常数;
  • 两样本检验:两总体中位数是否相等;
  • 两样本检验:两独立样本是否来自一个总体;
  • 多样本检验:k个独立样本是否来自一个总体;
  • 成对样本检验:单调相关性检验;

下面以前三种运用来举例说明其运用方法。

单样本检验:总体中位数假设检验

单样本秩次检验是用来确定总体的中位数是否等于某个假设值,又被称为Wilcoxon符号秩检验。这是基于中位数的定义:若总体的中位数等于假定值,则样本中有一半大于该值,而另一半小于该值。检验统计量是建立在差的得分基础之上的,差的得分可通过将每个观测值减去假定的中位数而得。

对于小样本(样本容量小于30),Wilcoxon符号秩检验程序如下:1、随机抽取一个样本,对于每个样本观测值,减去零假设给定的中位数,将这些差的得分取绝对值,然后排序,记录下其所在位置作为其秩(顺序),最小的秩为1,最大的秩为n。若两个差得分相同,则取其所在位置的平均(如,两个差的得分排在第四位,则这两个差的得分的秩均为4.5,即4与5的算术平均);2、将差的得分的原始符号(+或-)附在其相应秩的前面,正秩的和记为W+,负秩的为记为W-,若零假设为真,则每个秩应等可能的取+或-,从而绝对值的W+和W-应近似相等;3、算出W+和W-的绝对值以后,需要检验统计量:对比W+和W-绝对值中较小值与Wilcoxon临界值表相应临界值(相应显著水平和样本容量条件下),判断是拒绝原假设还是接受原假设。

范例:一位电影评论员按照从1(最差)到10(最好)的标准评价电影。工作20年后,其评分中位数为6.3。他退休后,公司雇佣另一人接替他的工作,工作一个月后,这位新评论员共观看了10部电影,评分是:3.8,5.6,1.8,5.0,2.4,4.2,7.3,8.6,9.1,5.2。公司领导想了解这位新评论员与其前任在评分上是否有所不同,给定显著水平0.05,利用临界值决策规则,对零假设:两位评论员的评分中位数相同,做双侧Wilcoxon检验。

小白学统计(67)非参数方法:秩次检验

两样本检验:两总体中位数是否相等

该秩次检验又称为相依样本的Wilcoxon符号秩检验,与单样本的Wilcoxon符号秩检验相比,相依样本的Wilcoxon符号秩检验研究观测值成对抽取时,成对样本中位数的差。检验步骤与单样本基本一致。

范例:一位牛奶场主想知道某种激素是否会增加奶牛的产奶量,为此,他随机抽取10头奶牛做观测,对于每头奶牛,记录其产奶量,经这种激素处理一周后,再记录其产奶量,测量结果如下:(30,34);(25,35);(22,27);(25,24);(23,25);(34,26);(33,24);(30,24);(24,27);(32,21),每对数据的第一个代表用激素前的产奶量,后一个代表用激素处理一周后的产奶量,给定显著水平0.05,利用临界值决策规则,对原假设:激素处理前后奶牛产奶量不变,做单侧Wilcoxon检验。

小白学统计(67)非参数方法:秩次检验

两样本检验:两独立样本是否来自同一总体

该秩次检验又称为Wilcoxon-Mann-Whitney检验,研究两个独立样本是否来自同一个总体。零假设是两抽样总体的分布相同;备择假设是它们不同或者一个比另一个大(一个总体的个体数量大于另一个总体的个体数量)。

检验步骤:将来自样本1的观测值与来自样本2的观测值合并,然后从小到大排序,记下其所在位置作为秩,若有一些观测值相同,则取算术平均作为秩。如果两个总体的分布相同,这两个样本的秩应该是随机混合的,如果两个总体的分布不同,则一个样本的秩将高于另一个样本的秩。定义样本1所有秩的和为,R1,样本2所有秩的和为R2,有下面检验统计量:

小白学统计(67)非参数方法:秩次检验
取U1和U2中较小者作为Mann-Whitney检验统计量。

范例:某公司人事经理想知道公司文科毕业生和理科毕业生工作10年后是否有相同薪金。为此,随机选取10位文科毕业生,调查结果如下:35000,30000,45000,42000,50000,52000,25000,38000,40500,41000;又随机选取13位理科毕业生,调查结果如下:35500,40000,48000,53000,58000,57000,54000,49000,49500,51000,51500,57500,52500。给定显著水平0.05,利用临界值决策规则,对零假设:两种薪金的分布相同,做双侧Mann-Whitney检验。

小白学统计(67)非参数方法:秩次检验

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

分享本页
返回顶部