小白学统计(56)多样本的参数估计与假设检验基础

方差分析是利用样本信息来检验关于k个总体的均值的假设的方法,还能用于确定总体均值的置信区间和估计各个总体方差的差距。

基础准备

  • 单样本估计和假设检验:单样本的假设检验;单样本假设检验范例分析及违背假定的情况
  • 两样本估计和假设检验:两样本估计和假设检验基础;两样本估计和假设检验范例分析
  • 自由度回顾:抽样分布:t分布
  • F分布回顾:两样本估计和假设检验基础;
  • 总体方差与抽样分布方差关系:抽样分布:详述均值的抽样分布及中心极限定理;

多个样本推断

单样本和两样本中,一次至多处理两个总体,而在多个样本场合中,将同时处理三个或更多的总体,各总体分别具有均值和标准差,根据来自这些总体的样本进行总体参数的估计与假设检验,这将用到方差分析方法(ANOVA)。方差分析是利用样本信息来检验关于k个总体的均值的假设的方法,还能用于确定总体均值的置信区间和估计各个总体方差的差距。

多样本的统计假设

多样本假设检验的一对统计假设:原假设和备择假设;

原假设:

小白学统计(56)多样本的参数估计与假设检验基础
备择假设:

小白学统计(56)多样本的参数估计与假设检验基础

方差分析类型

方差分析的对象:一个或多个客观存在的独立变量,它们可能会影响到要观测的、不能独立变化的因变量,称为“因子”或“因素”。例如:有一个因子(水稻的品种)可能会影响到因变量(植株的高度)。因子的不同类别称为“水平”,例如:品种1、品种2和品种3。

如果仅有一个因子或因素,称为单向方差分析(单向ANOVA)。依次类推,两个因子的方差分析称为双向方差分析(双向ANOVA),多于两个因子的称为多向方差分析(多向ANOVA)。

下面以单向方差分析为例,具体说明方差分析的原理和过程。

单向方差分析假设条件

单向方差分析事先假设了三个条件:

1、所有总体(例如:k个水稻的品种)都服从正态分布,都有各自的均值与方差;

2、所有总体方差都相同;

3、所有样本互相独立,取自各自总体,样本容量可以相同也可以不同。

单向方差分析

以水稻例子来阐述:有三个品种的水稻,针对这它们进行试验:将每个品种各取5株在培养室中培育,然后在其成熟期(发芽后的130天)测量各株的高度(单位:厘米),数据列在下表中:

小白学统计(56)多样本的参数估计与假设检验基础
上表是方差分析的数据整理表格,通过上表可以计算得到下列数据:

组内平方和SSW(Sum of square of within):各个品种内部围绕各自平均值的变差的一种度量,计算如下:

小白学统计(56)多样本的参数估计与假设检验基础
组间平方和SSA(Sum of square of among):它是样本间随机变差以及因处理不同而可能导致的样本均值变差的一种度量:

小白学统计(56)多样本的参数估计与假设检验基础
组间平方和SSA的计算公式推导(为什么乘5?总体方差与抽样分布方差关系回顾:抽样分布:详述均值的抽样分布及中心极限定理):

小白学统计(56)多样本的参数估计与假设检验基础

总平方和SST(Sum of square of total):所有数据变差的总和:

小白学统计(56)多样本的参数估计与假设检验基础

SST=SSA+SSW

总平方和是所有样本值与总均值变差的一种度量,对于单向方差分析,总变差可以分解成两部分:一组样本内部由于随机选取或处理方法不同产生的变差SSW;不同组样本之间由于因素(因子)的原因产生的变差SSA。所以总变差SST等于SSW与SSA之和。可以通过上面的计算结果得到验证:

SSA=19.6;SSW=14.8;

SSA+SSW=19.6+14.8=34.4=SST

均方

为了得到总体方差的无偏估计,必须将样本平方和除以一个恰当的自由度,在方差分析中,将这种样本平方和除以自由度得到的方差称为均方(自由度回顾:抽样分布:t分布)。

上面已经计算得到了三个平方和,除以相对应的自由度,得到三个均方MSA,MSW,MST:

MSW的计算:用组内平方和除以自由度,因为组内平方和先计算得到每一组样本的平方和,然后再相加得到,所以自由度为k(n-1)=3*(5-1)=12。

小白学统计(56)多样本的参数估计与假设检验基础

MSA的计算:用组间平方和除以自由度,因为组间平方和先计算每组样本的均值,然后与总均值计算平方和,所以自由度为k-1=3-1=2。

小白学统计(56)多样本的参数估计与假设检验基础

MST的计算:用总平方和除以自由度,因为总平方和是所有的样本值与总均值差得平方和,所以自由度为nk-1=5*3-1=14。

小白学统计(56)多样本的参数估计与假设检验基础

F检验

前面介绍过F检验,有F统计量:

小白学统计(56)多样本的参数估计与假设检验基础
F检验及F统计量公式推导(回顾:两样本估计和假设检验基础)。

在单向方差分析中,为了适用F检验,构造了两个方差:组间方差和组内方差;将组内方差(样本内方差)作为分母,组间方差(样本间方差)作为分子。前面假设了所有总体(品种)方差相等,即有共同方差,所以组内方差和组间方差是共同方差的两个点估计,基于这个假设,F统计量可以表示为:

小白学统计(56)多样本的参数估计与假设检验基础

单向方差分析基本原理

一个正态分布可以由两个参数(均值和方差)完全确定,单向方差分析假设所有总体方差相同,所以要检验所有总体均值是否相等,也就是要检验所有样本是否来自一个总体。

之所以可以用F检验来检验所有总体均值是否相等,是因为单向方差分析假设所有总体方差相同,所以F统计量可以简化为:

小白学统计(56)多样本的参数估计与假设检验基础
MSA和MSW都是通过样本数值计算得到的,计算过程包含样本均值,样本均值是总体均值的无偏估计。若零假设为真,样本均值是总体均值的无偏估计,则抽样数据得到的F的值应该接近于1;如果零假设不真,则F值会显著的大于1。

这样就可以通过F检验的方式来检验各总体均值是否相等(样本是否来自同一个总体)。

范例分析

用上方例题:有三个品种的水稻,针对这它们进行试验:将每个品种各取5株在培养室中培育,然后在其成熟期(发芽后的130天)测量各株的高度(单位:厘米),在0.05的显著水平下作右尾检验,数据列在下表中:

小白学统计(56)多样本的参数估计与假设检验基础

小白学统计(56)多样本的参数估计与假设检验基础

方差分析表

今后用统计分析软件进行上述方差分析时,都会得到下面方差分析表,然后可以进行假设检验的判断:

小白学统计(56)多样本的参数估计与假设检验基础
范例的方差分析表如下:

小白学统计(56)多样本的参数估计与假设检验基础

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

返回顶部