1. 数据分析网首页
  2. 大数据
  3. 统计学

小白学统计(57)方差分析:单因素方差分析

对多个总体均值进行检验,需要用到方差分析方法

基础准备

在多样本的参数估计与假设检验基础中以单因素方差分析为例,介绍了方差分析原理和推导过程,本篇从分析步骤角度再次介绍单因素方差分析:

对多个总体均值进行检验,需要用到方差分析方法(ANalysis Of VAriance,简称ANOVA)。例如,某工厂有A、B、C三台轧制板材的设备,如果想知道这三台设备轧制板材的厚度是否一致,就可以转化为检验来自三个总体的均值是否相同的问题。以上面所说轧制板材为例,检验A、B、C三台设备轧制的板材厚度是否一致,可以建立如下假设:

H0: μ12=…=μr

H1: μ1,μ2,…,μr不全相等。

三个总体均值是否相等无从知道,但是可以通过样本均值是否有显著差异来检验总体均值是否相等。因为,如果H0为真时,则可以期望样本均值很接近,如果样本均值很接近,则推断总体均值相等的证据很充分,就可以接受H0。否则,当样本均值相距较远,就认为总体均值相等的证据不充分,从而拒绝H0,接受H1。

样本均值之间距离的所谓远近是相对的,是通过假定的共同方差的两个点估计值比较得出的。第一个点估计是组内方差,用各个样本方差估计得到的,只与每个样本内部的方差有关,反映各个水平内部随机性的变动。第二个点估计值是组间方差,在H0为真的前提下,由均值抽样平均误差计算得到,这样得到的方差包含两部分的变动:一是各个水平内部的随机性变动,二是各个水平之间的变动。将组间方差与组内方差相比,可以得到一个F统计量(F=组间方差/组内方差),可以证明该统计量服从F分布。

由推断可知,如果三台设备轧制板材的厚度均值相差很小,即组间方差中的各个水平之间的变动很小,F比值会接近于1。反之,则F的比值会显著地大于1,根据上面计算得到的F值,在显著性水平α给定的情况下,就可以做出是否接受三台设备轧制板材厚度均值相等的假设。

单因素方差分析步骤

现在假定一个因素B具有c个水平的因变量进行方差分析检验,例如上面提到的工厂轧制设备是因素,分别试验轧制了10块板材是水平。

1、建立假设

H0: μ1=μ2=…=μc;

H1: μ1,μ2,…,μc不全相等。

2、计算样本均值和样本方差

小白学统计(57)方差分析:单因素方差分析

3、计算组间方差

小白学统计(57)方差分析:单因素方差分析

4、组内方差的估计

小白学统计(57)方差分析:单因素方差分析

5、构造F统计量进行检验

F=组间方差/组内方差=MSB/MSE~F(c-1, nT-1)

如果c个总体均值不相等,则组间方差(MSB)会大于组内方差(MSE)。当F值大到某一临界值时,就可以拒绝H0。临界值的大小由给定的α和自由度决定。所以,当给定显著性水平为α时,F的拒绝域为F>Fα(c-1,nT-c)。

6、方差分析表

小白学统计(57)方差分析:单因素方差分析

范例分析

例题:有8位食品专家对三种配方的食品随机品尝,然后给食品的口感分别打分(满分10分),如下表。问三种配方的平均分数是否相同?(α=0.05)(假定打分服从标准相等的正态分布)。

小白学统计(57)方差分析:单因素方差分析
解:设μA,μB,μC分别代表配方1、2、3。已知因变量是分数,因素是配方,水平为3,具有相同的样本容量8。根据题意建立假设:

H0: μA=μB=μC;

H1: 总体均值不全相等。

首先,计算样本均值及方差

小白学统计(57)方差分析:单因素方差分析

其次,计算组间方差MSB

小白学统计(57)方差分析:单因素方差分析

第三,计算组内方差MSE

小白学统计(57)方差分析:单因素方差分析

第四,计算F统计量

小白学统计(57)方差分析:单因素方差分析

最后,查表Fα(c-1,nT-c)= F0.05(2,21)=3.47。因为F=1.119<3.47= F0.05(2,21),落在接受域。所以接受H0,拒绝H1,即三种配方的口感分数没有显著的差异。

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

发表评论

登录后才能评论

联系我们

如有建议:>>给我留言

QR code