1. 数据分析网首页
  2. 大数据
  3. 统计学

小白学统计(51)两样本估计和假设检验基础

估计和假设检验根据样本数的不同,分为:单样本估计和假设检验;两样本估计和假设检验;多样本估计和假设检验。

基础准备

估计和假设检验根据样本数的不同,分为:单样本估计和假设检验;两样本估计和假设检验;多样本估计和假设检验。

前面讨论了单样本参数推断性统计:总体参数的估计和参数的假设检验。

通过前面的学习可以发现,推断性统计的基础是样本的抽样分布。不同的总体分布情况,总体均值、方差和标准差的情况,样本容量的大小适用不同的抽样分布(统计量),然后才能得到准确或近似的总体参数的区间估计和假设检验结果。单样本估计和假设检验如此,两样本和多样本估计和假设检验也是如此。

两样本估计和假设检验的作用和统计量

单样本估计和假设检验是用单个样本的参数来估计总体的参数,用单个样本的参数对总体参数进行检验。那么两样本估计和假设检验的作用是什么呢?作用就是通过从两个总体中抽取样本,然后用它们估计和检验两个总体同个类型未知参数的差别(关系)。

为了达成上面的目的,需要选取合适的统计量。对于两总体均值的差别,通过统计量两总体均值差(μ1-μ2)来考量;对于两总体方差的差别,通过方差比考量。

两样本类型

两个样本根据抽样类型的不同可以分为:独立样本和成对样本。独立样本:若从一个样本中选取的观测值,无论怎样都不会影响从另一个样本中选取的观测值概率,则称样本为独立样本;成对样本:若从一个样本中选取的观测值,以某种方式决定了另一个样本中选取的观测值,则称样本为成对样本或配对样本。

例如:某种新型眼药水的检验问题,厂家声称它比传统的眼药水见效快,检验这个说法可以用独立样本或成对样本。在独立样本情况中,随机选取两组不同的测试者,其中一组用传统眼药水,另一组用新型眼药水;在成对样本情况中,只选一组测试者,并让每个人左眼使用传统麻醉剂,有眼使用新型麻醉剂。

通常独立样本是唯一选择,因为很多时候两个样本都是随机确定的,所以独立样本是唯一可能的情况。而成对样本能够较好的控制外部变量,例如两种药水试验,将两种药水用于同一人可以控制样本间关于个体在年龄、健康状况或其他可能影响眼药水反映的外部变量间的随机差别;此外成对样本在两样本估计和假设检验问题上的置信区间更精确,检验功效更强(见后面推导)。

均值差

两总体均值差的最优估计

样本均值抽样分布的均值是总体均值的最优无偏估计,可以扩展到两样本情形:来自两个总体的样本均值抽样分布的均值差是两个总体均值差的最优无偏估计,任何特定的两样本均值差是两总体均值差的一个点估计。

均值差的理论抽样分布

一个离散的或连续的概率分布,若它对两样本统计量:均值差的所有可能值指定了概率或密度,则称这个概率分布为均值差的理论抽样分布。该抽样分布有以下结论:

小白学统计(51)两样本估计和假设检验基础

通过均值差的抽样分布(正态分布或t分布)可以把样本均值差和总体均值差联系起来,从而进行两总体均值差的估计和假设检验,如下图所示:

小白学统计(51)两样本估计和假设检验基础

均值差的置信区间和假设检验类型

已知条件不同,估计和假设检验的方法也不同,有以下几种类型:

均值差的置信区间:标准差已知的正态分布总体的独立样本;

均值差的假设检验:标准差已知的正态分布总体的独立样本;

均值差的置信区间:标准差未知,但假定相等的正态分布总体的独立小样本(小于30)

均值差的假设检验:标准差未知,但假定相等的正态分布总体的独立小样本(小于30)

均值差的置信区间:标准差未知的任何总体分布的独立大样本(大于等于30)

均值差的假设检验:标准差未知的任何总体分布的独立大样本(大于等于30)

均值差的置信区间:成对样本

均值差的假设检验:成对样本

方差比

两总体方差比的最优估计

比较总体方差不能和总体均值一样,用方差的差来进行统计推断,而应该用方差比。由于样本抽样分布的方差是总体方差的最优估计量,所以两样本抽样分布的方差比也是两总体方差比的最优估计量,任何特定的样本方差比是总体方差比的一个点估计。

为了对两总体方差比进行估计和假设检验,需要将特定的点估计值与总体方差比联系起来的统计量(抽样分布),这时可以使用F统计量。

F统计量和F分布

小白学统计(51)两样本估计和假设检验基础
小白学统计(51)两样本估计和假设检验基础

F分布不是一个分布,而是一个连续概率分布族,每个正整数值自由度的组合都是一个F分布。因为F统计量是两个独立的卡方统计量被本身各自的自由度相除后的比,所以F分布很想卡方分布,而且和卡方分布随着自由度增加越来越对称一样,F分布也随着两个自由度的增加越来越对称,如下图所示:

F分布的临界值

当样本来自正态分布时,它有自由度为n-1的卡方分布:

小白学统计(51)两样本估计和假设检验基础

同样的,当两个样本都来自正态分布时,有由两个自由度影响的F分布:

小白学统计(51)两样本估计和假设检验基础


如下面曲线所示:

小白学统计(51)两样本估计和假设检验基础
小白学统计(51)两样本估计和假设检验基础
小白学统计(51)两样本估计和假设检验基础

方差比的置信区间和假设检验类型

由于卡方分布的前提是正态分布总体,所以F分布也有正态分布总体的假定条件:

方差比的置信区间:参数未知的正态分布总体的独立样本;

方差比的假设检验:参数未知的正态分布总体的独立样本;

不同类型均值差和方差比的估计和假设检验将会在下篇中用具体范例进行应用说明。

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

分享本页
返回顶部