1. 数据分析网首页
  2. 大数据
  3. 统计学

小白学统计(48)单样本假设检验范例分析及违背假定的情况

对于标准差未知的总体均值,总体方差和总体标准差的假设检验应该如何进行呢?

学习到这里,大家应该已经知道:进行总体参数的估计或假设检验是基于有关总体以及所考察样本特征的非常精确、非常严格的假定,它们描述了所研究的特征例如参数的性质,分布的形状和抽样的类型。例如,对于标准差已知的无限大正态总体,抽取容量为n的样本,则样本的均值抽样分布是正态分布的,可以进行Z变换,从而使用Z统计量进行总体均值的估计和假设检验。对于标准差未知的总体均值,总体方差和总体标准差的假设检验应该如何进行呢?下面这个表格列出了不同的假设前提下,抽样分布的类型,适用的统计量和参数的估计情况。

2016100601

下面以具体的范例分析进行说明。

总体均值假设检验:标准差已知的正态总体

已知条件适用Z统计量精确(查上表)。

范例:某销售胡萝卜种子的公司在宣传其产品时表示此种子的胡萝卜平均长度为11.5cm。现取40个长成的胡萝卜样本,得其平均长度为11.8cm,假定长度测量值总体是标准差为1.15cm的正态总体,在显著水平0.05下,用临界决策规则给出H0:μ=11.5cm;H1:μ≠11.5cm的双尾检验。

解:因为是正态总体,且总体标准差已知,可以用Z统计量,假设检验过程如下:

2016100602

总体均值假设检验:标准差未知的正态总体

从上表可知,在该情况下,可以用T统计量进行假设检验。

范例:标准的牙科麻醉剂在注射后平均10.5min后会消除感觉。现在有一种新型麻醉剂,制造商声称其作用比标准麻醉剂能更快消除感觉。有一名医生决定做一个实验,他随机对10名患者使用这种新型麻醉剂,并记录他们失去感觉的时间:9.3,9.5,9.2,9.0,9.3,9.5,9.4,9.3,9.2,9.1。在显著水平0.01下,进行假设检验,说明该厂商的说法正确与否。

解:因为以前麻醉剂生效的时间是正态分布,所以合理的假定新型麻醉剂也是正态分布,是正态总体;因为关心的是生效时间减少,所以用左尾假设检验;由于总体标准差未知,所以用t统计量;假设检验过程如下:

2016100603

总体均值假设检验:来自任意分布总体的大样本(N≥30)

从上表可知,如果是大样本(N≥30),根据中心极限定理,不论总体的分布情况,均值的抽样分布近似正态分布[如果有限总体无放回抽样,则总体容量N必须为样本容量的至少两倍]。可以用Z统计量。

范例:一条省际高速公路上有一段弯曲的下坡路段比较繁忙。相关部门正在研究这一繁忙路段是否需要拓宽。用雷达仪测量了经过该路段中点的85辆汽车的行驶速度,得到平均速度为66.3mph,如果从以往的研究中知道总体标准差为8.3mph,现在想知道在显著水平0.05下,这一段高速公路上的汽车是否比限制速度65mph快。

解:由于总体标准差已知,样本足够大且总体容量为样本容量的至少两倍大,所以可应用中心极限定理假定样本均值的抽样分布近似正态分布,用Z统计量进行假设检验:

2016100604

总体方差(标准差)的假设检验:正态分布总体

在卡方分布文章中介绍,正态总体的方差估计可用卡方统计量,假设检验同样如此。

范例:某品牌355ml苏打饮料标签上标明含有35毫克的钠,为表明苏打中钠的含量保持在34.5毫克,标准差为0.24毫克,在正常的质量控制检验中,会从生产线上随机选取了10瓶,若样本的标准差明显大于0.24毫克(在显著水平0.05水平下),则停止生产线,且调整苏打配置程序。如果在一次这样的检验中,得到标准差为0.29毫克,是否有必要调整配置流程?

解:根据题意,该品牌355ml苏打饮料中钠的含量是正态分布的,所以验证标准差是否大于0.24毫克,可以转化为方差大于0.0576,这样可以使用卡方统计量,假设检验过程如下:

2016100605

违背假定的情况

从单样本的假设检验和上面的案例可以有总结:如果抽样分布可以认为是正态分布、t分布、卡方分布或近似这些分布,假设检验的结果是稳健的。但是如果总体分布及标准差未知有是小样本,如何?

分析这样的小样本,第一步是看样本分布的形状。有下面的方法:(1)相对频数分布或茎叶图可以很快给出分布是对称的还是有偏斜、单峰还是多峰。(2)使用正态概率纸,画出样本的累计百分数分布,在概率纸上画出的正态分布的累计百分数分布应是一条直线。(3)利用拟合优度检验,比较样本频数与期望的正态分布频数(后续发布)。

如果这些检验表明与正态分布存在严重偏离,则下一步是试图对数据进行变换。通常将数据从一个测量尺度转变成另一测量尺度。例如:如果样本分布是正偏的,可以用对数变换:样本中的每个测量值变换为它的对数值。

如果变换成功且基本满足检验的假定,则可对变换后数据进行假设检验。如果数据严重偏离参数假定,且找不到合适变换以满足假定,则不能进行参数假设检验。这时,可以用非参数方法来分析数据的其他方面,这并不需要严格的假定。(后续发布)

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

发表评论

登录后才能评论

联系我们

如有建议:>>给我留言

QR code