1. 数据分析网首页
  2. 大数据
  3. 统计学

小白学统计(53)两个总体均值差的区间估计

两个总体均值差的区间估计

基础准备

两样本参数估计:两样本估计和假设检验基础

两样本假设检验:两样本估计和假设检验范例分析

成对样本假设检验:成对样本两个总体均值差的假设检验

根据两个样本之间的关系,可以划分为独立样本和成对样本(两样本估计和假设检验基础),它们的区间估计方法是不同的,成对样本的区间估计和假设检验请回顾:成对样本两个总体均值差的假设检验);如果是从两个互相之间没有影响的样本中得到的数据,称之为来自独立样本。下面介绍来自两个独立样本的均值之差的区间估计。

独立样本区间估计

σ1,σ2已知的正态总体

正态总体的均值抽样分布是正态分布的,根据概率的运算法则(回顾:概率的基本运算法则),两正态总体的均值差的抽样分布也是正态分布的,且两总体标准差已知,所以应用z分布进行区间估计和假设检验。

设有两个总体X1~N(1, σ12),X2~N(2, σ22),1,2未知,σ12,σ22已知。n1,n2为两个独立样本的样本容量。`X1,`X2,S1,S2分别是两个样本的统计量。根据抽样分布理论及正态分布的线性可加性原理,可以证明:

2016101101

σ1,σ2未知,假定σ12,两样本容量小于30

前面介绍过(回顾:不同条件的总体均值单样本估计方法总述),对于正态总体,标准差未知的情况,需要用到t分布进行均值的区间估计和假设检验,这是对于单样本而言的;对于两正态总体,标准差未知,当σ12时,可以将两总体均值差的问题转化为单个总体均值区间估计和假设检验的问题了,此情况的公式推导请回顾:两样本估计和假设检验范例分析

当n1和n2皆小于30时,可以证明:

2016101102

σ1,σ2未知且不相等两样本容量小于30

与上述情况稍有不同,当两正态总体标准差不等时,如何进行区间估计和假设检验呢?同样是运用t分布,不同的是自由度不再是n1+n2-2,而是由下式计算得到得自由度对应的t值来进行区间估计和假设检验。

2016101103

n1≥30且n2≥30的任何总体

根据中心极限定理(抽样分布:详述均值的抽样分布及中心极限定理),当两样本容量均大于30时,它们的抽样分布都服从正态分布,则两总体均值差的抽样分布也服从正态分布,所以,当两总体的标准差已知时有如下结论:

2016101104

当σ1,σ2未知时,则理论上两总体均值差的置信区间应同前述t分布情况相同,即用t分布确定。但对于大样本,t分布近似于正态分布,所以用t分布和正态分布都适用此情况。用正态分布,只需用S1,S2分别代替σ1,σ2,即为:

2016101105

范例分析

例1:从甲,乙两厂生产的同种型号的电子元件中各抽取15件和17件。经测试甲厂产品的平均无故障时间为1600h,标准差为55h;乙厂平均无故障时间为1500h,标准差为50h。已知总体服从正态分布,且方差大致相同。试估计甲,乙两厂产品平均无故障时间之差的置信度为95%的置信区间。

解:总体1代表甲厂,总体2代表乙厂。已知`X1=1600,S1=55,n1=15;`X2=1500,S2=50,n2=17。本例属于小样本推断,已知两总体服从正态分布,且标准差未知且相等,所以使用t分布结题,首先计算Sp:

2016101106

例2:分别在城市1和城市2中随机抽取n1=400,n2=500的职工进行调查,经计算两城市职工的平均月收入及标准差分别为`X1=1650元,S1=230元;`X2=2485元,S2=482元。求两城市职工平均月收入之差的99%的置信区间。

解:本例属于大样本推断,因此可不考虑总体分布。故两总体均值差的置信区间公式为:

2016101107

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

发表评论

登录后才能评论

联系我们

如有建议:>>给我留言

QR code