1. 数据分析网首页
  2. 大数据
  3. 统计学

小白学统计(33)大样本(n≥30)条件下总体均值?的区间估计

小白学统计(33)大样本(n≥30)条件下总体均值?的区间估计

大样本(n≥30)条件下的区间估计

当样本容量为大样本时,根据中心极限定理,样本均值`X的抽样分布以正态分布为极限,此时可以不用考虑通体的分布形式。估计时,根据总体标准差σ是否已知分为两种形式:

1、 总体标准差σ已知,的置信度为1-α的置信区间为

`X-Zα/2*σ/n<<`X+Zα/2*σ/n

2、 总体标准差σ未知,的置信度为1-α的置信区间为

`X-Zα/2*S/n<<`X+Zα/2*S/n

在有限总体中进行抽样时,如果是非重复抽样,要使用有限修正因子来修正估计平均误差。如果考虑修正因子,则上面的置信区间改写为

`X-Zα/2*σ/n*(N-n)/(N-1)<<`X+Zα/2*σ/n*(N-n)/(N-1)

`X-Zα/2*S/n*(N-n)/(N-1)<<`X+Zα/2*S/n*(N-n)/(N-1)

小白学统计(33)大样本(n≥30)条件下总体均值?的区间估计

大家在以后的使用中,需要根据给定条件来确定是否需要修正。

例1:

某大学从某一学院中随机抽取学生100人,得知他们平均每天用于体育锻炼的时间为26min。根据以往的数据知道,该学院大学生每天体育锻炼时间的标准差为12min。试求该学院大学生平均每天体育锻炼时间的置信区间,置信度为95.45%。

解:由题中可知:`X=26,n=100,σ=12,由1-α=95.45%,得α=0.0455。该学院虽为有限总体,但N未知,可看为无穷大,故不用考虑修正因子。查表得

Zα/2=Z0.0455/2=2,则的置信区间为

`X-Zα/2*S/n<<`X+Zα/2*S/n = (26-2*12/100,26+2*12/100) = (23.6, 28.4)

可以解释为:有95.45%的可靠程度,估计该学院大学生平均每天体育锻炼的时间在23.6~28.4min之间。

例2:

在例1中,如果已知该学院全部学生为1800人,其它已知条件同例1。试求该学院学生平均每天体育锻炼时间的置信区间。

解:与例1不同的是,总体单位N=1800已知,且n/N=0.056>0.05,因此需要用有限修正因子修正,则的置信区间为

`X-Zα/2*σ/n*(N-n)/(N-1)<<`X+Zα/2*σ/n*(N-n)/(N-1) = (26-2*12/100*(1800-100)/(1800-1), 26+2*12/100*(1800-100)/(1800-1)) = (23.7, 28.3)

可以解释为:有95.45%的可靠程度,估计该学院大学生平均每天体育锻炼的时间在23.7~28.3min之间。

从例1和例2估计的平均每天锻炼时间的结果做比较,可以看出,在同样的条件下,使用修正因子,可以提高估计的精度。

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

发表评论

登录后才能评论

联系我们

如有建议:>>给我留言

QR code