1. 数据分析网首页
  2. 大数据
  3. 统计学

小白学统计(29)切比雪夫(Chebyshev)定理

在总体分布未知(或非正态)且样本容量小于30时,均值的抽样分布是未知的,这时我们就不能运用中心极限定理、t分布和大样本理论来估计总体的均值,此时,可以运用切比雪夫(Chebyshev)定理来近似估计总体均值。

应用背景

在总体分布未知(或非正态)且样本容量小于30时,均值的抽样分布是未知的,这时我们就不能运用中心极限定理、t分布和大样本理论来估计总体的均值,此时,可以运用切比雪夫(Chebyshev)定理来近似估计总体均值。

回顾总体均值估计方法表:

小白学统计(29)切比雪夫(Chebyshev)定理

切比雪夫定理

Chebyshev定理:给定一组数据x1,x2,…,xn,其均值假定为μ,标准差σ>0,则对任意k≥1,位于区间[μ-kσ,μ+kσ]内的数据所占比例大于等于1-1/k2

切比雪夫定理解释:对于给定的总体,位于区间[μ-kσ,μ+kσ]内的总体比例至少为1-1/k2(即曲线下的阴影面积),这是总体比例的下限,明显的,位于区间[μ-kσ,μ+kσ]内的比例大于1-1/k2,所以这个定理也称为切比雪夫不等式,如下图所示:

小白学统计(29)切比雪夫(Chebyshev)定理

总体均值的置信区间:切比雪夫不等式应用

从上表中可以知道,来自非正态总体的小样本(N≤30)均值的抽样分布和t分布都不适用,这里可以用切比雪夫不等式来对总体均值进行估计,推断过程如下:

小白学统计(29)切比雪夫(Chebyshev)定理

推断依据回顾

均值无偏估计:小白学统计(27)抽样分布:详述均值的抽样分布及中心极限定理

方差无偏估计:小白学统计(5)——数据离散程度描述

例题分析

一种新的心脏手术正在一家医院推广,对于已完成的20例这种手术,平均住院期为14.3天,标准差为2.84天,因为手术复杂,住院期天数的总体不服从正态分布,而是有些正偏,总体标准差未知,求总体均值的90%近似置信区间。

小白学统计(29)切比雪夫(Chebyshev)定理


如果可以假设该总体是正态的,即能够使用t分布方法,则可以得到有更高精度的精确90%置信区间:

小白学统计(29)切比雪夫(Chebyshev)定理


对比用切比雪夫不等式和t分布的结果,可以说明前者是对总体均值的近似,后者是对总体均值的精确。(见总体均值估计方法表)

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

发表评论

登录后才能评论

联系我们

如有建议:>>给我留言

QR code