1. 数据分析网首页
  2. 大数据
  3. 统计学

小白学统计(22)概率分布关系:正态分布作为二项分布近似

内容介绍:

计算二项分布的某个概率,需要对二项式展开(p+q)n的相关项相加,这是一个放缩的过程,而且对较大的n值或许得有一台计算机。上一篇(概率分布关系:泊松分布作为二项分布近似)指出,在一定条件下(当n≥20且q≤0.05时),可以使用泊松分布对二项概率进行近似。类似地,在一定条件下正态分布也是二项分布的一个良好近似,如下图所示,从而可用于计算二项分布的概率。由于这样得到的概率只是对二项概率真实值得近似,故正态分布的这种应用称为二项分布的正态近似。

小白学统计(22)概率分布关系:正态分布作为二项分布近似

只有所考虑的二项分布与正态分布相似,即对称且具有钟型,使用正态近似方法才是合适的,在以下两个条件下,上述结果成立:

(1) p值(成功的概率)越接近0.5,二项分布越对称(图一)。

(2) 对任何p值,无论距离0.5多远,如果p值不变而n(试验次数,或样本容量)增大,得到的均值为np和方差为npq的二项分布在形状上越来越近似一个的正态分布(图二)。

小白学统计(22)概率分布关系:正态分布作为二项分布近似

那么,对于足够接近0.5或n充分大是否也有规则呢很多统计学著作找到一个规则是:当np和nq两者都大于等于5时,可以使用二项分布的正态近似。更严格一点就是np>5且nq>5。

连续型修正:为了用连续型分布近似离散型分布,必须将离散值看做一个区间,离散值就是使用每个测量区间的中点,而每个测量区间上下各延伸了0.5,比如测量二项分布变量8≤x≤10区间的概率,用正态近似就需要测量7.5≤x≤10.5区间的概率。

范例分析:

投掷一枚硬币14次出现正面的次数,计算在14次投掷中出现8、9或10次正面的概率,使用二项分布方法和正态近似分别计算。

(a) 用二项分布计算过程如下:

小白学统计(22)概率分布关系:正态分布作为二项分布近似

(b) 由于np=nq=7>5,所有用正态近似是合适的。对均值为np=14*0.5=7,方差为npq=14*0.5*0.5=3.5的正态分布计算p(7.5≤x≤10.5)。将正态概率值变换成标准正态概率值。

img-06066

从计算结果比较,二项计算值0.3666与正态近似值0.3629的计算结果基本相同,二项分布的正态近似结果很好。

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

发表评论

登录后才能评论

联系我们

如有建议:>>给我留言

QR code