1. 数据分析网首页
  2. 大数据
  3. 统计学

小白学统计(12)——通俗归纳离散型概率分布

基础准备

随机变量回顾请见第8篇《随机变量的种类与描述》

概率回顾请见第5篇《推断理论基础——概率》

两个概念

随机变量分类:离散型随机变量和连续性随机变量。可以用“点”和“线”来类比理解。“点”(离散型)就是随机变量的取值是有限个或可列无限个。“线”(连续型)就是随机变量的取值在某一段区间上可以取无线多个。

概率分布:是指随机变量的取值与其概率所构成的分布。在二维坐标中,通常横轴是随机变量的取值,纵轴是不同取值对应的概率。根据随机变量的分类,概率分布也分为离散型概率分布和连续型概率分布。

主要离散型概率分布

  • 二项分布
  • 多项分布
  • 超几何分布
  • 泊松分布

二项分布

在生活中,许多行为(试验)的结果只有两个:“成功”和“失败”。例如:检查产品的质量,其结果只有两个:合格与不合格;如果试验的结果多于两个,但只关心其中一个结果,也可以视为只有两个结果,例如,调查教育程度时,结果有文盲、小学、初中、高中、大学,但我们只对大学感兴趣,则这个试验的结果可以看作两个:大学和不是大学。这些行为(试验)称为伯努利试验;检查n个产品的质量或调查了n个路人的教育程度,称为n重伯努利试验,将“成功”或“失败”的次数看做一个随机变量,其概率分布称为二项分布。总结这些行为(试验),可以归纳出以下性质:

1、一次试验有且仅有两种可能结果:“成功”和“失败”,两个结果是随机决定且互斥的。

2、每次试验中,成功的概率是P,失败的概率是1-P,并且成功和失败的概率是常数或近似于不变。

3、各次试验之间相互独立,每次试验结果不受其它各次试验结果的影响。

多项分布

多项分布是二项分布的推广。二项分布试验的结果只有两个,多项分布的试验结果有多个,例如,调查教育程度时,结果有文盲、小学、初中、高中、大学等5种结果。比照二项分布试验的性质,可以有多项分布试验的性质如下:

1、一次试验有k种可能的结果,k个结果是随机决定且互斥的。

2、在每次试验中,每种结果都有各自发生的概率且概率保持不变,所有概率之和为100%。

3、各次试验之间相互独立,每次试验结果不受其它各次试验结果的影响。

超几何分布

在二项分布试验和多项分布试验中,每次试验结果的发生概率是不变的,而超几何分布试验结果的概率会随着每一次试验发生变化。例如,在抽样试验中,二项分布试验和多项分布试验是有放回抽样(总量不变)或无限总体无放回抽样(总量近似不变,一般抽样比例低于5%);超几何分布就是有限总体无放回抽样(总量变化)。

泊松分布

泊松概率分布:考虑在连续时间和空间单位上发生的随机事件的概率。通俗解释:基于过去的经验(随机事件在某段时间或某个空间发生的平均数),预测该随机事件在新的同样长的时间或同样大的空间中发生N次的概率。泊松分布经常用于商业中的库存控制。诸如,一家海鲜餐厅过去一个月顾客平均订购7只龙虾,如果该餐厅希望今后能有95%的把握满足顾客需求,需要储存龙虾的数量。

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

联系我们

如有建议:>>给我留言

QR code