1. 数据分析网首页
  2. 大数据
  3. 统计学

小白学统计(14)离散型随机变量概率分布——泊松分布

上一篇文章中,我们介绍了离散型随机变量的二项分布,为了便于各位统子的知识串联和掌握,下面将介绍由二项分布公式到泊松分布公式的推导过程。

推导过程:

二项分布概率公式:

小白学统计(14)离散型随机变量概率分布——泊松分布

表示为X~B(n,p)(二项分布概率公式解释及应用实例,请见上一篇)

下面我们做以下假定条件:

  1. 一个事件在一段时间或空间内发生的平均次数或数学期望为λ;
  2. 我们将这段时间或空间分成n等份,在每一等份的时间或空间内,这个事件发生的概率为λ/n,当n很大时,λ/n很小,即在这段内,要发生两次或者更多次事件是不可能的。因此在这段时间内不发生该事件的概率表示为:1-λ/n;
  3. 在n个等份中,每个等份是否发生该事件是独立的;
小白学统计(14)离散型随机变量概率分布——泊松分布

根据以上假定条件,在这段时间内,该事件发生k次的概率服从二项分布:X~B(n,λ/n)。我们可以得到概率表示如下:

泊松分布的概率图

小白学统计(14)离散型随机变量概率分布——泊松分布

泊松分布概率累计图

小白学统计(14)离散型随机变量概率分布——泊松分布

C” />

泊松分布的应用:

从上面的推导过程来看,泊松分布有以下几个应用特点:

  • 泊松分布适合于描述单位时间内随机事件发生的次数的概率分布。如某一服务设施在一定时间内受到的服务请求的次数,电话交换机接到呼叫的次数、汽车站台的候客人数、机器出现的故障数、自然灾害发生的次数、DNA序列的变异数、放射性原子核的衰变数等等。
  • 二项分布可以看作泊松分布在离散时间上的对应物。
  • 在二项分布中,如果试验次数n很大,二项分布的概率p很小,只要n≥20,p≤0.05时,就可以用泊松分布代替二项分布。例如,某厂有30台车床,每台车床在一周内发生故障的概率是0.02,计算在一周内恰有两台车床发生故障的概率?用二项分布计算的结果与泊松分布计算的结果几乎没有误差。(可以自己计算,如需要计算过程,可以直接回复索取)

应用实例:

已知某家小杂货店,平均每周售出2个水果罐头。请问该店水果罐头的最佳库存量是多少?

解:假定不存在季节因素,可以近似认为,这个问题满足以下三个条件:

(1)顾客购买水果罐头是小概率事件。

(2)购买水果罐头的顾客是独立的,不会互相影响。

(3)顾客购买水果罐头的概率是稳定的。

img-12

各个参数的含义:

  • P:每周销售k个罐头的概率;
  • X:水果罐头的销售变量;
  • k:每周销售罐头数的取值(0,1,2,3…);
  • λ:每周水果罐头的平均销售量(数学期望),是一个常数,本题为2;

根据公式,计算得到每周销售不同数量罐头数的概率及累计概率:

小白学统计(14)离散型随机变量概率分布——泊松分布

从上表可见,如果存货4个罐头,95%的概率不会缺货(5%=1/20,即平均19周发生一次);如果存货5个罐头98%的概率不会缺货(2%=1/50,即平均49周发生一次)。

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

分享本页
返回顶部