1. 数据分析网首页
  2. 大数据
  3. 统计学

小白学统计(10)——贝叶斯定理(统计在生活中的应用)

贝叶斯(Thomas Bayes, 1701—1761)是英国人,主要职业是牧师,业余爱好才是数学。他为了证明上帝的存在,发明了概率统计学原理,虽然他的这一美好愿望至死也未能实现,却为统计学的发展做出了巨大的贡献。

贝叶斯定理在统计学基础《贝叶斯定理——概率的修正方法》中已经介绍过,最近再次遇到这个概念,觉得很能体现统计学在生活中的应用,所以分享出来,和大家一起细细咀嚼。

背景介绍

贝叶斯(Thomas Bayes, 1701—1761)是英国人,主要职业是牧师,业余爱好才是数学。他为了证明上帝的存在,发明了概率统计学原理,虽然他的这一美好愿望至死也未能实现,却为统计学的发展做出了巨大的贡献。

维基百科中对贝叶斯定理来源的描述:所谓的贝叶斯方法源于他生前为解决一个“逆概”问题写的一篇文章,而这篇文章是在他死后才由他的一位朋友发表出来的。在贝叶斯写这篇文章之前,人们已经能够计算“正向概率”,如“假设袋子里面有N个白球,M个黑球,你伸手进去摸一把,摸出黑球的概率是多大”。而一个自然而然的问题是反过来:”如果我们事先并不知道袋子里面黑白球的比例,而是闭着眼睛摸出一个(或好几个)球,观察这些取出来的球的颜色之后,那么我们可以就此对袋子里面的黑白球的比例作出什么样的推测”。这个问题,就是所谓的逆概问题。

定理回顾

通俗解释贝叶斯定理:在运用概率对某一事件进行推断之前,我们往往已经事先掌握了关于这一事件的概率,这个概率可能是主观概率或者相对概率(回顾概念,请回复5),这种初始的概率可以称为先验概率。如果在后续的研究中,通过抽样调查样本等消息源又获得了有关该事件的信息,我们就可以根据这些新信息对先验概率进行修正,使先验概率变为后验概率。这个修正概率的定理就称为贝叶斯定理。

贝叶斯定理公式:

小白学统计(10)——贝叶斯定理(统计在生活中的应用)

详解个例子让大家更好理解:假定A,B,C三个工厂生产同一种零件市场占有率分别为10%、25%和65%。已知A,B,C三家工厂生产零件的不合格率分别是30%、20%和10%。现从市场上某一批零件中随机抽取一件,经检验该零件不合格,则这个零件由A,B,C生产的概率分别是多少?

解:在没有抽取零件之前,我们知道来自A,B,C三个工厂的产品分别占10%, 25%, 65%,这些就是先验概率。现在我们在市场上抽取的产品是不合格品,这是一个新的信息,我们利用这个信息可以得到后验概率。分析过程见下表:

A, B, C三个生产一件不合格零件的情况表
工厂先验概率条件概率联合概率后验概率
A

B

C

0.1

0.25

0.65

0.3

0.2

0.1

0.1*0.3=0.03

0.25*0.2=0.05

0.65*0.1=0.065

0.03/0.145=0.207

0.05/0.145=0.345

0.065/0.145=0.448

 1.000.1451.000

我们可以看到先验概率与后验概率之间发生了变化,这就是条件概率对先验概率的修正。

生活应用

小白学统计(10)——贝叶斯定理(统计在生活中的应用)


下面的例子是医学的常见问题,与现实生活关系紧密。

有一种疾病的发病率是千分之一,医院有一种化验技术可以对这种疾病进行诊断,但是有百分之五的误诊率(也即是说尽管有百分之五的人没有病,但是化验结果却显示为阳性(即假阳性))。现在假设一个人的化验结果显示为有病,仅根据这一化验结果推测,那么这个人确实患病的概率有多大?

这个问题的分析过程如下:

先验概率:

P(患病)=0.001

P(正常)=0.999

条件概率(新信息):

P(准确率)=1.00;准确率(患病者100%被检出)。

P(误诊率)=0.05;误诊率(正常人有5%被误检)。

根据上面的数据,我们就能够推测出一个人化验为阳性的情况下,这个人确实患病的概率(后验概率)为:

P(患病|阳性)=P(患病)×P(准确率)/[(P(患病)×P(准确率)+P(正常)×P(误诊率)]

=0.001×1.00/(0.001×1.00+0.999×0.05)

=0.0198

=2%

结果让你大吃一惊吧,在没有其他症状增加患病概率的情况下,单凭化验结果显示为阳性来推测的话,其真实患病的概率还不到2%。所以对于年度常规体检出现的问题,应该进行复检。

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

发表评论

登录后才能评论

联系我们

如有建议:>>给我留言

QR code