1. 数据分析网首页
  2. 大数据
  3. 统计学

小白学统计(9)——贝叶斯定理(概率的修正方法)

贝叶斯定理是用来描述两个条件概率之间关系的定理,比如P(A|B)和P(B|A),通常,事件A在事件B发生的条件下的概率{P(A|B)}与事件B在事件A的条件下的概率{P(B|A)}是不一样的,但是这两者之间有确定的关系,贝叶斯法则就是这种关系的陈述,按照乘法法则:P(A∩B)=P(A)*P(B|A)=P(B)*P(A|B),可以立刻导出P(B|A)=P(A|B)*P(B)/P(A)。(回顾概率的基本运算法则,请看上一篇)

贝叶斯法则公式如下:

小白学统计(9)——贝叶斯定理(概率的修正方法)

在贝叶斯法则中,每个名词都有约定俗成的名称:

P(A)是A的先验概率或边缘概率。称为”先验”是因为它不考虑任何B方面的因素。

P(A|B)是已知B发生后A的条件概率,也由于得自B的取值而被称作A的后验概率。

P(B)是B的先验概率或边缘概率。称为”先验”是因为它不考虑任何A方面的因素。

P(B|A)是已知A发生后B的条件概率,也由于得自A的取值而被称作B的后验概率。

贝叶斯定理应用概述:

贝叶斯推断与其他统计学推断方法截然不同,它建立在主观判断的基础上,在不完全情报下,也就是说,你可以不需要客观证据,先估计一个主观概率对部分未知的状态进行描述,然后根据实际结果不断修正,最后再利用期望值和修正概率做出最优决策。

贝叶斯定理应用举例:吸毒者检测

假设一个对吸毒者的常规检测结果的敏感度与可靠度均为99%,也就是说,当被检者吸毒时,每次检测呈阳性(+)的概率为99%。而被检者不吸毒时,每次检测呈阴性(-)的概率为99%。从检测结果的概率来看,检测结果是比较准确的,但是贝叶斯定理却可以揭示一个潜在的问题。假设某公司将对其全体雇员进行一次鸦片吸食情况的检测,已知0.5%的雇员吸毒。我们想知道,每位检测呈阳性的雇员,他吸毒的概率有多高?

令”A”为雇员吸毒事件,”C”为雇员不吸毒事件,”B”为检测呈阳性事件。则:

P(A)代表雇员吸毒的概率,不考虑其他情况,该值为0.5%。(因为公司预先统计表明该公司的雇员中有0.5%的人吸毒,所以这个值就是A的先验概率)

P(C)代表雇员不吸毒的概率,显然,该值为99.5%,也就是1-P(A)。

P(B|A)代表吸毒者阳性检出率,这是一个条件概率,由于阳性检测准确性是99%,因此该值为99%。

P(B|C)代表不吸毒者阳性检出率,也就是出错检测的概率,该值为1%,因为不吸毒者其检测为阴性的概率为99%,因此,其被误检测成阳性的概率为1-99%。

P(B)代表不考虑其他因素影响的阳性检出率。P(B) = 吸毒者阳性检出率(0.5%x99% = 0.495%)+ 不吸毒者阳性检出率(99.5%x1% = 0.995%)= 1.49%,这是检测呈阳性的先验概率。用数学公式描述为:

P(B)=P(A)P(B|A) + P(C)P(B|C)。

根据上述描述,我们要计算的是某位员工检测呈阳性时,这名员工也确实吸毒的条件概率P(A|B)。

小白学统计(9)——贝叶斯定理(概率的修正方法)

从计算结果来看,尽管我们的检测结果可靠性很高,但是只能得出如下结论:如果某人检测呈阳性,那么此人是吸毒的概率只有大约33%,也就是说此人不吸毒的可能性比较大。我们测试的条件(本例中指A,即雇员吸毒)越难发生,发生误判的可能性越大。

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

发表评论

登录后才能评论

联系我们

如有建议:>>给我留言

QR code