小白学统计（9）——贝叶斯定理（概率的修正方法）

贝叶斯定理是用来描述两个条件概率之间关系的定理，比如P(A|B)和P(B|A)，通常，事件A在事件B发生的条件下的概率{P(A|B)}与事件B在事件A的条件下的概率{P(B|A)}是不一样的，但是这两者之间有确定的关系，贝叶斯法则就是这种关系的陈述，按照乘法法则：P(A∩B)=P(A)*P(B|A)=P(B)*P(A|B)，可以立刻导出P(B|A)=P(A|B)*P(B)/P(A)。（回顾概率的基本运算法则，请看上一篇）

贝叶斯法则公式如下：

在贝叶斯法则中，每个名词都有约定俗成的名称：

P(A)是A的先验概率或边缘概率。称为”先验”是因为它不考虑任何B方面的因素。

P(A|B)是已知B发生后A的条件概率，也由于得自B的取值而被称作A的后验概率。

P(B)是B的先验概率或边缘概率。称为”先验”是因为它不考虑任何A方面的因素。

P(B|A)是已知A发生后B的条件概率，也由于得自A的取值而被称作B的后验概率。

贝叶斯定理应用概述：

贝叶斯推断与其他统计学推断方法截然不同，它建立在主观判断的基础上，在不完全情报下，也就是说，你可以不需要客观证据，先估计一个主观概率对部分未知的状态进行描述，然后根据实际结果不断修正，最后再利用期望值和修正概率做出最优决策。

贝叶斯定理应用举例：吸毒者检测

假设一个对吸毒者的常规检测结果的敏感度与可靠度均为99%，也就是说，当被检者吸毒时，每次检测呈阳性（+）的概率为99%。而被检者不吸毒时，每次检测呈阴性（-）的概率为99%。从检测结果的概率来看，检测结果是比较准确的，但是贝叶斯定理却可以揭示一个潜在的问题。假设某公司将对其全体雇员进行一次鸦片吸食情况的检测，已知0.5%的雇员吸毒。我们想知道，每位检测呈阳性的雇员，他吸毒的概率有多高？

令”A”为雇员吸毒事件，”C”为雇员不吸毒事件，”B”为检测呈阳性事件。则：

P(A)代表雇员吸毒的概率，不考虑其他情况，该值为0.5%。（因为公司预先统计表明该公司的雇员中有0.5%的人吸毒，所以这个值就是A的先验概率）

P(C)代表雇员不吸毒的概率，显然，该值为99.5%，也就是1-P(A)。

P(B|A)代表吸毒者阳性检出率，这是一个条件概率，由于阳性检测准确性是99%，因此该值为99%。

P(B|C)代表不吸毒者阳性检出率，也就是出错检测的概率，该值为1%，因为不吸毒者其检测为阴性的概率为99%，因此，其被误检测成阳性的概率为1-99%。

P(B)代表不考虑其他因素影响的阳性检出率。P(B) = 吸毒者阳性检出率（0.5%x99% = 0.495%）+ 不吸毒者阳性检出率（99.5%x1% = 0.995%）= 1.49%，这是检测呈阳性的先验概率。用数学公式描述为：

P(B)=P(A)P(B|A) + P(C)P(B|C)。

根据上述描述，我们要计算的是某位员工检测呈阳性时，这名员工也确实吸毒的条件概率P(A|B)。