文章

贝叶斯公式

贝叶斯公式如何计算条件概率

贝叶斯公式

本次我们来学习贝叶斯公式,这个公式和全概率公式互为“相反”的“运算”

什么是贝叶斯公式

贝叶斯公式是概率论中的一个核心定理,它描述了在已知一些条件下,某事件的发生概率。它的主要作用是,利用已知的“结果”(证据)来反推“原因”的概率。

公式如下:

\[P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}\]

公式中各个部分的含义:

  • $P(A|B)$ (后验概率):在事件B发生的情况下,事件A发生的概率。这是我们希望求得的结果。
  • $P(B|A)$ (似然概率):在事件A发生的情况下,事件B发生的概率。这通常是基于历史数据或经验可以得到的。
  • $P(A)$ (先验概率):在没有任何其他信息的情况下,事件A本身发生的概率。
  • $P(B)$ :在没有任何其他信息的情况下,事件B本身发生的概率。

贝叶斯公式的核心思想

贝叶斯公式的核心思想是:通过新的证据来更新我们对某件事的信念(概率)

先验概率 P(A) 是我们开始时的信念,当我们获得了新的证据 B 后,我们就可以计算出更新后的信念,即 后验概率 P(A|B)

常见示例:医疗诊断

问题背景: 假设有一种罕见疾病,在总人口中的发病率是 1%。现在有一种检测方法,其准确率如下:

  1. 如果一个人真的患病,检测结果为阳性的概率是 99%
  2. 如果一个人未患病,检测结果为阳性(即误报)的概率是 5%

现在,有一个人去做了检测,结果是阳性。请问,他真正患有这种疾病的概率是多少?

使用贝叶斯公式求解:

我们先把问题中的事件定义清楚:

  • 事件A:这个人患有该疾病。
  • 事件B:这个人的检测结果为阳性

我们的目标是求 $P(A|B)$,即“在检测结果为阳性的情况下,他确实患病的概率”。

根据已知条件,我们可以得到以下概率:

  1. $P(A)$ (先验概率):一个人患病的概率,即发病率。 $P(A) = 1\% = 0.01$ 因此,不患病的概率 $P(\neg A) = 1 - 0.01 = 0.99$。

  2. $P(B|A)$ (似然):如果一个人患病,检测为阳性的概率。 $P(B|A) = 99\% = 0.99$

  3. $P(B|\neg A)$:如果一个人不患病,检测为阳性的概率(误报率)。 $P(B|\neg A) = 5\% = 0.05$

接下来,我们套用贝叶斯公式:

\[P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}\]

这里的 $P(B)$ 是“检测结果为阳性”的总概率,它包含两种情况:

  • 情况一:这个人真的患病,并且检测为阳性 ($P(B|A) \cdot P(A)$)
  • 情况二:这个人没有患病,但是被误报为阳性 ($P(B|\neg A) \cdot P(\neg A)$)

所以,$P(B) = P(B|A)P(A) + P(B|\neg A)P(\neg A)$ $P(B) = (0.99 \times 0.01) + (0.05 \times 0.99)$ $P(B) = 0.0099 + 0.0495 = 0.0594$

现在我们有了所有需要的值,可以计算最终结果了:

\[P(A|B) = \frac{0.99 \times 0.01}{0.0594} = \frac{0.0099}{0.0594} \approx 0.1667\]

结论: 即使检测结果为阳性,这个人真正患病的概率也只有大约 16.7%

这个结果可能与直觉相悖(因为检测的准确率看起来很高),但它恰恰展示了贝叶斯公式的威力。由于该疾病本身非常罕见(先验概率很低),大部分的阳性结果实际上是由大量的健康人群中的小比例误报贡献的。

本文由作者按照 CC BY 4.0 进行授权