【漫话机器学习系列】191.比值比(Odds Ratio,简称OR)

什么是比值比(Odds Ratio,简称OR)?

比值比(Odds Ratio,简称OR)是统计学和医学研究中非常常见的一个指标,常用于比较两个不同组的事件发生的可能性。
简单来说,比值比就是两个“比值(Odds)”之间的比。


一、先搞清楚什么是“比值(Odds)”

1. 比值的定义

比值(Odds)用来表示某个事件发生的概率和不发生的概率的比值:

举个例子:

  • 某次考试通过的概率是 0.8,不通过的概率是 0.2。
    那么通过的比值就是:

Odds = \frac{0.8}{0.2} = 4

这表示:通过考试的可能性是不通过的 4 倍。


二、再来理解“比值比(Odds Ratio)”

如果我们要比较两个不同的事件或两组人群,比如:

  • 吸烟人群 vs 不吸烟人群

  • 服药组 vs 对照组

我们可以先算出两组的“比值”,再将这两个比值相除,得到“比值比(OR)”。


2.1 比值比的公式

公式是:

OR = \frac{Pr(X_1)/Pr(\sim X_1)}{Pr(X_2)/Pr(\sim X_2)}

解释一下:

  • X_1:第一组(比如吸烟人群)

  • X_2​:第二组(比如不吸烟人群)

  • Pr(X_1):第一组事件发生的概率

  • Pr(\sim X_1):第一组事件不发生的概率

  • Pr(X_2):第二组事件发生的概率

  • Pr(\sim X_2):第二组事件不发生的概率


2.2 如何理解?

OR 值 含义
OR = 1 两组发生事件的可能性相同
OR > 1 第一组比第二组更容易发生事件
OR < 1 第一组比第二组更不容易发生事件

三、举个实际例子

生病 没生病 合计
吸烟者 30 70 100
不吸烟者 10 90 100

计算:

吸烟者的比值:

Odds_1 = \frac{30}{70} = 0.43

不吸烟者的比值:

Odds_2 = \frac{10}{90} = 0.11

比值比(OR):

OR = \frac{0.43}{0.11} \approx 3.9

解释:

→ 吸烟者得病的可能性是不吸烟者的 3.9 倍!


四、总结

核心概念 内容
比值(Odds) 某组中事件发生概率 / 不发生概率
比值比(OR) 两组比值的比
OR的意义 OR>1 → 第一组风险大;OR<1 → 第二组风险大;OR=1 → 风险相同