举个例子,假如要在一个地区进行1000人的核酸检测,我们站在上帝视角,知道这1000人中,有10人是新冠感染者,占比1%。
但实际的检测结果可能存在误差,误差包括两种情况
- 新冠感染者,被错误诊断为健康
- 身体健康,但却被错误诊断为感染者
检测结果如下:
- 9名感染者得到了正确的阳性结果(TP,true positive),1人出现假阴性(FN,false negative).
- 其余990位健康的人中,检测除了89为假阳性(FP,false positive).901人得到了正确的阴性结果(TN,true negative)
图形化表示是这个样子的:
列成表格表示如下:
真实情况 | 预测为阳性 | 预测为阴性 | 召回率 |
阳性患者 | 9人(True Positive,TP) | 1人(False Negative,FN) | |
健康人员 | 89人(False Positve, FP) | 901人(True Negative, TN) | |
准确率 |
根据以上的分析,我们总结如下:
- TP、True Positive 真阳性:预测为正,实际也为正
- FP、False Positive 假阳性:预测为正,实际为负
- FN、False Negative 假阴性:预测与负、实际为正
- TN、True Negative 真阴性:预测为负、实际也为负
- 样本总数=TP+FN+FP+TN
- 准确率表示的是在预测结果中,有多少是真正的阳性
- 召回率表示的是在所有的阳性样本中,你究竟找回来几个?猜对了多少?