ROC
优点:尽管正负样本的分布发生改变,曲线的形状基本不变。
坐标越往左上越好,因为 预测正样本的负样本越少,预测为正样本的正样本越多。
作用:评价分类的指标,经常作为二值分类器的重要指标之一。
**横坐标假阳性率:FPR = FP/N,纵坐标真阳性率:TPR=TP/P。**全为负样本,坐标(0,0),全为正样本,坐标(1,1)
都是对正样本进行的,FP指的是N个负样本中被预测为正样本的数目;TP是P个正样本中被预测为正样本的数目。
所以其实,预测为正样本的数目等于 TP + FP
TP(True Positive) FP(False Positive)
ROC曲线的绘制就是通过不断移动分类器的"截断点"来生产曲线上的一组关键点。从最高得分开始,逐渐调整得到最低得分,每一个截断点对应一个TPR和FPR。链接起来就是一条ROC曲线。
举例:当以0.9作为阈值的时候,只有第一个样本被预测为正样本,其他所有样本被预测为负样本,那么真阳性率是0.1,假阳性率是0,所以坐标(0,0.1)。
最终的结论就是越往左上越好,所以ROC曲线下的面积越大越好。
PR曲线-----Recall—Precision
mAP: mean Average Precision, 是多标签图像分类任务中的评价指标。
AP衡量的是学出来的模型在给定类别上的好坏,而mAP衡量的是学出的模型在所有类别上的好坏。
横坐标召回率:正的该类数目由多少预测正确了。
纵坐标精确率:预测正确的总数里,正的该类占了多少。----现在计算哪一类,哪一类就是正的,其他就是负的。
AP 是计算某一类 P-R 曲线下的面积,mAP 则是计算所有类别 P-R 曲线下面积的平均值。