机器学习中几个重要的指标

TP:True Positive,预测结果为正类,且与事实相符,即事实为正类。

·TN:True Negative,预测结果为负类,且与事实相符,即事实为负类。

·FP:False Positive,预测结果为正类,但与事实不符,即事实为负类。

·FN:False Negative,预测结果为负类,但与事实不符,即事实为正类。

有了结果分类,就可以计算指标了。常用的指标有三个,第一个为准确率(Accuracy),表达式如下:


分母中四个类都有,也就是表示所有结果。分子是TP+TN,TP表示模型猜对了,TN也表示模型猜对了,两个加起来就是全部猜对了的结果。因此,准确率的含义是模型猜对了的结果在全部结果中的占比,猜对的越多,得分就越高。

第二个为精确率(Precision),又叫查准率,光看名字很容易与第一个指标混淆,最好的区别方法是看表达式。查准率的表达式如下:


表达式上的区别就很明显了,光是在长度上就短了很多。此表达式的分母是TP+FP,TP表示预测结果为正类,FP也表示预测结果为正类,二者相加就是全部预测为正类的结果。分子是TP,代表预测为正类,且与事实相符的结果。说起来很拗口,但只要联合起来看,分母说的是所有预测为正类的结果,分子说的是正类结果中猜对了的那部分,它在全部的正类结果中的占比就是查准率。换句话说,模型预测对正类结果的预测越准确,查准率就越高。

第三个为召回率(Recall),又叫查全率,是查准率的“表兄弟”。要求“不可滥杀无辜”时,看查准率;要求“宁可杀错一千也不放过一个”时,看查全率。查全率的表达式如下:


这俩表兄弟经常联合起来使用,因为分子都是TP,但查全率的分母是TP+FN,换了右半边,意思也不一样了。TP表示事实为正类,FN也表示事实为正类,两者相加表示全部事实是正类的结果。整个表达式的意思是,在全部正类中,看看模型能正确找出来多少,找出来的越多,查全率就越高。

发布了3527 篇原创文章 · 获赞 128 · 访问量 258万+

猜你喜欢

转载自blog.csdn.net/jackyrongvip/article/details/103720129