机器学习中几个重要的指标

TP：True Positive，预测结果为正类，且与事实相符，即事实为正类。

·TN：True Negative，预测结果为负类，且与事实相符，即事实为负类。

·FP：False Positive，预测结果为正类，但与事实不符，即事实为负类。

·FN：False Negative，预测结果为负类，但与事实不符，即事实为正类。

有了结果分类，就可以计算指标了。常用的指标有三个，第一个为准确率（Accuracy），表达式如下：

分母中四个类都有，也就是表示所有结果。分子是TP+TN，TP表示模型猜对了，TN也表示模型猜对了，两个加起来就是全部猜对了的结果。因此，准确率的含义是模型猜对了的结果在全部结果中的占比，猜对的越多，得分就越高。

第二个为精确率（Precision），又叫查准率，光看名字很容易与第一个指标混淆，最好的区别方法是看表达式。查准率的表达式如下：

表达式上的区别就很明显了，光是在长度上就短了很多。此表达式的分母是TP+FP，TP表示预测结果为正类，FP也表示预测结果为正类，二者相加就是全部预测为正类的结果。分子是TP，代表预测为正类，且与事实相符的结果。说起来很拗口，但只要联合起来看，分母说的是所有预测为正类的结果，分子说的是正类结果中猜对了的那部分，它在全部的正类结果中的占比就是查准率。换句话说，模型预测对正类结果的预测越准确，查准率就越高。

第三个为召回率（Recall），又叫查全率，是查准率的“表兄弟”。要求“不可滥杀无辜”时，看查准率；要求“宁可杀错一千也不放过一个”时，看查全率。查全率的表达式如下：

这俩表兄弟经常联合起来使用，因为分子都是TP，但查全率的分母是TP+FN，换了右半边，意思也不一样了。TP表示事实为正类，FN也表示事实为正类，两者相加表示全部事实是正类的结果。整个表达式的意思是，在全部正类中，看看模型能正确找出来多少，找出来的越多，查全率就越高。

jackyrongvip

发布了3527 篇原创文章 · 获赞 128 · 访问量 258万+

他的留言板关注

机器学习中几个重要的指标

猜你喜欢