机器学习的一些性能评价指标

分类

1.精确率,准确率,召回率,F1-score。

  • TP(True postive),真正的正样本,实际为正,预测为正。
  • FP(False positive), 假的正样本,实际为负,预测为正。
  • TN(True negative),真的负样本,实际为负,预测为负。
  • FN(False negative),假的负样本,实际为正,预测为负。
  • 精确率:正确预测的样本/总样本 = (TP + TN) / (TP + TN + FP + FN)
  • 准确率:相对于预测而言,TP/(TP + FP),预测为正的有多少是真的正样本。
  • 召回率:相对于真实而言,TP/(TP + FN),真正的正样本有多少被预测为正了。
  • F1-score:准确率和召回率的调和平均值。

2.ROC曲线:(越靠近左上角越好)

  • 横坐标:FPR,负样本被错判为正样本的概率。FP/(TN+FP)
  • 纵坐标:TPR,正样本被判为正样本的概率。TP/(TP+FN)
  • 特殊点:

(0, 1),负样本都没被错判,正样本都被判为正样本,最好。

(1, 0),负样本都被错判,正样本都没被判为正样本,最差。

(0, 0),负样本都没被错判,正样本都被判为负样本,就是都判为负样本了。

(1, 1),负样本都被判正,正样本都被判为正样本,就是都判为正样本了。

3.AUC:ROC与X轴围成的面积,最好为1,最差为0,随机预测为0.5。其实不会低于0.5,因为低于0.5反着预测就好了。

4.gini系数:ROC与y=x围成的面积,越大越好。换算为2auc - 1。

回归

  1. MAE。平均绝对误差,L1范数损失。预测值-真实值的绝对值平均。
  2. MSE。平均平方误差,L2范数损失。预测值-真实值的平方值平均。

猜你喜欢

转载自blog.csdn.net/silent_crown/article/details/84841037