召回率准确率

  1. 召回率(Recall Rate,也叫查全率):
    是检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率;

  2. 精度:
    是检索出的相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率。

  3. 准确率:
    是指对一个事物表达或描述的正确程度,用来反映对事物的正确性解答。
    Accuracy = (预测正确的样本数)/(总样本数)=(TP+TN)/(TP+TN+FP+FN)

召回率(Recall)和精度(Precise)是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。
举例说明:
在这里插入图片描述
假定:从一个大规模数据集合中检索文档时,可把文档分成四组:

  • 系统检索到的相关文档(A)
  • 系统检索到的不相关文档(B)
  • 相关但是系统没有检索到的文档(C)
  • 不相关且没有被系统检索到的文档(D)
    则:
  • 召回率R:用实际检索到相关文档数作为分子,所有相关文档总数作为分母,即R = A / ( A + C )
  • 精度P:用实际检索到相关文档数作为分子,所有检索到的文档总数作为分母,即P = A / ( A + B )
    举例来说:
    一个数据库有500个文档,其中有50个文档符合定义。系统检索到75个文档,但是实际只有45个符合定义。则:
    召回率R=45/50=90%
    精度P=45/75=60%

本例中,系统检索是比较有效的,召回率为90%。但是结果有很大的噪音,有近一半的检索结果是不相关。 研究表明:在不牺牲精度的情况下,获得一个高召回率是很困难的。

猜你喜欢

转载自blog.csdn.net/Winnycatty/article/details/82972764
今日推荐