大数据中的一些名词

  • TF(Term Frequency)
    表示某个关键词在整篇文章中出现的频率。

  • IDF(InversDocument Frequency)
    表示计算倒文本频率。文本频率是指某个关键词在整个语料所有文章中出现的次数。倒文档频率又称为逆文档频率,它是文档频率的倒数,主要用于降低所有文档中一些常见却对文档影响不大的词语的作用。

猜你喜欢

转载自blog.csdn.net/m0_37664906/article/details/80816125
今日推荐