(1)TF是词频(Term Frequency)
词频是文档中词出现的概率。
(2) IDF是逆向文件频率(Inverse Document Frequency)
包含词条的文档越少,IDF越大。
扫描二维码关注公众号,回复:
16018979 查看本文章
(1)TF是词频(Term Frequency)
词频是文档中词出现的概率。
(2) IDF是逆向文件频率(Inverse Document Frequency)
包含词条的文档越少,IDF越大。