短文本相似度(词向量)

1.提取关键词(TD-IDF,TextRank,Gensim,glove)

2.余弦相似度(jieba分词+word2vec+pooling+cosine)

3.编辑距离

4.simHash和海明距离(原理:http://www.cnblogs.com/maybe2030/p/5203186.html)

5.TS-SS(三角-扇面相似度实现:https://github.com/taki0112/Vector_Similarity

6.jaccard相似度(介绍:https://blog.csdn.net/u012836354/article/details/79103099)

7.wmd,欧式距离、余弦相似度、最长字串匹配、曼哈顿距离等,要得到一个词向量平均,

8.DSSM,VSM

猜你喜欢

转载自blog.csdn.net/rensihui/article/details/82416085
今日推荐