1.提取关键词(TD-IDF,TextRank,Gensim,glove)
2.余弦相似度(jieba分词+word2vec+pooling+cosine)
3.编辑距离
4.simHash和海明距离(原理:http://www.cnblogs.com/maybe2030/p/5203186.html)
5.TS-SS(三角-扇面相似度实现:https://github.com/taki0112/Vector_Similarity)
6.jaccard相似度(介绍:https://blog.csdn.net/u012836354/article/details/79103099)
7.wmd,欧式距离、余弦相似度、最长字串匹配、曼哈顿距离等,要得到一个词向量平均,
8.DSSM,VSM