短文本相似度比较

emm。。。补上次第二周的坑,这是第一周的内容,第二周的链接:https://my.oschina.net/DDigimon/blog/1622301

本次GitHub地址:https://github.com/qiangzi11hao/Semantic-Textual-Similarity

直接上图:

输入图片说明 输入图片说明 输入图片说明 输入图片说明 输入图片说明 输入图片说明

总结吧。。。在数据量那么小的数据集上做dl真的是失了智。。。教训吧。。。还不如一堆分类器联合。。。最后一层能不能改成boost勒。。。感觉这样想有点死循环?嗯,什么情况该什么算法还是要搞清楚。不过以前对相似度打分内心小声bb就是不过就是cos余弦值嘛,这次阅读了别人的文献才发现就算余弦值的变化也能做出很大改进。另外,如果只用他提到的相似度评分居然分数一下就是0.79,直接秒掉没有做精细化处理的普通模型了。。。 另外参考论文:http://nlp.arizona.edu/SemEval-2017/pdf/SemEval025.pdf

猜你喜欢

转载自my.oschina.net/DDigimon/blog/1626441