NLP中文分词C++实现

https://github.com/myazi/NLP

NLP

主要实现以下几个算法,以分词为任务,语料库为标准语料库PKU,MSR

1 朴素贝叶斯

2 最大匹配 中文分词

3 N-gram模型

4 隐马尔科夫模型

5 隐马尔科夫(最大似然估计)中文分词

6 最大熵马尔科夫模型

7 W条件随机场 中文分词

WCRF在msr上分词F1值达95.7%

猜你喜欢

转载自blog.csdn.net/u010865478/article/details/80597798
今日推荐