golang jieba库 分词搜索

⚪ 有这样一个场景,某36为了推广,需要根据你的兴趣爱好给你发广·告,这个依据就是你在他游览器搜索的内容。比如36接了个广告任务,推广霸王去屑洗发水,用户在百度的时候,直接搜“霸王去屑洗发水”的很少,这时就体现了分词的力量。
⚪36将“霸王去屑洗发水”这个字符串分成“霸王”,“去屑”,“洗发水”,甚至”屑“,”洗发“。当用户搜“如何去屑?”,“洗发水成分是什么”,“洗发水能喝吗”,“霸王别姬”类似的一旦含有以上分词,该用户就被认定为潜在的”发展对象“,这样一定程度上增加了推广的准确性。

下面是Go语言字符串的分词化
1、git clone 大佬王斌的结巴库

git clone "https://github.com/wangbin/jiebago"

2、定义一个分词器对象,绑定规范,这个dict.txt在库里本身存在,我感觉这个文本就是一个划分的例子,然后划分分词都要根据这个例子照葫芦画瓢,我猜的,别被我误导了。这个seg是专门针对汉语的分词结构

var seg jiebago.Segmenter
func init() {
	seg.LoadDictionary("dict.txt")
}

3.调用这个函数,就把你的字符串str划分成了分词数组,返回一个切片

cutchan := seg.CutForSearch(str, true)

4.然后就可以遍历这个切片进行检索了

猜你喜欢

转载自blog.csdn.net/qq_44477844/article/details/107895959