从"整形美容哪家里好"的百度快照分词说说百度词库

今天偶然间发现一个十分有意思的情况,在百度搜索"整形美容哪家里好"这个关键词,然后把排第一页的几个网站快照打开都看了一下,不看不知道,一看吓一跳,下面开始说说到底有趣在哪里.
本来这个词应该是搜索"整形美容哪里好"或者"整形美容哪家好",为了表示区分,看看百度的反应情况,就特意加了一个"里"字,也就是成了我们的关键词:"整形美容哪家里好".
来看看第一页几个网站的快照情况:

"整形美容哪家里好"排名第一的百形网整形www.100xing.com:



下面是排名第二的网站www.gzzhengxingyiyuan.com:



"整形美容哪家里好"排名第三的网站:



"整形美容哪家里好"排名第四的网站:



"整形美容哪家里好"排名第五的网站:



通过以上五幅图片,不知道大家发现没有,颜色不同,而且分词的位置也大不相同.
排名第一的,分词情况是:整形美容哪家|里好,基本上是按照最长词优先的原则;
排名第二的网站www.gzzhengxingyiyuan.com分词情况是:整形美容|哪家|里好,应该是按照核心关键词整形美容来切分,剩下的按照普通词属性切分;
排名第三网站情况是:和上面www.gzzhengxingyiyuan.com情况一样,不做分析;
排名第四的网站:整形美容|哪家|里|好,和上面的非常相似,不过后面的里好分开了.这确实不算是一个词;
排名第五的网站:和第二第三一样,不作分析.

通过上述简单的分析,得出一个个人认为比较正确的结论:
用户在搜索的时候,按照长词切分的话,能检索到更精确的结果,返回最少最有效的结果,降低用户的筛选难度;由此可见百度确实实践了用户至上,用户体验第一的诺言;

百度为什么要这样分词呢?第一个网站里出现了 整形美容哪家 这个词,且只出现了一次,别的网站没有出现吗?答案是肯定的,确实没有出现 整形美容哪家 这个成串的词.

我们能从这个案例中了解到什么呢?留待广大读者各抒己见,我相信,评论的力量是伟大的,群众的力量是不竭的.

猜你喜欢

转载自tuzwu.iteye.com/blog/1260300