solr(二)分词

        配置好了solr环境 (查看 solr环境搭建), 就可以加入solr中文分词,其步骤如下:

             1) 下载IK中文分词

                  http://ik-analyzer.googlecode.com/files/IK%20Analyzer%202012FF_hf1.zip

              2)将解压后的stopword.dic,IKAnalyzer.cfg.xml,IKAnalyzer2012FF_u1.jar加入tomcat webapp中相关solr实例的lib文件夹下(WEB-INF中的lib)。

              3)修改 ${catalina_home}\solr_config\solr\collection1\conf\schema.xml文件,在<types></types>标签中添加分词器.

<fieldType name="text_ik" class="solr.TextField">
  <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
  <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

             4)添加完成后,要设定一个字段运用这个分词器,就暂定为name字段吧,还是在这个xml中的顶上处修改一下,将以前的text_general改成text_ik。

<!-- <field name="name" type="text_general" indexed="true" stored="true"/>-->
<field name="name" type="text_ik" indexed="true" stored="true"/>

  5)重启tomcat,打开solr,选择collection1,并点击Analysis,在右边的页面上如下图设置,可看到相关的分词信息。

   

 

             

猜你喜欢

转载自extrimlycold20070206121610.iteye.com/blog/1841422