solr 5.0搭建 和使用 ik分词

1.将下载来的solr-5.0.0.zip解压。
创建D:\mysoftsetup\solrserver目录,复制solr-5.0.0\server\solr下所有文件到D:\mysoftsetup\solrserver,
复制Tomcat 到 D:\mysoftsetup\solrserver 目录



把solr-5.0.0\server\webapps\solr.war放到tomcat的webapps目录下;启动tomcat自动解压得到solr文件夹。
把solr-5.0.0\server\lib\ext下所有的jar,复制到刚才得到的solr文件夹下的WEB-INF\lib目录下。
把solr-5.0.0\server\resources\log4j.properties复制到webapps\solr\WEB-INF\classes目录下。
修改webapps\solr\WEB-INF\web.xml的:
   <env-entry>
       <env-entry-name>solr/home</env-entry-name>
       <env-entry-value>../../solr</env-entry-value>
       <env-entry-type>java.lang.String</env-entry-type>
    </env-entry>
指定solr/home为../../solr目录(其实就是:D:\mysoftsetup\solrserver目录中的solr)。

启动tomcat ,访问http://localhost:8393 
查看信息:



建立core
把D:\mysoftsetup\solr-5.0.0\example\techproducts\solr\techproducts 复制到D:\mysoftsetup\solrserver\solr 中,techproducts修改为shop_goods,重新启动tomcat


2.使用ik和smartcn 中文分词
复制 solr-5.0.0\contrib\analysis-extras\lucene-libs 下的jar 到Tomcat 中solr/WEB-INF\lib 中,把附件中ik-analyzer-solr5-5.x.jar 也要复制到Tomcat 中solr/WEB-INF\lib 中
3.修改shop_goods中的schema.xml 中添加ik和smartcn 的配置

<fieldType name="text_smart" class="solr.TextField" positionIncrementGap="100">
          <analyzer type="index">
            <tokenizer class="solr.SmartChineseSentenceTokenizerFactory"/>
            <filter class="solr.SmartChineseWordTokenFilterFactory"/>
          </analyzer>
          <analyzer type="query">
            <tokenizer class="solr.SmartChineseSentenceTokenizerFactory"/>
            <filter class="solr.SmartChineseWordTokenFilterFactory"/>
          </analyzer>
    </fieldType>

<field name="text_smart_ceshi" type="text_smart" indexed="true" stored="true" multiValued="true"/>


<fieldType name="text_ik" class="solr.TextField">  
          <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>  
          <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>  
    </fieldType>

<field name="text_ik_ceshi" type="text_ik" indexed="true" stored="true" multiValued="true"/>


4.重启tomcat测试切词
在左侧选择shop_goods,然后单击“analysis”




测试ik 分词:在Analyse Fieldname / FieldType 中选择“text_ik”,效果如图:






测试smark-cn 分词:在Analyse Fieldname / FieldType 中选择“text_smart”,效果如图:



shop_goods.rar 为配置好的core

猜你喜欢

转载自gjp014.iteye.com/blog/2405084