全文检索技术—Solr

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/chuan129/article/details/80099292

前言:
solr是一个现成的全文检索引擎系统, 放入tomcat下可以独立运行, 对外通过http协议提供全文检索服务(就是对索引和文档的增删改查服务),企业中可以通过solrJ(solr的客户端的jar包)来调用solr服务。
这里写图片描述

Solr与Lucene的区别:
lucene是一个全文检索引擎工具包, 就是一堆jar包, 它放入tomcat下不能独立运行, 但是我们可以使用lucene来构建全文检索引擎系统;
solr底层是用lucene来开发的一个全文检索引擎系统, 放入tomcat下就可以独立运行, 对外通过http的形式,提供全文检索服务(索引和文档的增删改查服务).

一、Solr安装及配置:
Solr官方网站(http://lucene.apache.org/solr/ )下载Solr4.10.3,Linux下需要下载lucene-4.10.3.tgz,windows下需要下载lucene-4.10.3.zip。

整合步骤
这里写图片描述
这里写图片描述
这里写图片描述
Solr域的类型:

    基本类型:string, long, double等等
    动态域(dynamicField): 因为域要先定义后使用,对于没有定义的域,使用是会报错的, 所以可以使用动态域模糊匹配域名.
    主键域(uniquekey): 主键域只有一个, 唯一
    复制域(copyField): 将多个域中的内容复制到目标域, 从目标域中查询就相当于从多个域中进行查询

二、集成IK中文分词器:
这里写图片描述
schema.xml设置Field
这里写图片描述
三、数据导入到solr

第一步:把dataimport插件依赖的jar包添加到solrcore(solrHome\collection1\lib)中
这里写图片描述
第二步:配置solrconfig.mxl文件,添加一个requestHandler。
这里写图片描述
第三步:创建一个data-config.xml,保存到collection1\conf\目录下
这里写图片描述
第四步:重启tomcat
这里写图片描述

solr中索引和文档的增加和删除:
首先根据id来查询,如果在现有的文档库和索引库中查不到则,将这条数据添加进索引库和文档库;
若根据id查找到了,则把查找到的删除, 然后将新的数据添加到索引库和文档库。
这里写图片描述
这里写图片描述

SolrJ管理索引库:
Solrj是访问Solr服务的java客户端,提供索引和搜索的请求方法,SolrJ通常在嵌入在业务系统中,通过SolrJ的API接口操作Solr服务.
这里写图片描述
使用步骤:
这里写图片描述

猜你喜欢

转载自blog.csdn.net/chuan129/article/details/80099292