ubuntu全文检索系统coreseek(sphinx+中文分词)安装笔记

参考官网http://www.coreseek.cn/products-install/install_on_bsd_linux/

下载coreseek:coreseek 3.2.14
$ wget http://www.coreseek.cn/uploads/csft/3.2/coreseek-3.2.14.tar.gz

解包

$ tar xzvf coreseek-3.2.14.tar.gz
$ cd coreseek-3.2.14

安装coreseek需要预装的软件:

$ sudo apt-get install gcc g++ automake libtool mysql-client libmysqlclient15-dev libxml2-dev libexpat1-dev

注意:sphinx需要mysql的支持,安装mysql请参考http://rocken.iteye.com/admin/blogs/933296

检查系统环境是否为中文环境

$ locale

本机的环境是:

LANG=zh_CN.UTF-8
LANGUAGE=zh_CN:zh
LC_CTYPE="zh_CN.UTF-8"
LC_NUMERIC="zh_CN.UTF-8"
LC_TIME="zh_CN.UTF-8"
LC_COLLATE="zh_CN.UTF-8"
LC_MONETARY="zh_CN.UTF-8"
LC_MESSAGES="zh_CN.UTF-8"
LC_PAPER="zh_CN.UTF-8"
LC_NAME="zh_CN.UTF-8"
LC_ADDRESS="zh_CN.UTF-8"
LC_TELEPHONE="zh_CN.UTF-8"
LC_MEASUREMENT="zh_CN.UTF-8"
LC_IDENTIFICATION="zh_CN.UTF-8"

切换到root用户

$ sudo su


安装mmseg到目录/usr/local/mmseg3
$ cd mmseg-3.2.14
$ ./bootstrap    #提示中如无error可以不用理会
$ ./configure --prefix=/usr/local/mmseg3
$ make && make install

安装完成后做个中文分词测试

$ /usr/local/mmseg3/bin/mmseg -d /usr/local/mmseg3/etc src/t1.txt

-----------------------------

显示结果如下:

中文/x 分/x 词/x 测试/x
中国人/x 上海市/x

Word Splite took: 0 ms.

-----------------------------
$ cd ..

安装coreseek到目录/usr/local/coreseek,需提前安装mysql及操作系统基础开发库以支持mysql数据源和xml数据源
$ cd csft-3.2.14
$ sh buildconf.sh    #提示中如无error可以不用理会
$ ./configure --prefix=/usr/local/coreseek  --without-unixodbc --with-mmseg --with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg3/lib/ --with-mysql
$ make && make install
$ cd ..

测试mmseg分词,coreseek搜索(基础环境仅支持xml数据源)
$ cd testpack
$ cat var/test/test.xml    #此时应该正确显示中文
$ /usr/local/mmseg3/bin/mmseg -d /usr/local/mmseg3/etc var/test/test.xml
$ /usr/local/coreseek/bin/indexer -c etc/csft.conf --all


$ /usr/local/coreseek/bin/search -c etc/csft.conf 网络搜索

$ /usr/local/coreseek/bin/searchd -c etc/csft.conf
以下为正常开启搜索服务时的提示信息:
Coreseek Fulltext 3.2 [ Sphinx 0.9.9-release (r2117)]
Copyright (c) 2007-2011,
Beijing Choice Software Technologies Inc (http://www.coreseek.com)

using config file 'etc/csft.conf'...
listening on all interfaces, port=9312
如要停止搜索服务,请使用

$ /usr/local/coreseek/bin/searchd -c etc/csft.conf --stop
如要已启动服务,要更新索引,请使用

$ /usr/local/coreseek/bin/indexer -c etc/csft.conf --all --rotate

猜你喜欢

转载自rocken.iteye.com/blog/934642