028 ElasticSearch ---- --- 03 전체 텍스트 검색 기술의 기초 상세

1.IK 토크 나이

(1) 설치

 

중국어 단어의 효과를 얻을 수 있습니다 IK 단어를 사용합니다.
IK의 단어 분리기를 다운로드 : (Github의 주소 : HTTPS : //github.com/medcl/elasticsearch-analysis-ik)


다운로드 지퍼, 압축을 풀고 플러그인 ES의 IK 설치 디렉토리 아래의 디렉토리에 파일을 복사 ( 참고 : 버전 IK가 elasticsearch과 동일해야합니다 )

그런 다음 elasticsearch를 다시 시작합니다 :

워드 시험 결과 :
보내기 : POST 로컬 호스트 : 9200 / _analyze
{ "텍스트", "분석기": "ik_max_word :"봄 구름 전투 테스트 단어를, 콘텐츠 테스트 뒤에 " "}

(2) 두 가지 단어

ik_max_word 및 ik_smart 모드 : IK 단어는 두 개의 하위 워드 모드가 있습니다.
<1> ik_max_word
텍스트가 이루어집니다 최고의 분할 단위를 분할 "중화 인민 공화국, 중국 사람, 중국,"중화 인민 공화국의 그레이트 홀 "입니다 같은
중국 인민 공화국 인민 공화국, 시청 총회, 홀 및 기타 용어.
<2> ik_smart가
할 일 것이다 가장 거친 같은 단위의 해상도를 것입니다 중국의 분할 인민 공화국, 그레이트 홀 "중화 인민 공화국의 그레이트 홀".

(3) 사용자 정의 동의어 사전

당신이 단어가 어떤 독점적 인 단어를 지원하려는 경우, 당신은 동의어 사전을 사용자 정의 할 수 있습니다.
IK의 단어 분리기는 main.dic 파일이 파일 사전 파일이 함께 제공됩니다.

(A my.dic 파일 디렉토리의 상단에 새로운 노트 파일 형식으로 UTF-8 (내장 txt 파일 편집기)를 사용하지 않는, 에디트 플러스 편집 파일을 사용, UTF-8 BOM을 선택하지 않은
: 당신이 단어를 사용자 정의 할 수있는이
같은 정의로 :
구성 파일, my.dic입니다

 

ES, 단어 테스트 결과를 다시 시작
보내기 : POST 로컬 호스트를 : 9200 / _analyze을
{ "텍스트", "분석기": "ik_max_word :"봄 구름 전투 테스트 단어, 콘텐츠 테스트 뒤에 " "}

 

추천

출처www.cnblogs.com/luckyplj/p/11593433.html