java——lucene实现全文检索（二）建立索引时分词器的选择

其他 2019-03-05 21:17:51 阅读次数: 0

一篇比较完整的分词器比较文章：Lucene的各中文分词比较

StandardAnalyzer ：

Lucene自带的标准分析器

效果为一元分词

为了实现单字检索选择了该分词器

IKAnalyzer：

提供两种分词模式：细粒度分词和智能分词

按词拆分能够较好的分为词

但是高版本lucene与 IKAnalyzer 冲突会报错

Exception in thread "main" java.lang.AbstractMethodError: org.apache.lucene.analysis.Analyzer.createComponents(Ljava/lang/String;)Lorg/apache/lucene/analysis/Analyzer$TokenStreamComponents;

需要自己集成

集成方式见IKAnalyze中文分词器集成

因为需求为单字到多字甚至整句都能检索到结果所以放弃了按词拆分的分词器

选择一元分词的StandardAnalyzer 与PhraseQuery 短语查询搭配检索

猜你喜欢

转载自blog.csdn.net/yilia_jia/article/details/86627867

java——lucene实现全文检索（二）建立索引时分词器的选择

全文检索Lucene框架---分词器

java——lucene实现全文检索（一）建立索引

Net Core使用Lucene.Net和盘古分词器实现全文检索

全文检索---分词器

javaEE Lucene，全文检索，站内搜索，入门程序。索引库的添加，IKAnalyzer(中文分词器)

java——lucene实现全文检索（四）索引检索

Lucene7.0与HanLP分词器整合索引数据库建立索引文件

全文检索引擎ElasticSearch：文档管理、集成IK分词器

Lucene JAVA全文检索引擎

Lucene分词器

搜索引擎系列三：Lucene分词器详解、实现自己的一个分词器

Lucene全文检索（二）

Lucene实现全文检索

Lucene系列三：Lucene分词器详解、实现自己的一个分词器

Java全文检索(Lucene)

【全文搜索引擎】Elasticsearch之分词器

Lucene搜索引擎-分词器

lucene创建索引 IKAnalyzer中文分词器案列

Lucene索引库维护、搜索、中文分词器

Lucene全文检索引擎

Lucene全文检索_索引创建

【Lucene】Apache Lucene全文检索引擎架构之中文分词和高亮显示

Lucene的内置的分词器

lucene 中文分词器

Lucene Analyzer(分词器)

lucene之分词器

lucene的分词器宝典

Lucene: 中文分词器

Lucene:Ansj分词器

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)