Solr6.3 集成pinyin4j 分词插件 - 代码天地

Solr6.3 集成pinyin4j 分词插件

其他 2020-03-29 19:44:04 阅读次数: 0

1、前期准备，需要用到pinyin4j-2.5.0.jar、pinyin4j-analyzers-4.3.1.jar这两个jar包

2、将pinyin4j-2.5.0.jar、pinyin4j-analyzers-4.3.1.jar这两个jar包复制到apache-tomcat-8.0.47-windows-x64\apache-tomcat-8.0.47\webapps\solr\WEB-INF\lib目录下。

3、在 C:\solr_config\fileInfo\conf\ managed-schema文件</schema>前增加如下配置：

<!-- ik分词 + pingying4j分词 -->
	<fieldType name="text" class="solr.TextField">
		<analyzer type="index">
			<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" isMaxWordLength="false" useSmart="false" conf="ik.conf"/>
			<filter class="solr.LowerCaseFilterFactory" />
			<filter class="com.shentong.search.analyzers.PinyinTransformTokenFilterFactory" minTermLenght="2" />
			<filter class="com.shentong.search.analyzers.PinyinNGramTokenFilterFactory" minGram="1" maxGram="20" /> 
		</analyzer>
		<analyzer type="query">
			<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
			<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" isMaxWordLength="false" useSmart="false" conf="ik.conf"/>  
			<filter class="solr.LowerCaseFilterFactory" />
		</analyzer>  
	</fieldType>

重启tomcat查看拼音检索效果。

在奋斗的大道

发布了1266 篇原创文章 · 获赞 275 · 访问量 290万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/zhouzhiwengang/article/details/103514471

Solr6.3 集成pinyin4j 分词插件

solr6.6配置IK中文分词、IK扩展词、同义词、pinyin4j拼音分词

pinyin4j工具类--把汉字转为拼音的插件

jquery OCUpload一键上传插件和pinyin4J使用

pinyin4j

java 支持分词的高性能拼音转换工具，速度是 pinyin4j 的两倍

单机版solr6.3和分布式solr6.3的安装部署

pinyin4j使用

pinyin4j 的应用

pinyin4j的用法

Pinyin4j实战

pinyin4j的使用

Pinyin4j bug

pinyin4j的是使用

Elasticsearch插件（二）：pinyin分词

Solr6.3 生产环境使用(Centos6.5)

pinyin4j的基本使用

pinyin4j 内存溢出

Pinyin4j入门教程

Pinyin4j的基本用法

pinyin4j的基础使用

Pinyin4J使用方法

pinyin4j汉字转拼音

Pinyin4j简单使用教程

pinyin4j工具类

PinYin4j库的使用

pinyin4j汉字以及pinyin之间转换

Java通过pinyin4j实现汉字转拼音

通过pinyin4j将汉字转换为拼音

Java汉字转拼音库，Pinyin4j

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)