ElasticSearch text和keyword数据类型的区别

正经学徒,佛系记录,不搞事情

2.*的版本,字符串类型为string

5.*之后的版本,字符串类型区分为keyword和text,设置string字段会提示为过时类型

最大的区别在于:

  • keyword:存储数据时不会分词建立索引,常用于对文档进行过滤、排序、聚合的操作
  • text:存储数据会自动分词,并生成索引,用于全文索引的字段

由此两种类型的对应使用场景就不同了,这里创建一个person索引,新增两个字段str_keywordstr_text,类型分别对应keywordtext

添加一条记录

判断两个字段的分词情况

可见keyword未被分词,而text被分词成just、test

所以进行term查询时,str_keyword将查询不到记录,因为被分词成just、test

另一个方面,进行聚合查询时,keyword可以直接执行,且效率更高,而text聚合时需要特定的给字段启用Fielddata,而启用Fielddata将会导致消耗大量堆空间,更多关于 Fielddata 可点击查看。

添加数据进行聚合测试:

keyword类型可直接聚合

text类型无法直接聚合

提示“Fielddata is disabled on text fields by defaul”,“Fielddata默认禁用”,需要手动设置启用

再次进行查询时查询成功

注:虽然能够通过设置fielddata让text类型也支持聚合、排序等操作,但是尽量避免使用该方式。

推荐做法:

  1. 将需要排序、聚合的字段类型设置为keyword类型。
  2. 如果该字段一定需要text类型来作全文检索,则添加一个类型为keyword的新字段与之对应,单独用于作聚合、排序操作

猜你喜欢

转载自blog.csdn.net/qq_31748587/article/details/86220884