正经学徒,佛系记录,不搞事情
2.*的版本,字符串类型为string
5.*之后的版本,字符串类型区分为keyword和text,设置string字段会提示为过时类型
最大的区别在于:
- keyword:存储数据时不会分词建立索引,常用于对文档进行过滤、排序、聚合的操作
- text:存储数据会自动分词,并生成索引,用于全文索引的字段
由此两种类型的对应使用场景就不同了,这里创建一个person索引,新增两个字段str_keyword,str_text,类型分别对应keyword和text
添加一条记录
判断两个字段的分词情况
可见keyword未被分词,而text被分词成just、test
所以进行term查询时,str_keyword将查询不到记录,因为被分词成just、test
另一个方面,进行聚合查询时,keyword可以直接执行,且效率更高,而text聚合时需要特定的给字段启用Fielddata,而启用Fielddata将会导致消耗大量堆空间,更多关于 Fielddata 可点击查看。
添加数据进行聚合测试:
keyword类型可直接聚合
text类型无法直接聚合
提示“Fielddata is disabled on text fields by defaul”,“Fielddata默认禁用”,需要手动设置启用
再次进行查询时查询成功
注:虽然能够通过设置fielddata让text类型也支持聚合、排序等操作,但是尽量避免使用该方式。
推荐做法:
- 将需要排序、聚合的字段类型设置为keyword类型。
- 如果该字段一定需要text类型来作全文检索,则添加一个类型为keyword的新字段与之对应,单独用于作聚合、排序操作