Elasticsearch核心技术与实战学习笔记第四章 24 | 基于词项和基于全文的搜索

一序

本文属于极客时间Elasticsearch核心技术与实战学习笔记系列。从本节开始，学习进入深入阶段。本节主要学习基于term 的查询与全文本查询的区别。

二基于term 查询

Term Level Query：Term Query / Range Query / Exists Query / Prefix Query / Wildcard Query
在 ES 中，Term 查询，对输入不做分词。会将输入作为一个整体，在倒排索引中查找准确的词项，并且使用相关度算分公式为每个包含该词项的文档进行相关度算分 - 例如 “Apple Store”
可以通过 Constant Score 将查询转换换成一个 Filtering，避免算分，并利用缓存，提交性能

demo

插入数据

DELETE products
PUT products
{
  "settings": {
    "number_of_shards": 1
  }
}


POST /products/_bulk
{ "index": { "_id": 1 }}
{ "productID" : "XHDK-A-1293-#fJ3","desc":"iPhone" }
{ "index": { "_id": 2 }}
{ "productID" : "KDKE-B-9947-#kL5","desc":"iPad" }
{ "index": { "_id": 3 }}
{ "productID" : "JODL-X-1937-#pV7","desc":"MBP" }

查询: iPhone ，term 查询不到。

改为小写iphone. 能查到。因为post写入数据的过程中，把大写字母改为小写。上面term 查询是精准查询。

针对ID查询：// 无结果

es对输入做标准输入，会拆分

//如果对值进行查询

POST /products/_search
{
"query": {
"term": {
"productID.keyword": {
"value": "XHDK-A-1293-#fJ3"
}
}
}
}

term查询还是会返回算分结果的。

将 Query 转成 Filter，忽略 TF-IDF 计算，避免相关性算分的开销
Filter 可以有效利用缓存

三基于全文本的查询

基于全文本的查找

Match Query / Match Phrase Query / Query String Query

特点

索引和搜索时会进行分词，查询字符串先传递到一个合适的分词器，然后生成一个供查询的词项列表
查询时候，先会对输入的查询进行分词。然后每个词项逐个进行底层的查询，最终将结果进行合并。并未每个文档生成一个算分。例如查 “Martix reloaded”, 会查到包括 Matrix 或者 reload 的所有结果。

查询过程

基于全文本的查找

Match Query / Match Phrase Query / Query String Query

基于全文本的查询的特点

索引和搜索时都会进行分词，查询字符串先传递到一个合适的分词器，然后生成一个供查询的词项列表
查询会对每个词项逐个进行底层的查询，再将结果进行合并，并未每个文档生成一个算分

demo:

PUT groups
{
  "mappings": {
    "properties": {
      "names":{
        "type": "text",
        "position_increment_gap": 0
      }
    }
  }
}

GET groups/_mapping

POST groups/_doc
{
  "names": [ "John Water", "Water Smith"]
}

POST groups/_search
{
  "query": {
    "match_phrase": {
      "names": {
        "query": "Water Water",
        "slop": 100
      }
    }
  }
}

Elasticsearch核心技术与实战学习笔记第四章 24 | 基于词项和基于全文的搜索

一序

二基于term 查询

demo

三基于全文本的查询

查询过程

demo:

总结

猜你喜欢

Elasticsearch核心技术与实战学习笔记 第四章 24 | 基于词项和基于全文的搜索

一 序

二 基于term 查询

demo

三 基于全文本的查询

查询过程

demo:

总结

猜你喜欢

Elasticsearch核心技术与实战学习笔记第四章 24 | 基于词项和基于全文的搜索

一序

二基于term 查询

三基于全文本的查询