【Elasticsearch】搜索小记之 match VS match_phrase

  最近稍微研究了一下ElasticSearch(下文简称ES),所谓可扩展的开源弹性搜索解决方案,跟同事笑称,如果它作为SQL SERVER的话,我的了解还在基本的select语句上,当然学习它也是一个积累知识的过程,闲言少叙,书归正传,今天简单将里面中的基础的两个查询总结一下,有不对的地方欢迎各位指出。

  刚刚接触ES的时候,发现他的搜索确实很快,不像SQL Server 的like查询,他还能通过解析用户搜索的词汇,通过相关系数(score)都给你查出来,当然SQLServer 也有全文搜索,这个暂且不提。先举个例子:我想搜索 包含“美国哈佛大学”的title。match语句如下:

 1 {
 2   "fields": [
 3     "title"
 4   ],
 5   "query": {
 6     "match": {
 7       "title": "美国哈佛大学"
 8     }
 9   },
10   "size": 100
11 }

返回结果:

很明显,“美国哈佛大学”六个字,它做了分词:["美国","哈佛","大学"](当然可能更详细),然后得到的结果是2964条,也就是说,包含这几个关键字的有这么多,那么我在换上 match_phrase搜索,语句如下:

 1 {
 2   "fields": [
 3     "title"
 4   ],
 5   "query": {
 6     "match_phrase": {
 7       "title": {
 8         "query": "美国哈佛大学",
 9         "slop": 0
10       }
11     }
12   },
13   "size": 100
14 }

结果:

看就两条数据。所以,想用什么搜索方式还是看需求吧。

原文地址:https://www.cnblogs.com/panzi/p/elasticsearch.html