es第一篇：Getting Started

es是一个近乎实时的搜索平台，这意味着从索引文档到文档可搜索，仅有一点点延迟(通常是1秒)。es集群是一个或多个节点的集合，它们共同保存数据，并提供跨所有节点的联合索引和搜索功能。集群名由cluster.name指定，每个节点名由node.name指定。

通过 get /_cat 可以找出很多实用的命令，使用这些命令时在最后加上?v可以展示数据的含义，如

get /_cat/indices?v 查看所有索引的分片数、副本数、文档数、索引大小

get /_cat/nodes?v 查看集群所有的节点，从返回的结果中可以找出哪一个节点是master

get /_cat/shards/{index}?v 查看某索引各分片文档数、分片大小、所在节点ip

还有其他很多实用的命令，不再一个个列举，用的时候从里面找即可。

Search API

根据搜索参数放的位置不同，有两种搜索方式：一种是把参数放到request uri上，另一种是使用request body

其中第一种比较少用，本文仅提供一个例子，不做详细介绍

示例：

get /bank/_doc/_search?q=*&sort=age:asc,balance:asc&from=10&size=3

第二种方式比较常用，使用起来也比较简单，把搜索参数以json格式放到请求体中

get /bank/_doc/_search

{
"query": {
"match_all": {}
},
"sort": {
"age": "asc",
"balance": "desc"
},
"from": 10,
"size": 3
}

from表示跳过几个文档，为0时表示一个都不跳过，从头开始取。

如果只想返回特定的字段，比如age、balance，则命令是

get /bank/_doc/_search
{
"query": {
"match_all": {}
},
"_source": ["balance", "age"]
}

如果想取balance=49355的文档，则要用match关键字替换match_all，命令是

get /bank/_doc/_search
{
"query": {
"match": {
"balance": "49355"
}
}
}

取address包含"mill"单词的文档，命令是

get /bank/_doc/_search
{
"query": {
"match": {
"address": "mill"
}
}
}

实际上，结果中不仅有address包含"mill"单词的文档，还有address包含“Mill”单词的文档。这是因为es在索引文档时会把所有字母都转为小写，在搜索时也会把搜索参数中的字母转为小写，这样，即使用mill或者MILL搜索，都会返回address包含"mill"、"MILL"等凡是这四个字母组成的单词的文档。

取address包含"mill"或"lane"的文档，命令是

get /bank/_doc/_search
{
"query": {
"match": {
"address": "mill lane"
}
}
}

取address包含"mill lane"短语的文档，命令是：

get /bank/_doc/_search
{
"query":{
"match_phrase": {
"address": "mill lane"
}
}
}

注意这里用了match_phrase替代之前的match，phrase的意思就是短语。

上面命令query下面一级直接是match_all、match或match_phrase，这仅适用于单条件搜索。想要多条件搜索的话，需要用bool query，表现形式是query下面一级是bool，bool下面一级是must数组或者should数组或者must_not数组，数组里面才是多个match或者match_phrse。其中must数组是既。。又。。的意思，should数组是或。。或。。的意思，must_not数组是既不。。又不。。的意思。没有shoud_not。

取address包含"mill"单词且age=28的文档，命令是

get /bank/_doc/_search
{
"query": {
"bool": {
"must": [{
"match": {
"address": "mill"
}
}, {
"match": {
"age": 38
}
}]
}
}
}

取address包含"mill"单词或者age=28的文档，命令是

get /bank/_doc/_search
{
"query": {
"bool": {
"should": [{
"match": {
"address": "mill"
}
}, {
"match": {
"age": "28"
}
}]
}
}
}

取address不包含"mill"单词且age!=28的文档，命令是

get /bank/_doc/_search
{
"query": {
"bool": {
"must_not": [{
"match": {
"address": "mill"
}
}, {
"match": {
"age": 28
}
}]
}
}
}

也可以在bool中混合使用must数组、should数组、must_not数组。注意，should数组与must数组或是must_not数组一起使用的话，必须把should数组放在must数组中，即should数组是must数组的一个元素，且should数组用bool包裹。

取age=39，且firstname是Virginia或者lastname是Ayala的文档，命令是

get /bank/_doc/_search
{
"query": {
"bool": {
"must": [{
"match": {
"age": 39
}
}, {
"bool": {
"should": [{
"match": {
"firstname": "Virginia"
}
}, {
"match": {
"lastname": "Ayala"
}
}]
}
}]
}
}
}

大于、小于的筛选搜索

bool query除了must、should、must_not外，还支持filter数组，相当于sql中的大于(等于)、小于(等于)，用于数字或日期过滤。filter数组里面元素的key是range，值是个json对象，对象的key是筛选字段。

取state=MA且余额在(8000,10000)、年龄在[20,30]的文档，命令是

get /bank/_doc/_search
{
"query": {
"bool": {
"must": [{
"match": {
"state": "MA"
}
}],
"filter": [{
"range": {
"balance": {
"gt": 8000,
"lt": 10000
}
}
}, {
"range": {
"age": {
"gte": 20,
"lte": 30
}
}
}]
}
}
}

聚合

根据state字段分组，并根据文档数量大小倒序取前10，命令是

get /bank/_search
{
"size": 0,
"aggs": {
"group_by_state": {
"terms": {
"field": "state.keyword",
"size": 3
}
}
}
}