ElasticSearch : 基础

#新建索引以及类型:
PUT http://10.18.43.3:9200/test
{
    "settings": {
        "number_of_shards": 3,
        "number_of_replicas": 0
    },
    "mappings": {
        "type1": {
            "properties": {
                "id": {
                    "type": "long"
                    },
                "ukey": {
                    "type": "keyword"
                },
                "startid": {
                    "type": "long"
                },
                "title": {
                    "type": "text"
                },
                "fetch_time": {
                    "type": "date",
                    "format": "yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis"
                }
            }
        }
    }
}
keyword类型的字段是不可切分的,text可以分词

#插入数据: PUT http://10.18.43.3:9200/test/type1/1
{
    "key": value,
    "key2": value2
}
,如果需要自动生成id,需要把方法改成POST,然后把url改成http://10.18.43.3:9200/test/type1

#更新数据
POST http://10.18.43.3:9200/test222/type1/1/_update
{
    "doc": {
        "content":"更新content2"
    }

}
更新数据需要用POST方法而且后面要加_update,更新的字段要包含在 doc 字段里面

#删除数据
DELETE http://10.18.43.3:9200/test/type1/1

#删除索引
DELETE http://10.18.43.3:9200/test

#简单查询
GET http://10.18.43.3:9200/test/type1/1

#条件查询
POST http://10.18.43.3:9200/test/_search
{
    "query": {
        "match_all": {}
    },
    "from": 1,
    "size": 2
}
from 是从哪一行开始,size 是查询显示多少条

POST http://10.18.43.3:9200/test/_search
{
    "query": {
        "match": {
            "html_snapshot": "医生"
        }
    },
    "sort": [
        {
            "id": {
                "order": "desc"
            }
        }    
    ]
}
查询所有html_snapshot包含"医生"的数据,类似于模糊查询(查询html_snapshot包含"医生"的数据),需要注意这个模糊匹配会把查询条件再次分词,如
条件为"html_snapshot": "医生和护士"的话,那么很可能会分成"医生","护士"两个词来分别匹配,如果需要像SQL那样 %xxx%这种形式的模糊匹配的话,
那么需要把 "match"改为"match_phrase",这样如果匹配"医生和护士",那么会匹配里面包含 xxx医生和护士xxxx 这种类型的数据
这儿html_snapshot是text类型,如果是keyword类型的话查询结果是精确查询的结果(查询html_snapshot等于"医生"的数据)
按照id降序排列

POST http://10.18.43.3:9200/test/_search
{
    "query": {
        "query_string": {
            "query": "(非常感谢 AND 医院) OR 医生",
            "fields": ["html_snapshot", "content"]
        }
    }
}
查询多个字段,这样查询也是会先自动分词然后进行匹配

POST http://10.18.43.3:9200/test/_search
{
    "query": {
        "term": {
            "startid": 2
        }
    }
}
精确查询 startid == 2

POST http://10.18.43.3:9200/test/_search
{
    "query": {
        "range": {
            "startid": {
                "gte": 2,
                "lte": 3
            }
        }
    }
}
startid 大于等于2,小于等于3的数据

POST http://10.18.43.3:9200/test/_search
{
    "query": {
        "bool": {
            "must": [
                {
                    "match": {
                        "startid": 2
                    }
                },
                {
                    "match": {
                        "html_snapshot": "客气"
                    }
                }
            ]
        }
    }
}
查询 startid必须为2(因为是keyword类型) 和 html_snapshot必须包含(text类型)"客气" 的所有数据

#聚合查询
POST http://10.18.43.3:9200/test/_search
{
    "aggs": {
        "group_by_startid": {
            "terms": {
                "field": "startid",
                "size": 3
            }
        }
    }
}
根据startid统计所有数据count,返回统计结果前3的聚合数据,size是显示3条聚合数据
可以同时统计多组聚合信息

POST http://10.18.43.3:9200/test/_search
{
    "aggs": {
        "group_by_startid": {
            "stats": {
                "field": "startid"
            }
        }
    }
}
stats是计算聚合关键字,里面有startid的总数,最大值最小值平均值总和等数据

##Elasticsearch 使用bool 子句来将各种子查询关联起来，组成布尔表达式，bool 子句可以随意组合、嵌套。

bool子句主要包括：

must：表示必须匹配。
must_not：表示一定不能匹配。
should：表示可以匹配，类似于布尔运算里的”或”。如果bool 子句里，没有must子句，那么，should子句里至少匹配一个，如果有must子句，那么，should子句至少匹配零个。可以使用minimum_should_match 来对最小匹配数进行设置。

====================================ES的快照备份查询与恢复===========================================

索引的快照过程是增量的。在创建索引快照的过程中，ElasticSearch会分析仓库中已经存在的索引文件，只拷贝那些在最后一次快照之后被创建或者更新的文件。That allows multiple snapshots to be preserved in the repository in a compact form. 快照过程以非阻塞的方式执行，所有的索引和搜索操作都可以对正在被创建快照的索引继续执行。一个快照表示的是这个索引在快照被创建时间点的索引视图，所以在索引过程开始之后被添加到索引中的记录不会出现在快照中。
(参考 https://blog.csdn.net/ale2012/article/details/82702128#_126)

需要先在elasticsearch.yml中加入  path.repo: /usr/local/backups 这个配置来配置备份文件夹 文件夹权限要设置为777

1. 创建快照仓库, 名字为all_backup
http://10.1.1.112:9200/_snapshot/all_backup   PUT
{
  "type": "fs",
  "settings": {
    "location": "/usr/local/backups/all_backup"
  }
}

2. 备份快照,快照名字v2019-7-2
http://10.1.1.112:9200/_snapshot/all_backup/v2019-7-2?wait_for_completion=true    PUT

如果只需要备份某几个索引可以加上:

{
"indices": "article"
}




3. 查询快照
http://10.1.1.112:9200/_snapshot/all_backup/*   GET

4. 恢复快照
http://10.1.1.112:9200/_snapshot/all_backup/v2019-7-2/_restore   POST