Elasticsearch--集群管理_再平衡&预热

控制集群的再平衡

默认情况下,Elasticsearch视图把分片和副本在集群中均衡分布。大多数情况下是好的,但有时候想人为控制此行为。

再平衡

再平衡是在集群的不同节点之间移动分片的过程。

集群的就绪

索引由分片和副本构成。主分片用于新文档被编入索引以及更新或删除,或者索引发生任何变化时。副本从主分片获取数据。

当主分片都被分配到集群中的节点上,也就达到了黄色状态,集群就已经就绪,可以对外提供服务,此时Elasticsearch会初始化副本。

集群再平衡设置

Elasticsearch允许控制再平衡过程,通过设置elasticsearch.yml文件中的几个属性,或使用Elasticsearch REST API。

控制再平衡何时开始

cluster.routing.allocation.allow_rebalance

该属性的取值:

  • always:表名再平衡可以在需要时随时开始
  • indices_primaries_active:所有主分片都初始化后,再平衡才会开始。
  • indices_all_active:默认设置,所有分片和副本都初始化后,再平衡才会开始。

控制同时在节点移动的分片数量

cluster.routing.allocation.cluster_concurrent_rebalance

指定整个集群中同时可以在节点间移动的分片数量。如果集群由很多节点组成,可以提高这个值。默认值2。

控制单个节点上同时初始化的分片数量

cluster.routing.allocation.node_concurrent_recoveries

设置Elasticsearch在单个节点上一次可以初始化多少分片。分片还原过程是非常耗I/O的,默认是2.

控制单个节点上同时初始化的主分片数量

cluster.routing.allocation.node_initial_primaries_recoveries

控制分配的分片类型

cluster.routing.allocation.enable

控制允许分配哪种类型的分片。取值如下:

  • all:默认值,所有类型的分片都可以被分配
  • primaries:只分配主分片,不要分配副本
  • new_primaries:只分配新创建的主分片
  • none:完成禁用了分片的分配

控制单个节点上的并发流数目

indices.recovery.concurrent_streams

允许控制一个节点上一次可以打开多少流,以便从目标分片中恢复一个分片。默认值是3。

控制分片和副本的分配

显式控制分配

  1. 指定节点参数
    假设希望把更强大的编号为1和2的节点放置在一个叫zone_one的区域,编号3和4的节点资源较少,放在叫zone_two的区域。
  2. 配置
    在节点1和节点2的elasticsearch.yml配置文件中添加node.zone: zone_one属性。在节点3和节点4的elasticsearch.yml文件中添加类似的node.zone:zone_two。
  3. 索引的创建
    现在创建shop索引。放在更强的节点:

curl -XPUT 'http://localhost:9200/shop' -d'{
"setting":{
"index":{
"routing.allocation.include.zone":"zone_one"
}
}
}'

意味着希望把shop索引放到node.zone属性等于zone_one的节点。

promotions索引应该放在所有节点,命令如下:

curl -XPOST 'http://localhost:9200/promotions'
curl -XPUT 'http://localhost:9200/promotions/_settings' -d'{
"setting":{
"index":{
"routing.allocation.include.zone":"zone_one, zone_two"
}
}
}'

第一个命令创建索引,第二个命令更新index.routing.allocation.include.zone属性的值。

  1. 排除节点的分配
  2. 节点需求属性
    指定分片必须匹配某种规则才能分配到给定节点上。

index.routing.allocation.require

curl -XPOST 'http://localhost:9200/promotions/_settings' -d'{
"index.routing.allocation.require.size":"big_node",
"index.routing.allocation.require.zone":"zone_one"
}'

Elasticsearch将只会把promotions索引分片分配到node.size属性等于big_node且node.zone属性等于zone_one的节点上。

  1. 使用IP地址分配分片
    使用IP地址来指定应该包含排除哪些节点用来做分片和副本的分配。
  2. 基于磁盘的分片分配
    允许基于节点的磁盘使用情况来设置分配规则,因此不会有耗尽磁盘空间或类似的问题。
  • 启动基于磁盘的分片分配:基于磁盘的分片分配默认是禁用的。可以设置cluster.routing.allocation.disk.threshold_enabled属性为true来启用。
  • 配置基于磁盘的分片分配

    第二和第三个属性值也可以是一个绝对值。

集群范围的分配


希望把所有新索引都放置在IP地址为10.1.2.10和10.1.2.11的节点上。

每个节点上的分片和副本数量

指定单一节点上为单一索引最多可以放置多少分片

curl -XPOST 'localhost:9200/shop/_settings' -d'{
"index.routing.allocation.total_shards_per_node":1
}'

该属性可以放在配置文件中。

手动移动分片和副本

使用Elasticsearch的_cluste/reroute REST端点。
有以下可用的操作:

  • 把分片从一个节点移动到另一个节点
  • 取消分片的分配
  • 强制分片的分配

移动分片


move命令允许移动由index属性指定的索引分片和副本。shard属性是要移动的分片的编号。最后,from_node属性指定从哪个节点上移动分片。

取消分片分配


上述命令将取消es_node_one节点上shop索引编号为0的分片分配。

强制分片的分配

分配一个未分配的分片到指定节点上。

预热

Elasticsearch允许为类型和索引定义预热查询。

定义一个新的预热查询

预热查询和其他查询类似,只是它存储在Elasticsearch一个特殊的名为_warmer的索引中。

把上述查询存储为library索引的预热查询,执行以下命令:

上述命令将注册一个名为tags_warming_query的预热查询。一个索引可以有多个预热查询,但是名字唯一。

添加一个预热查询后,Elasticsearch允许一个新段执行搜索之前,会在那个段上执行定义的预热查询。允许elasticsearch和操作系统缓存数据,以此来加快搜索。

获取定义的预热查询



删除一个预热查询

禁用预热功能

查询的选择

通常选择执行起来昂贵和需要填充缓存的查询需要预热。如:基于索引中的字段做切面和排序,父子查询,常用的过滤器查询。也可以通过日志查找不尽人意的查询。


注意:过多的预热查询,也会影响Elasticsearch的性能

原文地址:https://www.cnblogs.com/51zone/p/9868433.html