Redis高可用集群

Redis有三种集群模式,分别是:
* 主从模式
* Sentinel模式
* Cluster模式
三种集群模式各有特点,关于Redis介绍可以参考这里:NoSQL(二)——Redis
https://blog.csdn.net/miss1181248983/article/details/82011884
Redis官网:https://redis.io/ ,最新版本5.0.4

1.主从模式
主从模式是三种模式中最简单的,在主从复制中,数据库分为两类:主数据库(master)和从数据库(slave)。
其中主从复制有如下特点:
* 主数据库可以进行读写操作,当读写操作导致数据变化时会自动将数据同步给从数据库
* 从数据库一般都是只读的,并且接收主数据库同步过来的数据
* 一个master可以拥有多个slave,但是一个slave只能对应一个master
* slave挂了不影响其他slave的读和master的读和写,重新启动后会将数据从master同步过来
* master挂了以后,不影响slave的读,但redis不再提供写服务,master重启后redis将重新对外提供写服务
* master挂了以后,不会在slave节点中重新选一个master

工作机制
当slave启动后,主动向master发送SYNC命令。master接收到SYNC命令后在后台保存快照(RDB持久化)和缓存保存快照这段时间的命令,然后将保存的快照文件和缓存的命令发送给slave。slave接收到快照文件和命令后加载快照文件和缓存的执行命令。
复制初始化后,master每次接收到的写命令都会同步发送给slave,保证主从数据一致性。
安全设置:
当master节点设置密码后,
客户端访问master需要密码
启动slave需要密码,在配置文件中配置即可
客户端访问slave不需要密码
缺点:
从上面可以看出,master节点在主从模式中唯一,若master挂掉,则redis无法对外提供写服务。

主从模式搭建
环境准备:
master节点 192.168.92.14
slave节点 192.168.92.16
slave节点 192.168.92.17
全部下载安装:
cd /opt
wget http://download.redis.io/releases/redis-5.0.4.tar.gz
tar zxf redis-5.0.4.tar.gz && mv redis-5.0.4/ /usr/local/redis
cd /usr/local/redis && make && make install
echo $?

--全部配置成服务:
--服务文件
vim /usr/lib/systemd/system/redis.service

[Unit]
Description=Redis persistent key-value database
After=network.target
After=network-online.target
Wants=network-online.target

[Service]
ExecStart=/usr/local/bin/redis-server /usr/local/redis/redis.conf --supervised systemd
ExecStop=/usr/libexec/redis-shutdown
Type=notify
User=redis
Group=redis
RuntimeDirectory=redis
RuntimeDirectoryMode=0755

[Install]
WantedBy=multi-user.target

--shutdown脚本
vim /usr/libexec/redis-shutdown

#!/bin/bash
#
# Wrapper to close properly redis and sentinel
test x"$REDIS_DEBUG" != x && set -x

REDIS_CLI=/usr/local/bin/redis-cli

# Retrieve service name
SERVICE_NAME="$1"
if [ -z "$SERVICE_NAME" ]; then
SERVICE_NAME=redis
fi

# Get the proper config file based on service name
CONFIG_FILE="/usr/local/redis/$SERVICE_NAME.conf"

# Use awk to retrieve host, port from config file
HOST=`awk '/^[[:blank:]]*bind/ { print $2 }' $CONFIG_FILE | tail -n1`
PORT=`awk '/^[[:blank:]]*port/ { print $2 }' $CONFIG_FILE | tail -n1`
PASS=`awk '/^[[:blank:]]*requirepass/ { print $2 }' $CONFIG_FILE | tail -n1`
SOCK=`awk '/^[[:blank:]]*unixsockets/ { print $2 }' $CONFIG_FILE | tail -n1`

# Just in case, use default host, port
HOST=${HOST:-127.0.0.1}
if [ "$SERVICE_NAME" = redis ]; then
PORT=${PORT:-6379}
else
PORT=${PORT:-26739}
fi

# Setup additional parameters
# e.g password-protected redis instances
[ -z "$PASS" ] || ADDITIONAL_PARAMS="-a $PASS"

# shutdown the service properly
if [ -e "$SOCK" ] ; then
$REDIS_CLI -s $SOCK $ADDITIONAL_PARAMS shutdown
else
$REDIS_CLI -h $HOST -p $PORT $ADDITIONAL_PARAMS shutdown
fi

--------------------------------
chmod +x /usr/libexec/redis-shutdown
useradd -s /sbin/nologin redis
chown -R redis:redis /usr/local/redis
mkdir -p /data/redis
chown -R redis:redis /data/redis
yum install -y bash-completion && source /etc/profile #命令补全
systemctl daemon-reload
systemctl enable redis

--修改配置:默认已开启rdb和aof持久化;save为rdb,appendfsync为持久化
/*
save 900 1 #表示900s内发生了1次更改
save 300 10 #表示300s内发生了10次更改
save 60 10000 #表示60s内发生了10000次更改
appendfsync everysec #每秒记录一次
*/
--192.168.92.14
mkdir -p /data/redis
vim /usr/local/redis/redis.conf

#后面跟注释导致配置无法识别
#bind 192.168.92.14 #监听ip,多个ip用空格分隔
#daemonize yes #允许后台启动
#logfile "/usr/local/redis/redis.log" #日志路径
#dir /data/redis #数据库备份文件存放目录
#masterauth 123456 #slave连接master密码,master可省略
#requirepass 123456 #设置master连接密码,slave可省略
#appendonly yes #在/data/redis/目录生成appendonly.aof文件,将每一次写操作请求都追加到appendonly.aof 文件中

bind 192.168.92.14
daemonize yes
logfile "/usr/local/redis/redis.log"
dir /data/redis
masterauth 123456
requirepass 123456
appendonly yes
----------------------------
echo 'vm.overcommit_memory=1' >> /etc/sysctl.conf
sysctl -p

--192.168.92.16
mkdir -p /data/redis
vim /usr/local/redis/redis.conf

bind 192.168.92.16
daemonize yes
logfile "/usr/local/redis/redis.log"
dir /data/redis
replicaof bind 192.168.92.14 6379
masterauth 123456
requirepass 123456
appendonly yes

----
echo 'vm.overcommit_memory=1' >> /etc/sysctl.conf
sysctl -p

--192.168.92.17
mkdir -p /data/redis
vim /usr/local/redis/redis.conf

bind 192.168.92.17
daemonize yes
logfile "/usr/local/redis/redis.log"
dir /data/redis
replicaof 192.168.92.14 6379
masterauth 123456
requirepass 123456
appendonly yes

echo 'vm.overcommit_memory=1' >> /etc/sysctl.conf
sysctl -p

--全部启动redis:
systemctl start redis

--查看集群状态:
redis-cli -h 192.168.92.14 -a 123456
--关注属性 role:master
info replication
redis-cli -h 192.168.92.16 -a 123456 info replication

数据演示:
--192.168.92.14:6379
keys *
set key1 100
set key2 lzx
keys *

redis-cli -h 192.168.92.16 -a 123456
keys *
CONFIG GET dir
CONFIG GET dbfilename
get key1
get key2
--slave节点上无法写入数据。
--(error) READONLY You can't write against a read only replica.
set key3 aaa

redis-cli -h 192.168.92.17 -a 123456
keys *

CONFIG GET dir
CONFIG GET dbfilename
get key1
get key2
--(error) READONLY You can't write against a read only replica.
set key3 aaa

------------------------------------------------------------------
--2.Sentinel模式
Sentinel模式介绍
主从模式的弊端就是不具备高可用性,当master挂掉以后,Redis将不能再对外提供写入操作,因此sentinel应运而生。
sentinel中文含义为哨兵,顾名思义,它的作用就是监控redis集群的运行状况,特点如下:
* sentinel模式是建立在主从模式的基础上,如果只有一个Redis节点,sentinel就没有任何意义
* 当master挂了以后,sentinel会在slave中选择一个做为master,并修改它们的配置文件,其他slave的配置文件也会被修改,比如slaveof属性会指向新的master
* 当master重新启动后,它将不再是master而是做为slave接收新的master的同步数据
* sentinel因为也是一个进程有挂掉的可能,所以sentinel也会启动多个形成一个sentinel集群
* 多sentinel配置的时候,sentinel之间也会自动监控
* 当主从模式配置密码时,sentinel也会同步将配置信息修改到配置文件中,不需要担心
* 一个sentinel或sentinel集群可以管理多个主从Redis,多个sentinel也可以监控同一个redis
* sentinel最好不要和Redis部署在同一台机器,不然Redis的服务器挂了以后,sentinel也挂了
工作机制:
* 每个sentinel以每秒钟一次的频率向它所知的master,slave以及其他sentinel实例发送一个 PING 命令
* 如果一个实例距离最后一次有效回复 PING 命令的时间超过 down-after-milliseconds 选项所指定的值, 则这个实例会被sentinel标记为主观下线。
* 如果一个master被标记为主观下线,则正在监视这个master的所有sentinel要以每秒一次的频率确认master的确进入了主观下线状态
* 当有足够数量的sentinel(大于等于配置文件指定的值)在指定的时间范围内确认master的确进入了主观下线状态, 则master会被标记为客观下线
* 在一般情况下, 每个sentinel会以每 10 秒一次的频率向它已知的所有master,slave发送 INFO 命令
* 当master被sentinel标记为客观下线时,sentinel向下线的master的所有slave发送 INFO 命令的频率会从 10 秒一次改为 1 秒一次
* 若没有足够数量的sentinel同意master已经下线,master的客观下线状态就会被移除;
若master重新向sentinel的 PING 命令返回有效回复,master的主观下线状态就会被移除
当使用sentinel模式的时候,客户端就不要直接连接Redis,而是连接sentinel的ip和port,由sentinel来提供具体的可提供服务的Redis实现,这样当master节点挂掉以后,sentinel就会感知并将新的master节点提供给使用者。

Sentinel模式搭建
环境准备:
master节点 192.168.92.14 sentinel端口:26379
slave节点 192.168.92.16 sentinel端口:26379
slave节点 192.168.92.17 sentinel端口:26379

修改配置:
前面已经下载安装了redis,这里省略,直接修改sentinel配置文件。
--192.168.92.14
mkdir -p /usr/local/redis/sentinel
chown redis:redis /usr/local/redis/sentinel

#dir "/usr/local/redis/sentinel" #sentinel工作目录
#sentinel monitor mymaster 192.168.92.14 6379 2 #判断master失效至少需要2个sentinel同意,建议设置为n/2+1,n为sentinel个数
#sentinel down-after-milliseconds mymaster 30000 #判断master主观下线时间,默认30s

--sentinel monitor mymaster的名称改为mymaster-sentinel,否则error:Duplicated master name.
--应写为修改sentinel monitor mymaster 192.168.92.14 6379 2,否则哨兵机制失效,主节点redis服务关掉后,master切换到了第三个节点
vim /usr/local/redis/sentinel.conf

daemonize yes
logfile "/usr/local/redis/sentinel.log"
dir "/usr/local/redis/sentinel"
sentinel monitor mymaster 192.168.92.14 6379 2
sentinel auth-pass mymaster 123456
sentinel down-after-milliseconds mymaster 30000

这里需要注意,sentinel auth-pass mymaster 123456需要配置在sentinel monitor mymaster 192.168.92.14 6379 2下面,否则启动报错:

/usr/local/bin/redis-sentinel /usr/local/redis/sentinel.conf

*** FATAL CONFIG FILE ERROR ***
Reading the configuration file, at line 104
>>> 'sentinel auth-pass mymaster 123456'
No such master with specified name.

--3个节点全部启动sentinel:
mkdir /usr/local/redis/sentinel && chown -R redis:redis /usr/local/redis
/usr/local/bin/redis-sentinel /usr/local/redis/sentinel.conf

--任一主机查看日志:
tail -f /usr/local/redis/sentinel.log

Sentinel模式下的几个事件:
· +reset-master :主服务器已被重置。
· +slave :一个新的从服务器已经被 Sentinel 识别并关联。
· +failover-state-reconf-slaves :故障转移状态切换到了 reconf-slaves 状态。
· +failover-detected :另一个 Sentinel 开始了一次故障转移操作,或者一个从服务器转换成了主服务器。
· +slave-reconf-sent :领头(leader)的 Sentinel 向实例发送了 [SLAVEOF](/commands/slaveof.html) 命令,为实例设置新的主服务器。
· +slave-reconf-inprog :实例正在将自己设置为指定主服务器的从服务器,但相应的同步过程仍未完成。
· +slave-reconf-done :从服务器已经成功完成对新主服务器的同步。
· -dup-sentinel :对给定主服务器进行监视的一个或多个 Sentinel 已经因为重复出现而被移除 —— 当 Sentinel 实例重启的时候,就会出现这种情况。
· +sentinel :一个监视给定主服务器的新 Sentinel 已经被识别并添加。
· +sdown :给定的实例现在处于主观下线状态。
· -sdown :给定的实例已经不再处于主观下线状态。
· +odown :给定的实例现在处于客观下线状态。
· -odown :给定的实例已经不再处于客观下线状态。
· +new-epoch :当前的纪元(epoch)已经被更新。
· +try-failover :一个新的故障迁移操作正在执行中,等待被大多数 Sentinel 选中(waiting to be elected by the majority)。
· +elected-leader :赢得指定纪元的选举,可以进行故障迁移操作了。
· +failover-state-select-slave :故障转移操作现在处于 select-slave 状态 —— Sentinel 正在寻找可以升级为主服务器的从服务器。
· no-good-slave :Sentinel 操作未能找到适合进行升级的从服务器。Sentinel 会在一段时间之后再次尝试寻找合适的从服务器来进行升级,又或者直接放弃执行故障转移操作。
· selected-slave :Sentinel 顺利找到适合进行升级的从服务器。
· failover-state-send-slaveof-noone :Sentinel 正在将指定的从服务器升级为主服务器,等待升级功能完成。
· failover-end-for-timeout :故障转移因为超时而中止,不过最终所有从服务器都会开始复制新的主服务器(slaves will eventually be configured to replicate with the new master anyway)。
· failover-end :故障转移操作顺利完成。所有从服务器都开始复制新的主服务器了。
· +switch-master :配置变更,主服务器的 IP 和地址已经改变。 这是绝大多数外部用户都关心的信息。
· +tilt :进入 tilt 模式。
· -tilt :退出 tilt 模式。

--master宕机演示:
--192.168.30.128
systemctl stop redis
tail -f /usr/local/redis/sentinel.log

--从日志中可以看到,master已经从192.168.30.128转移到192.168.30.129上
--192.168.30.129上查看集群信息
/usr/local/bin/redis-cli -h 192.168.92.14 -p 6379 -a 123456
info replication
set key4 linux

当前集群中只有一个slave——192.168.30.130,master是192.168.30.129,且192.168.30.129具有写权限。
192.168.30.130上查看redis的配置文件也可以看到replicaof 192.168.30.129 6379,这是sentinel在选举master时做的修改。

--重新把192.168.30.128上进程启动
systemctl start redis
tail -f /usr/local/redis/sentinel.log

--查看集群信息
/usr/local/bin/redis-cli -h 192.168.30.128 -p 6379 -a 123456
info replication
get key4
set key5

即使192.168.30.128重新启动redis服务,也是作为slave加入redis集群,192.168.30.129仍然是master。

------------------------------------------------------------------------------------------------------------

3.Cluster模式
Cluster模式介绍
sentinel模式基本可以满足一般生产的需求,具备高可用性。但是当数据量过大到一台服务器存放不下的情况时,主从模式或sentinel模式就不能满足需求了,这个时候需要对存储的数据进行分片,将数据存储到多个Redis实例中。cluster模式的出现就是为了解决单机Redis容量有限的问题,将Redis的数据根据一定的规则分配到多台机器。
cluster可以说是sentinel和主从模式的结合体,通过cluster可以实现主从和master重选功能,所以如果配置两个副本三个分片的话,就需要六个Redis实例。因为Redis的数据是根据一定规则分配到cluster的不同机器的,当数据量过大时,可以新增机器进行扩容。
使用集群,只需要将redis配置文件中的cluster-enable配置打开即可。每个集群中至少需要三个主数据库才能正常运行,新增节点非常方便。
cluster集群特点:
* 多个redis节点网络互联,数据共享
* 所有的节点都是一主一从(也可以是一主多从),其中从不提供服务,仅作为备用
* 不支持同时处理多个key(如MSET/MGET),因为redis需要把key均匀分布在各个节点上,
并发量很高的情况下同时创建key-value会降低性能并导致不可预测的行为
* 支持在线增加、删除节点
* 客户端可以连接任何一个主节点进行读写
Cluster模式搭建
环境准备:
三台机器,分别开启两个redis服务(端口)
192.168.92.14 端口:7001,7002
192.168.92.16 端口:7003,7004
192.168.92.17 端口:7005,7006

--修改配置文件:
--192.168.92.14
mkdir /usr/local/redis/cluster
cp /usr/local/redis/redis.conf /usr/local/redis/cluster/redis_7001.conf
cp /usr/local/redis/redis.conf /usr/local/redis/cluster/redis_7002.conf
chown -R redis:redis /usr/local/redis
mkdir -p /data/redis/cluster/{redis_7001,redis_7002} && chown -R redis:redis /data/redis

vim /usr/local/redis/cluster/redis_7001.conf

bind 192.168.92.14
port 7001
daemonize yes
pidfile "/var/run/redis_7001.pid"
logfile "/usr/local/redis/cluster/redis_7001.log"
dir "/data/redis/cluster/redis_7001"
#replicaof 192.168.92.16 6379
masterauth 123456
requirepass 123456
appendonly yes
cluster-enabled yes
cluster-config-file nodes_7001.conf
cluster-node-timeout 15000

vim /usr/local/redis/cluster/redis_7002.conf

bind 192.168.92.14
port 7002
daemonize yes
pidfile "/var/run/redis_7002.pid"
logfile "/usr/local/redis/cluster/redis_7002.log"
dir "/data/redis/cluster/redis_7002"
#replicaof 192.168.92.16 6379
masterauth "123456"
requirepass "123456"
appendonly yes
cluster-enabled yes
cluster-config-file nodes_7002.conf
cluster-node-timeout 15000

其它两台机器配置与192.168.92.14一致,此处省略

启动redis服务:
# redis-server /usr/local/redis/cluster/redis_7001.conf
# tail -f /usr/local/redis/cluster/redis_7001.log
# redis-server /usr/local/redis/cluster/redis_7002.conf
# tail -f /usr/local/redis/cluster/redis_7002.log

其它两台机器启动与192.168.92.14一致,此处省略

安装ruby并创建集群(低版本):
如果redis版本比较低,则需要安装ruby。任选一台机器安装ruby即可

yum -y groupinstall "Development Tools"
yum install -y gdbm-devel libdb4-devel libffi-devel libyaml libyaml-devel ncurses-devel openssl-devel readline-devel tcl-devel
mkdir -p ~/rpmbuild/{BUILD,BUILDROOT,RPMS,SOURCES,SPECS,SRPMS}
wget http://cache.ruby-lang.org/pub/ruby/2.2/ruby-2.2.3.tar.gz -P ~/rpmbuild/SOURCES
wget http://raw.githubusercontent.com/tjinjin/automate-ruby-rpm/master/ruby22x.spec -P ~/rpmbuild/SPECS
rpmbuild -bb ~/rpmbuild/SPECS/ruby22x.spec
rpm -ivh ~/rpmbuild/RPMS/x86_64/ruby-2.2.3-1.el7.x86_64.rpm
gem install redis #目的是安装这个,用于配置集群

cp /usr/local/redis/src/redis-trib.rb /usr/bin/
redis-trib.rb create --replicas 1 192.168.92.14:7001 192.168.92.14:7002 192.168.92.16:7003 192.168.92.16:7004 192.168.92.17:7005 192.168.92.17:7006

创建集群:
我这里是redis5.0.4,所以不需要安装ruby,直接创建集群即可

redis-cli -a 123456 --cluster create 192.168.92.14:7001 192.168.92.14:7002 192.168.92.16:7003 192.168.92.16:7004 192.168.92.17:7005 192.168.92.17:7006 --cluster-replicas 1

--自动生成nodes.conf文件:
ls /data/redis/cluster/redis_7001/
vim /data/redis/cluster/redis_7001/nodes-7001.conf

6788453ee9a8d7f72b1d45a9093838efd0e501f1 192.168.92.17:7005@17005 master - 0 1557454406312 5 connected 10923-16383
277daeb8660d5273b7c3e05c263f861ed5f17b92 192.168.92.17:7006@17006 slave 4d74ec66e898bf09006dac86d4928f9fad81f373 0 1557454407000 6 connected
b4d3eb411a7355d4767c6c23b4df69fa183ef8bc 192.168.92.14:7002@17002 slave 6788453ee9a8d7f72b1d45a9093838efd0e501f1 0 1557454408371 5 connected
80c80a3f3e33872c047a8328ad579b9bea001ad8 192.168.92.14:7001@17001 myself,master - 0 1557454406000 1 connected 0-5460
b6331cbc986794237c83ed2d5c30777c1551546e 192.168.92.16:7004@17004 slave 80c80a3f3e33872c047a8328ad579b9bea001ad8 0 1557454407366 4 connected
4d74ec66e898bf09006dac86d4928f9fad81f373 192.168.92.16:7003@17003 master - 0 1557454407000 3 connected 5461-10922
vars currentEpoch 6 lastVoteEpoch 0

--集群操作 -c,使用集群方式登录
redis-cli -c -h 192.168.92.14 -p 7001 -a 123456
CLUSTER INFO

--列出节点信息:这里与nodes.conf文件内容相同
CLUSTER NODES

--写入数据:cluster集群是去中心化的,每个master节点都是平等的
192.168.92.14:7001> set key111 aaa
192.168.92.17:7005> set key222 bbb
192.168.92.14:7001> set key333 ccc

192.168.92.16:7003> get key111
192.168.92.17:7005> get key333

--增加节点:
--192.168.92.16上增加一节点:
cp /usr/local/redis/cluster/redis_7003.conf /usr/local/redis/cluster/redis_7007.conf
vim /usr/local/redis/cluster/redis_7007.conf

bind 192.168.92.16
port 7007
daemonize yes
pidfile "/var/run/redis_7007.pid"
logfile "/usr/local/redis/cluster/redis_7007.log"
dir "/data/redis/cluster/redis_7007"
#replicaof 192.168.92.16 6379
masterauth "123456"
requirepass "123456"
appendonly yes
cluster-enabled yes
cluster-config-file nodes_7007.conf
cluster-node-timeout 15000

mkdir /data/redis/cluster/redis_7007
chown -R redis:redis /usr/local/redis && chown -R redis:redis /data/redis
redis-server /usr/local/redis/cluster/redis_7007.conf

--192.168.92.17上增加一节点:
cp /usr/local/redis/cluster/redis_7005.conf /usr/local/redis/cluster/redis_7008.conf
vim /usr/local/redis/cluster/redis_7007.conf

bind 192.168.92.17
port 7008
daemonize yes
pidfile "/var/run/redis_7008.pid"
logfile "/usr/local/redis/cluster/redis_7008.log"
dir "/data/redis/cluster/redis_7008"
#replicaof 192.168.92.17 6379
masterauth "123456"
requirepass "123456"
appendonly yes
cluster-enabled yes
cluster-config-file nodes_7008.conf
cluster-node-timeout 15000

mkdir /data/redis/cluster/redis_7008
chown -R redis:redis /usr/local/redis && chown -R redis:redis /data/redis
redis-server /usr/local/redis/cluster/redis_7008.conf

--集群中增加节点:
192.168.92.16:7003> CLUSTER MEET 192.168.92.16 7007
192.168.92.16:7003> CLUSTER NODES

192.168.92.16:7003> CLUSTER MEET 192.168.92.17 7008
192.168.92.16:7003> CLUSTER NODES

--可以看到,新增的节点都是以master身份加入集群的
--更换节点身份:将新增的192.168.92.17:7008节点身份改为192.168.92.16:7007的slave
redis-cli -c -h 192.168.92.17 -p 7008 -a 123456 cluster replicate e51ab166bc0f33026887bcf8eba0dff3d5b0bf14

--cluster replicate 后面跟node_id,更改对应节点身份。也可以登入集群更改
redis-cli -c -h 192.168.92.17 -p 7008 -a 123456
192.168.92.17:7008> CLUSTER REPLICATE e51ab166bc0f33026887bcf8eba0dff3d5b0bf14
192.168.92.17:7008> CLUSTER NODES

--查看相应的nodes.conf文件,可以发现有更改,它记录当前集群的节点信息
# cat /data/redis/cluster/redis_7001/nodes-7001.conf

--删除节点:无法删除登录节点 不能删除自己的master节点
192.168.92.17:7008> CLUSTER FORGET 1a1c7f02fce87530bd5abdfc98df1cffce4f1767
192.168.92.17:7008> CLUSTER FORGET e51ab166bc0f33026887bcf8eba0dff3d5b0bf14
192.168.92.17:7008> CLUSTER FORGET 6788453ee9a8d7f72b1d45a9093838efd0e501f1
192.168.92.17:7008> CLUSTER NODES
192.168.92.17:7008> CLUSTER FORGET b4d3eb411a7355d4767c6c23b4df69fa183ef8bc
192.168.92.17:7008> CLUSTER NODES

--保存配置:将节点配置信息保存到硬盘
192.168.92.17:7008> CLUSTER SAVECONFIG
cat /data/redis/cluster/redis_7001/nodes-7001.conf
# redis-cli -c -h 192.168.92.17 -p 7008 -a 123456
192.168.92.17:7008> CLUSTER NODES

--可以看到,之前删除的节点又恢复了,这是因为对应的配置文件没有删除,执行CLUSTER SAVECONFIG恢复。
--模拟master节点挂掉:
--192.168.92.14
netstat -lntp |grep 7001
tcp 0 0 192.168.92.14:17001 0.0.0.0:* LISTEN 6701/redis-server 1
tcp 0 0 192.168.92.14:7001 0.0.0.0:* LISTEN 6701/redis-server 1

# kill 6701

--对应7001的一行可以看到,master fail,状态为disconnected;而对应7004的一行,slave已经变成master。
192.168.92.17:7008> CLUSTER NODES

--重新启动7001节点:
redis-server /usr/local/redis/cluster/redis_7001.conf

--可以看到,7001节点启动后为slave节点,并且是7004的slave节点。即master节点如果挂掉,它的slave节点变为新master节点继续对外提供服务,
--而原来的master节点如果重启,则变为新master节点的slave节点。
192.168.92.17:7008> CLUSTER NODES

另外,如果这里是拿7007节点做测试的话,会发现7008节点并不会切换,这是因为7007节点上根本没数据。集群数据被分为三份,
采用哈希槽 (hash slot)的方式来分配16384个slot的话,它们三个节点分别承担的slot 区间是:
节点7004覆盖0-5460
节点7003覆盖5461-10922
节点7005覆盖10923-16383

更多参考:
Redis集群常用命令
https://www.cnblogs.com/gossip/p/5993922.html

原文地址:https://www.cnblogs.com/buffercache/p/12618028.html