一、Redis集群简介
Redis Cluster是一个无中心的结构,每个节点都保存数据和整个群集的状态。每个节点都会保存其他节点的信息,知道其他节点所负责的槽,并且会与其他节点定时发送心跳信息,能够及时感知群集中异常的节点。
Redis没有统一的路口,当客户端向群集中任一节点发送与数据库键有关的命令时,接受命令的节点会计算出命令要处理的数据库键属于哪个槽,并检查这个槽是否指派给了自己。如果键所在的槽正好指派给了当前节点,那么节点直接执行这个命令;如果键所在的槽并没有指派给当前节点,那么节点会向客户端返回一个MOVED错误,指引客户端转向(redirect)正确的节点,并再次发送之前想要执行的命令。
二、Redis集群概述
2.1、Redis集群介绍
1、Redis集群是一个提供在多个Redis间节点间共享数据的程序集
2、Redis集群并不支持处理多个keys的命令,因为这需要在不同的节点间移动数据,从而达不到像Redis那样的性能,在高负载的情况下可能会导致不可预料的错误
3、Redis集群通过分区来提供一定程度的可用性,在实际环境中当某个节点宕机或者不可达的情况下可继续处理命令
2.2、Redis集群的优势
1、自动分割数据到不同的节点上
2、整个集群的部分节点失败或者不可达的情况下能够继续处理命令
2.3、Redis集群的实现方法
1、有客户端分片
2、代理分片
3、服务器端分片
2.4、Redis-Cluster数据分片
1、Redis集群没有使用一致性hash,而是引入了哈希槽概念
2、Redis集群有16384个哈希槽
3、每个key通过CRC16校验后对16384取余来决定放置槽
4、集群的每个节点负责一部分哈希槽
Redis 集群中内置了 16384 个哈希槽,当需要在 Redis 集群中放置一个 key-value
时,redis 先对 key 使用 crc16 算法算出一个结果,然后把结果对 16384 求余数,
这样每个 key 都会对应一个编号在 0-16383 之间的哈希槽,redis 会根据节点数量大
致均等的将哈希槽映射到不同的节点。
5、数据分片
以3个节点组成的集群为例
节点A包含0到5500号哈希槽
节点B包含5501到11000号哈希槽
节点C包含11001到16384号哈希槽
支持添加或者删除节点
添加/删除节点无需停止服务(支持热状态)
例如:
如果想新添加个节点D,需要移动节点A,B,C中的部分槽到D上
如果想移除节点A,需要将A中的槽移到B和C节点上,再将没有任何槽的A节点从集群中移除
2.5、Redis-Cluster的主从复制模型
1、集群中具有A,B,C三个节点,如果节点B失败了,整个集群就会因缺少5501-11000这个范围的槽而不可用
2、为每个节点添加一个从节点A1,B1,C1,整个集群便有三个master节点和三个slave节点组成,在节点B失败后,集群便会选举B1为新的主节点继续服务
3、当B和B1都失败后,集群将不可用
三、搭建Redis集群
3.1、案例环境
VMware虚拟机;6台Linux服务器安装Centos 7.6系统
master1 20.0.0.10:6379 | slave1 20.0.0.40:6379 |
---|---|
master2 20.0.0.20:6379 | slave2 20.0.0.50:6379 |
master3 20.0.0.30:6379 | slave3 20.0.0.60:6379 |
3.2、实验步骤
3.3、在所有服务器上安装redis,只在master1上进行演示,其他安装全部相同操作
[root@master1 ~]# tar zxf redis-5.0.7.tar.gz [root@master1 ~]# cd redis-5.0.7/ [root@master1 redis-5.0.7]# make -j2 [root@master1 redis-5.0.7]# make PREFIX=/usr/local/redis install [root@master1 redis-5.0.7]# ln -s /usr/local/redis/bin/* /usr/local/bin/ [root@master1 redis-5.0.7]# cd utils/ [root@master1 utils]# ./install_server.sh Welcome to the redis service installer This script will help you easily set up a running redis server Please select the redis port for this instance: [6379] Selecting default: 6379 Please select the redis config file name [/etc/redis/6379.conf] Selected default - /etc/redis/6379.conf Please select the redis log file name [/var/log/redis_6379.log] Selected default - /var/log/redis_6379.log Please select the data directory for this instance [/var/lib/redis/6379] Selected default - /var/lib/redis/6379 Please select the redis executable path [/usr/local/bin/redis-server] Selected config: Port : 6379 Config file : /etc/redis/6379.conf Log file : /var/log/redis_6379.log Data dir : /var/lib/redis/6379 Executable : /usr/local/bin/redis-server Cli Executable : /usr/local/bin/redis-cli Is this ok? Then press ENTER to go on or Ctrl-C to abort. Copied /tmp/6379.conf => /etc/init.d/redis_6379 Installing service... Successfully added to chkconfig! Successfully added to runlevels 345! Starting Redis server... Installation successful!
3.4、修改配置文件
只在master1上演示,其他修改只区分每台机器的ip,其他都相同
[root@localhost utils]# vi /etc/redis/6379.conf bind 20.0.0.10 #删除原来的127.0.0.1,改成自己的IP cluster-enabled yes #前面的注释去掉,开启群集功能 appendonly yes #开启AOF持久化 cluster-config-file nodes-6379.conf #前面的注释去掉,群集名称文件设置 cluster-node-timeout 15000 #前面的注释去掉,群集超时时间 cluster-require-full-coverage no #前面的注释去掉,把yes改成no appendonly yes ###开启aof持久化 daemonize yes ###以独立进程启动 protected-mode no ###关闭保护模式
3.5、开启redis服务
在所有服务器都需要开始,只在master1上演示,其他开启方式相同
[root@master1 utils]# /etc/init.d/redis_6379 restart Stopping ... Waiting for Redis to shutdown ... Redis stopped Starting Redis server... [root@master1 utils]# netstat -anpt | grep 6379 tcp 0 0 20.0.0.10:6379 0.0.0.0:* LISTEN 18943/redis-server tcp 0 0 20.0.0.10:16379 0.0.0.0:* LISTEN 18943/redis-server
3.6、在master1上使用脚本创建集群
gem是ruby写的软件包。rubygems是用来打包、下载、安装、使用gem软件包的工具。要搭建集群的话,需要使用一个工具(脚本文件),这个工具在redis解压文件的源代码里。因为这个工具是一个ruby脚本文件,所以这个工具的运行需要ruby的运行环境,就相当于java语言的运行需要在jvm上。所以需要安装ruby。
0 [root@master1 utils]# yum -y install ruby rubygems 1 [root@master1 utils]# cd 2 [root@master1 ~]# gem install redis-3.2.0.gem 3 Successfully installed redis-3.2.0 4 Parsing documentation for redis-3.2.0 5 Installing ri documentation for redis-3.2.0 6 1 gem installed 7 [root@master1 ~]# cd redis-5.0.7/src/ 8 [root@master1 src]# redis-cli --cluster create --cluster-replicas 1 20.0.0.10:6379 20.0.0.20:6379 20.0.0.30:6379 20.0.0.40:6379 20.0.0.50:6379 20.0.0.60:6379 9 >>> Performing hash slots allocation on 6 nodes... 10 Master[0] -> Slots 0 - 5460 11 Master[1] -> Slots 5461 - 10922 12 Master[2] -> Slots 10923 - 16383 13 Adding replica 20.0.0.50:6379 to 20.0.0.10:6379 14 Adding replica 20.0.0.60:6379 to 20.0.0.20:6379 15 Adding replica 20.0.0.40:6379 to 20.0.0.30:6379 16 M: 7ae810725eb6ff5d3c8b222dff08bed993f7738f 20.0.0.10:6379 17 slots:[0-5460] (5461 slots) master 18 M: 0229fcffb856fac03854aebcc053ff4115a8b248 20.0.0.20:6379 19 slots:[5461-10922] (5462 slots) master 20 M: d29fc5dcf1765ff01adc89aae5ec27131d05d311 20.0.0.30:6379 21 slots:[10923-16383] (5461 slots) master 22 S: bb00f5e1da389a397580abdeec8bfab15cf2b404 20.0.0.40:6379 23 replicates d29fc5dcf1765ff01adc89aae5ec27131d05d311 24 S: f1843f0b57222c396f8c72acbbe5a31bffdfe790 20.0.0.50:6379 25 replicates 7ae810725eb6ff5d3c8b222dff08bed993f7738f 26 S: 7316d95a643a9ffd439e37d248ff354c69cdea0b 20.0.0.60:6379 27 replicates 0229fcffb856fac03854aebcc053ff4115a8b248 28 Can I set the above configuration? (type 'yes' to accept): yes #输入yes 29 >>> Nodes configuration updated 30 >>> Assign a different config epoch to each node 31 >>> Sending CLUSTER MEET messages to join the cluster 32 Waiting for the cluster to join 33 .... 34 >>> Performing Cluster Check (using node 20.0.0.10:6379) 35 M: 7ae810725eb6ff5d3c8b222dff08bed993f7738f 20.0.0.10:6379 36 slots:[0-5460] (5461 slots) master 37 1 additional replica(s) 38 M: 0229fcffb856fac03854aebcc053ff4115a8b248 20.0.0.20:6379 39 slots:[5461-10922] (5462 slots) master 40 1 additional replica(s) 41 M: d29fc5dcf1765ff01adc89aae5ec27131d05d311 20.0.0.30:6379 42 slots:[10923-16383] (5461 slots) master 43 1 additional replica(s) 44 S: 7316d95a643a9ffd439e37d248ff354c69cdea0b 20.0.0.60:6379 45 slots: (0 slots) slave 46 replicates 0229fcffb856fac03854aebcc053ff4115a8b248 47 S: f1843f0b57222c396f8c72acbbe5a31bffdfe790 20.0.0.50:6379 48 slots: (0 slots) slave 49 replicates 7ae810725eb6ff5d3c8b222dff08bed993f7738f 50 S: bb00f5e1da389a397580abdeec8bfab15cf2b404 20.0.0.40:6379 51 slots: (0 slots) slave 52 replicates d29fc5dcf1765ff01adc89aae5ec27131d05d311 53 [OK] All nodes agree about slots configuration. 54 >>> Check for open slots... 55 >>> Check slots coverage... 56 [OK] All 16384 slots covered.
3.7、测试
[root@master1 src]# redis-cli -h 20.0.0.10 -p 6379 -c 20.0.0.10:6379> set centos 7.6 OK 20.0.0.10:6379> quit [root@master1 src]# redis-cli -h 20.0.0.20 -p 6379 -c 20.0.0.20:6379> get centos -> Redirected to slot [467] located at 20.0.0.10:6379 "7.6" 20.0.0.10:6379> quit [root@master1 src]# redis-cli -h 20.0.0.50 -p 6379 -c 20.0.0.50:6379> get centos -> Redirected to slot [467] located at 20.0.0.10:6379 "7.6" 20.0.0.10:6379> cluster info #查看集群状态 cluster_state:ok cluster_slots_assigned:16384 cluster_slots_ok:16384 cluster_slots_pfail:0 cluster_slots_fail:0 cluster_known_nodes:6 cluster_size:3 cluster_current_epoch:6 cluster_my_epoch:1 cluster_stats_messages_ping_sent:383 cluster_stats_messages_pong_sent:373 cluster_stats_messages_sent:756 cluster_stats_messages_ping_received:368 cluster_stats_messages_pong_received:383 cluster_stats_messages_meet_received:5 cluster_stats_messages_received:756 20.0.0.10:6379> cluster nodes #查看节点信息 0229fcffb856fac03854aebcc053ff4115a8b248 20.0.0.20:6379@16379 master - 0 1605018468897 2 connected 5461-10922 d29fc5dcf1765ff01adc89aae5ec27131d05d311 20.0.0.30:6379@16379 master - 0 1605018466000 3 connected 10923-16383 7316d95a643a9ffd439e37d248ff354c69cdea0b 20.0.0.60:6379@16379 slave 0229fcffb856fac03854aebcc053ff4115a8b248 0 1605018467000 6 connected 7ae810725eb6ff5d3c8b222dff08bed993f7738f 20.0.0.10:6379@16379 myself,master - 0 1605018465000 1 connected 0-5460 f1843f0b57222c396f8c72acbbe5a31bffdfe790 20.0.0.50:6379@16379 slave 7ae810725eb6ff5d3c8b222dff08bed993f7738f 0 1605018467876 5 connected bb00f5e1da389a397580abdeec8bfab15cf2b404 20.0.0.40:6379@16379 slave d29fc5dcf1765ff01adc89aae5ec27131d05d311 0 1605018468000 4 connected
总结:1、导致群集down掉的两种情况
(1)三个master服务器全部宕机
(2)master1宕机,对应的slave1也发生了宕机
2、在上述实验中,如果master1宕机,slave1会继承master1的哈希槽,成为master1,这时master1重新启动之后会变成slave节点,且就算刚才顶替上来的slave1节点关机掉,master1依然是slave节点。