NoSQL之Redis集群搭建

摘要

redis是一个开源的key value存储系统,受到了广大互联网公司的青睐。redis3.0版本之前只支持单例模式,在3.0版本及以后才支持集群,我这里用的是redis3.0.0版本;

redis集群采用P2P模式,是完全去中心化的,不存在中心节点或者代理节点;

redis集群是没有统一的入口的,客户端(client)连接集群的时候连接集群中的任意节点(node)即可,集群内部的节点是相互通信的(PING-PONG机制),每个节点都是一个redis实例;

为了实现集群的高可用,即判断节点是否健康(能否正常使用),redis-cluster有这么一个投票容错机制:如果集群中超过半数的节点投票认为某个节点挂了,那么这个节点就挂了(fail)。这是判断节点是否挂了的方法;

那么如何判断集群是否挂了呢? 如果集群中任意一个节点挂了,而且该节点没有从节点(备份节点),那么这个集群就挂了。这是判断集群是否挂了的方法;

那么为什么任意一个节点挂了(没有从节点)这个集群就挂了呢? 因为集群内置了16384个slot(哈希槽),并且把所有的物理节点映射到了这16384[0-16383]个slot上,或者说把这些slot均等的分配给了各个节点。当需要在Redis集群存放一个数据(key-value)时,redis会先对这个key进行crc16算法,然后得到一个结果。再把这个结果对16384进行求余,这个余数会对应[0-16383]其中一个槽,进而决定key-value存储到哪个节点中。所以一旦某个节点挂了,该节点对应的slot就无法使用,那么就会导致集群无法正常工作。

综上所述,每个Redis集群理论上最多可以有16384个节点。

一、案例概述

1.1、单节点Redis服务器带来的问题

1.1.1、单点故障,服务不可用

1.1.2、无法处理大量的并发数据请求

1.1.3、数据丢失——大灾难

1.2、解决方法 

搭建Redis集群

二、案例前置知识点

2.1、Redis集群介绍

2.1.1、Redis集群是一个提供在多个Redis间节点间共享数据的程序集

2.1.2、Redis集群并不支持处理多个keys的命令,因为这需要在不同的节点间移动数据,从而达不到像Redis那样的性能,在高负载的情况下可能会导致不可预料的错误

2.1.3、Redis集群通过分区来提供一定程度的可用性,在实际环境中当某个节点宕机或者不可达的情况下可继续处理命令

2.2、Redis集群的优势

2.2.1、自动分割数据到不同的节点上

2.2.2、整个集群的部分节点失败或者不可达的情况下能够继续处理命令

2.3、Redis集群的实现方法

2.3.1、有客户端分片

2.3.2、代理分片

2.3.3、服务器端分片

2.4、Redis-Cluster数据分片

2.4.1、Redis集群没有使用一致性hash,而是引入了哈希槽概念

2.4.2、Redis集群有16384个哈希槽

2.4.3、每个key通过CRC16校验后对16384取模来决定放置槽

2.4.4、集群的每个节点负责一部分哈希槽

2.4.5、以3个节点组成的集群为例

①节点A包含0到5500号哈希槽

②节点B包含5501到11000号哈希槽

③节点C包含11001到16384号哈希槽

2.4.6、支持添加或者删除节点

①添加删除节点无需停止服务

②例如:

1)如果想新添加个节点D,需要移动节点A、B、C中的部分槽到D上

2)如果想移除节点A,需要将A中的槽移到B和C上,再将没有任何槽的A节点从集群中移除

2.4.7、Redis-Cluster的主从复制模型

①集群中具有A,B,C三个节点,如果节点B失败了,整个集群就会因缺少5501-11000这个范围的槽而不可用

②为每个节点添加一个从节点A1,B1,C1,整个集群便有三个master节点和三个slave节点组成,在节点B失败后,集群便会选举B1为新的主节点继续服务

③当B和B1都失败后,集群将不可用

三、Redis集群搭建

3.1、案例拓扑图

 3.2、环境

Master1服务器

20.0.0.10

Master2服务器

20.0.0.20

Master3服务器

20.0.0.30

Slave1服务器

20.0.0.40

Slave2服务器

20.0.0.50

Slave3服务器

20.0.0.60

3.3、安装Redis

所有服务器上都需要安装,只在master1上演示,其他安装都一样

 1 [root@master1 ~]# tar zxf redis-5.0.7.tar.gz 
 2 [root@master1 ~]# cd redis-5.0.7/
 3 [root@master1 redis-5.0.7]# make -j2
 4 [root@master1 redis-5.0.7]# make PREFIX=/usr/local/redis install
 5 [root@master1 redis-5.0.7]# ln -s /usr/local/redis/bin/* /usr/local/bin/
 6 [root@master1 redis-5.0.7]# cd utils/
 7 [root@master1 utils]# ./install_server.sh 
 8 Welcome to the redis service installer
 9 This script will help you easily set up a running redis server
10 
11 Please select the redis port for this instance: [6379] 
12 Selecting default: 6379
13 Please select the redis config file name [/etc/redis/6379.conf] 
14 Selected default - /etc/redis/6379.conf
15 Please select the redis log file name [/var/log/redis_6379.log] 
16 Selected default - /var/log/redis_6379.log
17 Please select the data directory for this instance [/var/lib/redis/6379] 
18 Selected default - /var/lib/redis/6379
19 Please select the redis executable path [/usr/local/bin/redis-server] 
20 Selected config:
21 Port           : 6379
22 Config file    : /etc/redis/6379.conf
23 Log file       : /var/log/redis_6379.log
24 Data dir       : /var/lib/redis/6379
25 Executable     : /usr/local/bin/redis-server
26 Cli Executable : /usr/local/bin/redis-cli
27 Is this ok? Then press ENTER to go on or Ctrl-C to abort.
28 Copied /tmp/6379.conf => /etc/init.d/redis_6379
29 Installing service...
30 Successfully added to chkconfig!
31 Successfully added to runlevels 345!
32 Starting Redis server...
33 Installation successful!

3.4、修改配置文件

所有服务器上都需要修改,只在master1上演示

 1 [root@localhost utils]# vi /etc/redis/6379.conf 
 2 bind 20.0.0.10           #删除原来的127.0.0.1,改成自己的IP
 3  
 4 cluster-enabled yes     #前面的注释去掉
 5 
 6 appendonly yes           #开启AOF持久化
 7 
 8 cluster-config-file nodes-6379.conf     #前面的注释去掉
 9 
10 cluster-node-timeout 15000         #前面的注释去掉
11 
12 cluster-require-full-coverage no      #前面的注释去掉,把yes改成no,表示当负责一个插槽的主库下线且没有相应的从库进行故障恢复时,集群仍然可用

3.5、开启Redis服务

所有服务器上都需要开启,只在master1上演示

1 [root@master1 utils]# /etc/init.d/redis_6379 restart
2 Stopping ...
3 Waiting for Redis to shutdown ...
4 Redis stopped
5 Starting Redis server...
6 [root@master1 utils]# netstat -anpt | grep 6379
7 tcp        0      0 20.0.0.10:6379          0.0.0.0:*               LISTEN      18943/redis-server  
8 tcp        0      0 20.0.0.10:16379         0.0.0.0:*               LISTEN      18943/redis-server  

3.6、在master1上使用脚本创建集群

gem是ruby写的软件包。rubygems是用来打包、下载、安装、使用gem软件包的工具。要搭建集群的话,需要使用一个工具(脚本文件),这个工具在redis解压文件的源代码里。因为这个工具是一个ruby脚本文件,所以这个工具的运行需要ruby的运行环境,就相当于java语言的运行需要在jvm上。所以需要安装ruby。

 0 [root@master1 utils]# yum -y install ruby rubygems
1
[root@master1 utils]# cd 2 [root@master1 ~]# gem install redis-3.2.0.gem 3 Successfully installed redis-3.2.0 4 Parsing documentation for redis-3.2.0 5 Installing ri documentation for redis-3.2.0 6 1 gem installed 7 [root@master1 ~]# cd redis-5.0.7/src/ 8 [root@master1 src]# redis-cli --cluster create --cluster-replicas 1 20.0.0.10:6379 20.0.0.20:6379 20.0.0.30:6379 20.0.0.40:6379 20.0.0.50:6379 20.0.0.60:6379 9 >>> Performing hash slots allocation on 6 nodes... 10 Master[0] -> Slots 0 - 5460 11 Master[1] -> Slots 5461 - 10922 12 Master[2] -> Slots 10923 - 16383 13 Adding replica 20.0.0.50:6379 to 20.0.0.10:6379 14 Adding replica 20.0.0.60:6379 to 20.0.0.20:6379 15 Adding replica 20.0.0.40:6379 to 20.0.0.30:6379 16 M: 7ae810725eb6ff5d3c8b222dff08bed993f7738f 20.0.0.10:6379 17 slots:[0-5460] (5461 slots) master 18 M: 0229fcffb856fac03854aebcc053ff4115a8b248 20.0.0.20:6379 19 slots:[5461-10922] (5462 slots) master 20 M: d29fc5dcf1765ff01adc89aae5ec27131d05d311 20.0.0.30:6379 21 slots:[10923-16383] (5461 slots) master 22 S: bb00f5e1da389a397580abdeec8bfab15cf2b404 20.0.0.40:6379 23 replicates d29fc5dcf1765ff01adc89aae5ec27131d05d311 24 S: f1843f0b57222c396f8c72acbbe5a31bffdfe790 20.0.0.50:6379 25 replicates 7ae810725eb6ff5d3c8b222dff08bed993f7738f 26 S: 7316d95a643a9ffd439e37d248ff354c69cdea0b 20.0.0.60:6379 27 replicates 0229fcffb856fac03854aebcc053ff4115a8b248 28 Can I set the above configuration? (type 'yes' to accept): yes #输入yes 29 >>> Nodes configuration updated 30 >>> Assign a different config epoch to each node 31 >>> Sending CLUSTER MEET messages to join the cluster 32 Waiting for the cluster to join 33 .... 34 >>> Performing Cluster Check (using node 20.0.0.10:6379) 35 M: 7ae810725eb6ff5d3c8b222dff08bed993f7738f 20.0.0.10:6379 36 slots:[0-5460] (5461 slots) master 37 1 additional replica(s) 38 M: 0229fcffb856fac03854aebcc053ff4115a8b248 20.0.0.20:6379 39 slots:[5461-10922] (5462 slots) master 40 1 additional replica(s) 41 M: d29fc5dcf1765ff01adc89aae5ec27131d05d311 20.0.0.30:6379 42 slots:[10923-16383] (5461 slots) master 43 1 additional replica(s) 44 S: 7316d95a643a9ffd439e37d248ff354c69cdea0b 20.0.0.60:6379 45 slots: (0 slots) slave 46 replicates 0229fcffb856fac03854aebcc053ff4115a8b248 47 S: f1843f0b57222c396f8c72acbbe5a31bffdfe790 20.0.0.50:6379 48 slots: (0 slots) slave 49 replicates 7ae810725eb6ff5d3c8b222dff08bed993f7738f 50 S: bb00f5e1da389a397580abdeec8bfab15cf2b404 20.0.0.40:6379 51 slots: (0 slots) slave 52 replicates d29fc5dcf1765ff01adc89aae5ec27131d05d311 53 [OK] All nodes agree about slots configuration. 54 >>> Check for open slots... 55 >>> Check slots coverage... 56 [OK] All 16384 slots covered.

3.7、测试群集

 1 [root@master1 src]# redis-cli -h 20.0.0.10 -p 6379 -c
 2 20.0.0.10:6379> set centos 7.6
 3 OK
 4 20.0.0.10:6379> quit
 5 [root@master1 src]# redis-cli -h 20.0.0.20 -p 6379 -c
 6 20.0.0.20:6379> get centos
 7 -> Redirected to slot [467] located at 20.0.0.10:6379
 8 "7.6"
 9 20.0.0.10:6379> quit
10 [root@master1 src]# redis-cli -h 20.0.0.50 -p 6379 -c
11 20.0.0.50:6379> get centos
12 -> Redirected to slot [467] located at 20.0.0.10:6379
13 "7.6"
14 20.0.0.10:6379> cluster info          #查看集群状态
15 cluster_state:ok
16 cluster_slots_assigned:16384
17 cluster_slots_ok:16384
18 cluster_slots_pfail:0
19 cluster_slots_fail:0
20 cluster_known_nodes:6
21 cluster_size:3
22 cluster_current_epoch:6
23 cluster_my_epoch:1
24 cluster_stats_messages_ping_sent:383
25 cluster_stats_messages_pong_sent:373
26 cluster_stats_messages_sent:756
27 cluster_stats_messages_ping_received:368
28 cluster_stats_messages_pong_received:383
29 cluster_stats_messages_meet_received:5
30 cluster_stats_messages_received:756
31 20.0.0.10:6379> cluster nodes                   #查看节点信息
32 0229fcffb856fac03854aebcc053ff4115a8b248 20.0.0.20:6379@16379 master - 0 1605018468897 2 connected 5461-10922
33 d29fc5dcf1765ff01adc89aae5ec27131d05d311 20.0.0.30:6379@16379 master - 0 1605018466000 3 connected 10923-16383
34 7316d95a643a9ffd439e37d248ff354c69cdea0b 20.0.0.60:6379@16379 slave 0229fcffb856fac03854aebcc053ff4115a8b248 0 1605018467000 6 connected
35 7ae810725eb6ff5d3c8b222dff08bed993f7738f 20.0.0.10:6379@16379 myself,master - 0 1605018465000 1 connected 0-5460
36 f1843f0b57222c396f8c72acbbe5a31bffdfe790 20.0.0.50:6379@16379 slave 7ae810725eb6ff5d3c8b222dff08bed993f7738f 0 1605018467876 5 connected
37 bb00f5e1da389a397580abdeec8bfab15cf2b404 20.0.0.40:6379@16379 slave d29fc5dcf1765ff01adc89aae5ec27131d05d311 0 1605018468000 4 connected
原文地址:https://www.cnblogs.com/xuhao0705/p/13955697.html