《Redis 主从复制》

万念俱灰,说的就是我现在的心情......

周六下午写了一下午的读书笔记,由于我的 MAC 有点问题,重启了一下......

灰飞烟灭......

  第八章《集群》

总结

1:如何开启主从复制?

  - Redis.conf 中配置 slaveof 主数据库地址 主数据库端口 

  - 启动一个 Redis 实例 redis-server --port 监听端口 --slaveof 主数据库地址 主数据库端口

2:如何查看主从数据库状态及其节点信息?

  - INFO replication

3:设置主从后,从库可以写么?

  - 不可以,如果在从库执行写操作的话,则会报错

  - 不过也可以通过修改配置 slave-read-only 使得从库可以执行写操作,不过这会使得主从数据库不一致。通常是禁止的(默认)

4:主从的原理是什么呢?是如何实现的呢?

  - 当一个从数据库启动时,会向主库发送 PSYNC(Redis 2.8 之后) 命令。

  - 当主库接到 PSYNC(Redis 2.8) 命令时,会[保存快照(RDB) + 缓存保存快照期间的命令],当快照完成后,会把快照和缓存命令一块发给从库。

  - 当从库接到后,会根据RDB快照和缓存命令,进行同步(也叫做复制初始化)。

5:为什么有时候主从数据不一致

  - 由于 Redis 采用了乐观复制,既乐观的认为主从数据最终是会同步的。

  - 当客户端发起请求后,主数据库执行完成会立即返回结果。并将命令异步同步从数据库。

  - 由于本身是异步,假如网络断开或者其他什么,就会导致主从数据不一致的情况发生。

6:如何解决主从数据不一致问题?

  - Redis 在配置中提供了解决一致性的方案,合理的配置这两个选项可以降低(注意,不是解决)一致性的问题。

  - min-slaves-to-write 3      是表示当有3个或者3个以上的从库更新了数据,主库才是可写的,如果不满足的话,会直接报错

  - min-slaves-max-lag 10    是表示允许从库失去连接的最长时间,当从库超过这个时间时候,我们就认为这个从库已经[挂了]

7:主/从 数据库崩溃的处理办法?

  - 当从库崩溃时,不会影响其他,当从库重启之后,主库会自动同步数据,所以也没有数据丢失问题。

  - 主库崩溃后,情况会有一些复杂。

    - 由于为了主库的性能最佳,通常会关闭 AOF/RDB 。

      - 如果关闭,一定不要使用 Supervisor 等进程管理工具实现自动重启,因为当自动重启后,主库没有任何数据,当从库连接上之后,同步数据,从库数据也将清空 

    - 推荐使用 哨兵 机制来实现 主/从 的切换。

8:哨兵机制的简单实现?

  - 这里我开了两个 redis-server 实例, 8680 端口作为 master,8681 端口作为 slave。

  - 配置 哨兵 ,建立配置文件 sentinel.conf 

    - sentinel monitor 监控数据库名称 地址 端口 最低通过票数

    - 例如: sentinel monitor mymaster 127.0.0.1 6379 1

  - 启动监控:redis-sentinel /path/to/sentinel.conf

  - 这时,我们杀死 master ,分析下日志

  - 

4451:X 20 Aug 05:17:27.444 # +monitor master mymaster 127.0.0.1 6380 quorum 1     // 主库
4451:X 20 Aug 05:18:13.972 * +slave slave 127.0.0.1:6381 127.0.0.1 6381 @ mymaster 127.0.0.1 6380 // 发现一个备库

// 杀死主库进程 4451:X 20 Aug 05:18:12.835 # +sdown master mymaster 127.0.0.1 6380 // 主观认为数据库停止了服务 4451:X 20 Aug 05:18:12.837 # +odown master mymaster 127.0.0.1 6380 #quorum 1/1 // 客观认为数据库已停止运行 4451:X 20 Aug 05:18:12.838 # +new-epoch 2

// 开始故障恢复 4451:X 20 Aug 05:18:12.839 # +try-failover master mymaster 127.0.0.1 6380 // 选择 6380 端口为主库
// 之后就是 6380 为主库,具体的细节一会在详细说

 9:哨兵机制的实现原理?

  - 当哨兵启动时,会和需要监控的主数据库建立两条连接。

    - 一条是 订阅 __sentinel__::hello 频道,获取其他哨兵节点信息。

    - 另一条需要定期发送 INFO 字段来获取,数据库本身信息。

  - 当和主数据库建立完成之后,定期执行下列操作

    - 10s/次 会向主数据库发送 INFO 命令

      - 获取当前数据库相关信息(节点数量/节点信息/等等)

    - 2s/次 会向主/从数据库的 __sentinel__::hello 频道发送自己的信息

    - 1s/次 向主数据库和其他哨兵节点发送Ping命令

  - 当主数据库出现问题时候

    - 哨兵向主数据库发送 ping 命令,未回复,则该哨兵认为主数据库 主观下线

    - 这时候会判断 quorum 参数

      - 例如  sentinel monitor mymaster 127.0.0.1 6379 3

      - 该配置表示,如果有三个哨兵认为主数据库主观下线

    - 才会认为该主数据库 客观下线

  - 当认为客观下线后,需要进行故障恢复

    - 这时,会推举领头哨兵进行故障恢复。

      - 领头哨兵的选举流程为(Raft算法)

      - 发现数据库主观下线的哨兵,向其他人发送命令,要求选自己为 领头哨兵

      - 超过半数同意,则该哨兵成为领头哨兵进行故障恢复

10:什么样子的哨兵部署方案比较好?

  - 建议为每个节点部署(主/从)哨兵。

  - 保证环境一致。

  - 设置 quorum 为  N/2 + 1 ,N为节点数量,这样保证一半同意,才会生效。

原文地址:https://www.cnblogs.com/25-lH/p/9504678.html