redis 之主从同步（两个缓冲区尤为重要）

当启动多个服务器时，通过replicaof（redis 5.0之前使用slaveof）命令形成主库和从库之间的关系

首先介绍一下名词命令传播：即在主服务器数据库状态被修改，导致主从服务器数据库状态出现不一致时，让主从服务器的数据库状态重新回到一致状态。一旦主从库完成了全量复制，它们之间就会一直维护一个网络连接，主库会通过这个连接将后续陆续收到的命令操作再同步给从库，这个过程也称为基于长连接的命令传播，可以避免频繁建立连接的开销。

这里就要提到一些命令：在早期版本中，会使用sync进行主从数据库间数据同步，但是sync采用的是每次全量同步，即每次与数据库状态不一致时，主服务器都会生成完整rdb文件传输给从服务器，

这样带来的影响时，因为主服务器会执行bgsave ，创建子进程生成rdb文件，这个操作会耗费主服务器大量的cpu，内存和磁盘资源，主服务器同时需要将生成的rdb文件传递给从服务器，这个发送操作同样

会耗费主从服务器大量的网络带宽和流量，接收到rdb文件的从服务器需要载入主服务器发来的rdb我呢间，并且在载入期间，从服务器会因为阻塞而没有办法处理命令请求。

在新版本中采用了psync来进行主从同步，首先，主从库间建立连接、协商同步的过程，主要是为全量复制做准备。在这一步，从库和主库建立起连接，并告诉主库即将进行同步，主库确认回复后，

主从库间就可以开始同步了。

下面介绍psync的命令参数：

下面所述皆为第一次进行同步时的情况：

从库给主库发送 psync 命令，表示要进行数据同步，主库根据这个命令的参数来启动复制。psync 命令包含了主库的 runID 和复制进度 offset 两个参数。

runID，是每个 Redis 实例启动时都会自动生成的一个随机 ID，用来唯一标记这个实例。

当从库和主库第一次复制时，因为不知道主库的 runID，所以将 runID 设为“？”。

offset，此时设为 -1，表示第一次复制。主库收到 psync 命令后，会用 FULLRESYNC 响应命令带上两个参数：主库 runID 和主库目前的复制进度 offset，返回给从库。从库收到响应后，会记录下这两个参数。

FULLRESYNC 响应表示第一次复制采用的全量复制，也就是说，主库会把当前所有的数据都复制给从库。
在主从服务器进行同步的过程中，主库不会被阻塞，同样可以接受请求否则，Redis 的服务就被中断了。但是，这些请求中的写操作并没有记录到刚刚生成的 RDB 文件中。为了保证主从库的数据一致性，主库会在内存中用专门的 replication buffer，记录 RDB 文件生成后收到的所有写操作。（注意这里所说的同步是第一次，这里所说的缓冲区与下面要介绍的缓冲区并不是一样的，下面将要介绍，如果进行第一次同步后，主从服务器网络中断后，又重新进行恢复后(对于中间产生的数据造成主从库状态不一致)的应对策略）

最后主库会把执行过程中replication_buffer缓冲区中的的写命令，再发送给从库。具体的操作是，当主库完成 RDB 文件发送后，就会把此时 replication buffer 中的修改操作发给从库，从库再重新执行这些操作

到此在第一次进行全量复制时可能出现的各种讨论已经介绍完毕。

下面就要讨论，命令传播阶段出现的主从库状态不一致，和主从库间网络中断时出现的一些问题。

从 Redis 2.8 开始，网络断了之后，主从库会采用增量复制的方式继续同步。增量复制只会把主从库网络断连期间主库收到的命令，同步给从库。

这里就会用到三个增量复制的实现细节：
主服务器的复制偏移量：replication_offset

主服务器的复制积压缓冲区：replication_backlog

服务器的运行id

对于复制偏移量：执行复制的双方，主从服务器都会维护一个复制偏移量，主服务器每次向从服务器传播n个字节的数据时，就将自己的肤质偏移量的值加上N，从服务器每次收到主服务器传播来的N个字节数据时，就将自己的复制偏移量的值加上N。

当主从库断连后，主库会把断连期间收到的写操作命令，写入 replication buffer，同时也会把这些操作命令也写入 repl_backlog_buffer 这个缓冲区。

即同时主服务器进行命令传播期间（从服务器完成全量复制后，主服务器接受到写命令，会同时将命令传播到从服务器），不仅将写命令发送给所有服务器，还会将写命令写入复制积压缓冲区。

主服务器的复制积压缓冲区会保存着一部分最近传输的命令。

所以如果网络中断后，主从库的连接恢复之后，从库首先会给主库发送 psync 命令，并把自己当前的 slave_repl_offset 发给主库，主库会判断自己的 master_repl_offset 和 slave_repl_offset 之间的差距。

在网络断连阶段，主库可能会收到新的写操作命令，所以，一般来说，master_repl_offset 会大于 slave_repl_offset。此时，主库只用把 master_repl_offset 和 slave_repl_offset 之间的命令操作同步给从库就行。

比较容易弄混的一个地方 replication_buffer 与 replication_backlog_buffer 之间的区别

首先来说一下复制缓冲区。

作用：主节点开始和一个从节点进行全量同步时，会为从节点创建一个输出缓冲区，这个缓冲区就是复制缓冲区。当主节点向从节点发送 RDB 文件时，如果又接收到了写命令操作，就会把它们暂存在复制缓冲区中。等 RDB 文件传输完成，并且在从节点加载完成后，主节点再把复制缓冲区中的写命令发给从节点，进行同步。对主从同步的影响：如果主库传输 RDB 文件以及从库加载 RDB 文件耗时长，同时主库接收的写命令操作较多，就会导致复制缓冲区被写满而溢出。一旦溢出，主库就会关闭和从库的网络连接，重新开始全量同步。所以，我们可以通过调整 client-output-buffer-limit slave 这个配置项，来增加复制缓冲区的大小，以免复制缓冲区溢出。

再来看看复制积压缓冲区。

作用：主节点和从节点进行常规同步时，会把写命令也暂存在复制积压缓冲区中。如果从节点和主节点间发生了网络断连，等从节点再次连接后，可以从复制积压缓冲区中同步尚未复制的命令操作。对主从同步的影响：如果从节点和主节点间的网络断连时间过长，复制积压缓冲区可能被新写入的命令覆盖。此时，从节点就没有办法和主节点进行增量复制了，而是只能进行全量复制。针对这个问题，应对的方法是调大复制积压缓冲区的大小