Redis（四）——过期、持久化、事件

iwehdio的博客园：https://www.cnblogs.com/iwehdio/

学习自：

1、redis数据库原理

redis默认有16个数据库。数据库与数据库之间的数据是隔离的。
Redis服务器用redisServer结构体来表示，其中redisDb是一个数组，用来保存所有的数据库，dbnum代表数据库的数量(这个可以配置，默认是16)
```
struct redisServer{  

    //redisDb数组,表示服务器中所有的数据库
    redisDb *db;  

    //服务器中数据库的数量
    int dbnum;  

}; 
```

Redis是C/S结构，Redis客户端通过redisClient结构体来表示：

typedef struct redisClient{  

    //客户端当前所选数据库
    redisDb *db;  

}redisClient;

Redis客户端连接Redis服务端的一号数据库时：

Redis中对每个数据库用redisDb结构体来表示：

typedef struct redisDb { 
    int id;         // 数据库ID标识
    dict *dict;     // 键空间，存放着所有的键值对              
    dict *expires;  // 过期哈希表，保存着键的过期时间                          
    dict *watched_keys; // 被watch命令监控的key和相应client    
    long long avg_ttl;  // 数据库内所有键的平均TTL（生存时间）     
} redisDb;

从代码上我们可以发现最重要的应该是dict *dict，它用来存放着所有的键值对。一般我们将存储所有键值对的dict称为键空间。

键空间示意图：
Redis的数据库就是使用字典(哈希表)来作为底层实现的，对数据库的增删改查都是构建在字典(哈希表)的操作之上的。

2、过期时间

因为我们的内存是有限的。所以我们会干掉不常用的数据，保留常用的数据。这就需要我们设置一下键的过期(生存)时间了。
- 设置键的生存时间可以通过EXPIRE或者PEXPIRE命令。
- 设置键的过期时间可以通过EXPIREAT或者PEXPIREAT命令。
其实EXPIRE、PEXPIRE、EXPIREAT这三个命令都是通过PEXPIREAT命令来实现的。
具体的，是通过redisDb结构体中dict *expires;属性，存放所有键过期的时间。
移除过期时间，查看剩余生存时间的命令：
- PERSIST(移除过期时间)
- TTL(Time To Live)返回剩余生存时间，以秒为单位
- PTTL以毫秒为单位返回键的剩余生存时间
过期策略：过期键保存在哈希表中了。那这些过期键到了过期的时间，什么时候被被删除掉呢？
删除策略可分为三种
- 定时删除(对内存友好，对CPU不友好)
- - 到时间点上就把所有过期的键删除了。
- 惰性删除(对CPU极度友好，对内存极度不友好)
- - 每次从键空间取键的时候，判断一下该键是否过期了，如果过期了就删除。
- 定期删除(折中)
- - 每隔一段时间去删除过期键，限制删除的执行时长和频率。
Redis采用的是惰性删除+定期删除两种策略，所以说，在Redis里边如果过期键到了过期的时间了，未必被立马删除的！
如果定期删除漏掉了很多过期key，也没及时去查(没走惰性删除)，大量过期key堆积在内存里，导致redis内存块耗尽了。
这种情况下可以设置内存最大使用量，当内存使用量超出时，会施行数据淘汰策略。
Redis的内存淘汰机制有以下几种：
一般情况下，使用 Redis 缓存数据时，为了提高缓存命中率，需要保证缓存数据都是热点数据。可以将内存最大使用量设置为热点数据占用的内存量，然后启用allkeys-lru淘汰策略，将最近最少使用的数据淘汰。

3、持久化

Redis是基于内存的，如果不想办法将数据保存在硬盘上，一旦Redis重启(退出/故障)，内存的数据将会全部丢失。
- 我们肯定不想Redis里头的数据由于某些故障全部丢失(导致所有请求都走MySQL)，即便发生了故障也希望可以将Redis原有的数据恢复过来，这就是持久化的作用。
Redis提供了两种不同的持久化方法来将数据存储到硬盘里边：
- RDB(基于快照)，将某一时刻的所有数据保存到一个RDB文件中。
- AOF(append-only-file)，当Redis服务器执行写命令的时候，将执行的写命令保存到AOF文件中。

RDB快照持久化

RDB持久化可以手动执行，也可以根据服务器配置定期执行。RDB持久化所生成的RDB文件是一个经过压缩的二进制文件，Redis可以通过这个文件还原数据库的数据。
有两个命令可以生成RDB文件：
- SAVE会阻塞Redis服务器进程，服务器不能接收任何请求，直到RDB文件创建完毕为止。
- BGSAVE创建出一个子进程，由子进程来负责创建RDB文件，服务器进程可以继续接收请求。

除了手动调用SAVE或者BGSAVE命令生成RDB文件之外，我们可以使用配置的方式来定期执行：

在默认的配置下，如果以下的条件被触发，就会执行BGSAVE命令

save 900 1              #在900秒(15分钟)之后，至少有1个key发生变化，
save 300 10            #在300秒(5分钟)之后，至少有10个key发生变化
save 60 10000        #在60秒(1分钟)之后，至少有10000个key发生变化

RDB持久化对过期键的策略：
- 执行SAVE或者BGSAVE命令创建出的RDB文件，程序会对数据库中的过期键检查，已过期的键不会保存在RDB文件中。
- 载入RDB文件时，程序同样会对RDB文件中的键进行检查，过期的键会被忽略。

AOF文件追加

AOF是通过保存Redis服务器所执行的写命令来记录数据库的数据的。
AOF持久化功能的实现可以分为3个步骤：
- 命令追加：命令写入aof_buf缓冲区
- 文件写入：调用flushAppendOnlyFile函数，考虑是否要将aof_buf缓冲区写入AOF文件中
- 文件同步：考虑是否将内存缓冲区的数据真正写入到硬盘

flushAppendOnlyFile函数的行为由服务器配置的appendfsyn选项来决定的：

appendfsync always     # 每次有数据修改发生时都会写入AOF文件。
appendfsync everysec   # 每秒钟同步一次，该策略为AOF的默认策略。
appendfsync no         # 从不同步。高效但是数据不会被持久化。

AOF重写：
- 在结果相同的情况下，多条命令可以进行合并成为1条命令，让AOF文件的体积变得更小。
- AOF重写不需要对现有的AOF文件进行任何的读取、分析。AOF重写是通过读取服务器当前数据库的数据来实现的！
AOF后台重写：
- Redis将AOF重写程序放到子进程里执行(BGREWRITEAOF命令)，像BGSAVE命令一样fork出一个子进程来完成重写AOF的操作，从而不会影响到主进程。
- AOF后台重写是不会阻塞主进程接收请求的，新的写命令请求可能会导致当前数据库和重写后的AOF文件的数据不一致！
- 为了解决数据不一致的问题，Redis服务器设置了一个AOF重写缓冲区，这个缓存区会在服务器创建出子进程之后使用。
- 子进程完成AOF重写后，让父进程将AOF重写缓冲区的数据写到新的AOF文件中。
AOF持久化对过期键的策略：
- 如果数据库的键已过期，但还没被惰性/定期删除，AOF文件不会因为这个过期键产生任何影响(也就说会保留)，当过期的键被删除了以后，会追加一条DEL命令来显示记录该键被删除了
- 重写AOF文件时，程序会对RDB文件中的键进行检查，过期的键会被忽略。
RDB和AOF并不互斥，它俩可以同时使用。
- RDB的优点：载入时恢复数据快、文件体积小。
- RDB的缺点：会一定程度上丢失数据(因为系统一旦在定时持久化之前出现宕机现象，此前没有来得及写入磁盘的数据都将丢失。)
- AOF的优点：丢失数据少(默认配置只丢失一秒的数据)。
- AOF的缺点：恢复数据相对较慢，文件体积大
如果Redis服务器同时开启了RDB和AOF持久化，服务器会优先使用AOF文件来还原数据(因为AOF更新频率比RDB更新频率要高，还原的数据更完善)

4、Redis事件

Redis服务器是一个事件驱动程序，主要处理以下两类事件：
- 文件事件：文件事件其实就是对Socket操作的抽象，Redis服务器与Redis客户端的通信会产生文件事件，服务器通过监听并处理这些事件来完成一系列的网络操作
- 时间事件：时间事件其实就是对定时操作的抽象，前面我们已经讲了RDB、AOF、定时删除键这些操作都可以由服务端去定时或者周期去完成，底层就是通过触发时间事件来实现的！
Redis开发了自己的网络事件处理器，这个处理器被称为文件事件处理器。
- 文件事件处理器使用I/O多路复用程序来同时监听多个Socket。当被监听的Socket准备好执行连接应答(accept)、读取(read)等等操作时，与操作相对应的文件事件就会产生，根据文件事件来为Socket关联对应的事件处理器，从而实现功能。
- Redis中的I/O多路复用程序会将所有产生事件的Socket放到一个队列里边，然后通过这个队列以有序、同步、每次一个Socket的方式向文件事件分派器传送套接字。也就是说：当上一个Socket处理完毕后，I/O多路复用程序才会向文件事件分派器传送下一个Socket。
Redis文件事件完成通信：
- 首先，IO多路复用程序首先会监听着Socket的AE_READABLE事件，该事件对应着连接应答处理器
  - 可以理解简单成SocketServer.accpet()
- 此时，一个名字叫做3y的Socket要连接服务器啦。服务器会用连接应答处理器处理。创建出客户端的Socket，并将客户端的Socket与命令请求处理器进行关联，使得客户端可以向服务器发送命令请求。
  - 相当于Socket s = ss.accept();，创建出客户端的Socket，然后将该Socket关联命令请求处理器
  - 此时客户端就可以向主服务器发送命令请求了
- 假设现在客户端发送一个命令请求set Java3y "关注、点赞、评论"，客户端Socket将产生AE_READABLE事件，引发命令请求处理器执行。处理器读取客户端的命令内容，然后传给对应的程序去执行。
- 客户端发送完命令请求后，服务端总得给客户端回应的。此时服务端会将客户端的Scoket的AE_WRITABLE事件与命令回复处理器关联。
- 最后客户端尝试读取命令回复时，客户端Socket产生AE_WRITABLE事件，触发命令回复处理器执行。当把所有的回复数据写入到Socket之后，服务器就会解除客户端Socket的AE_WRITABLE事件与命令回复处理器的关联。
时间事件：
- 持续运行的Redis服务器会定期对自身的资源和状态进行检查和调整，这些定期的操作由serverCron函数负责执行，它的主要工作包括：
  - 更新服务器的统计信息(时间、内存占用、数据库占用)
  - 清理数据库的过期键值对
  - AOF、RDB持久化
  - 如果是主从服务器，对从服务器进行定期同步
  - 如果是集群模式，对集群进行定期同步和连接
- Redis服务器将时间事件放在一个链表中，当时间事件执行器运行时，会遍历整个链表。时间事件包括：
  - 周期性事件(Redis一般只执行serverCron时间事件，serverCron时间事件是周期性的)
  - 定时事件
文件事件和时间事件之间是合作关系，服务器会轮流处理这两种事件，并且处理事件的过程中不会发生抢占。
时间事件的实际处理事件通常会比设定的到达时间晚一些。

iwehdio的博客园：https://www.cnblogs.com/iwehdio/

来源与结束于否定之否定。