Redis 持久化原理及过期 key 清除策略

Redis RDB 持久化原理

1)RDB 持久化配置

# 时间策略,表示900s内如果有1条是写入命令,就触发产生一次快照,可以理解为就进行一次备份
save 900 1
save 300 10 # 表示300s内有10条写入,就产生快照
save 60 10000 # 表示60s内有10000条写入,就产生快照

# 文件名称
dbfilename dump.rdb

# 如果持久化出错,主进程是否停止写入
stop-writes-on-bgsave-error yes

# 是否压缩
rdbcompression yes

# 导入时是否检查
rdbchecksum yes

# 文件保存路径
dir /usr/local/redis-4.0.6

2)save 的含义

实际生产环境每个时段的读写请求肯定不是均衡的,为此 redis 提供一种根据 key 单位时间操作次数来触发一次备份到磁盘,我们可以自由定制什么情况下触发备份,此功能起到平衡性能与数据安全的作用

3)在 Redis 中 RDB 持久化的触发分为两种:自己手动触发与 Redis 定时触发

针对 RDB 方式的持久化,手动触发可以使用:

  • save:会阻塞当前 Redis 服务器,直到持久化完成,线上应该禁止使用。
  • bgsave:该触发方式会 fork 一个子进程,由子进程负责持久化过程,因此阻塞只会发生在 fork 子进程的时候

而自动触发的场景主要是有以下几点:

  • 根据我们的 save m n 配置规则自动触发
  • 从节点全量复制时,主节点发送 rdb 文件给从节点完成复制操作,主节点会触发 bgsave
  • 执行 debug reload 时
  • 执行 shutdown 时,如果没有开启aof,也会触发

4)禁用RDB

只需要在 save 的最后一行写上:save ""

Redis AOF 持久化原理

1)AOF 持久化配置

# 是否开启aof
appendonly yes

# 文件名称
appendfilename "appendonly.aof"

# 同步方式
appendfsync everysec

# aof重写期间是否同步
no-appendfsync-on-rewrite no

# 重写触发配置
auto-aof-rewrite-percentage 100
auto-aof-rewrite-min-size 64mb

# 加载aof时如果有错如何处理
aof-load-truncated yes # yes表示如果aof尾部文件出问题,写log记录并继续执行。no表示提示写入等待修复后写入

# 文件重写策略
aof-rewrite-incremental-fsync yes

2)appendfsync 同步模式有三种模式,一般情况下都采用 everysec 配置,在数据和安全里面做平衡性选择,最多损失1s的数据

  • always:把每个写命令都立即同步到 aof,很慢,但是很安全
  • everysec:每秒同步一次,是折中方案
  • no:redis 不处理交给 OS 来处理,非常快,但是也最不安全

3)AOF 的整个流程大体来看可以分为两步

第一步是命令的实时写入(如果是 appendfsync everysec 配置,会有 1s 损耗)。

第二步是对 aof 文件的重写。

步骤:

命令写入=》追加到 aof_buf =》通过时间事件调用 flushAppendOnlyFile 函数同步到 aof 磁盘

原因:

实时写入磁盘会带来非常高的磁盘 IO,影响整体性能

4)AOF 持久化的效率和安全性分析

  • always:每个时间事件循环都将 AOF_BUF 缓冲区的所有内容写入到 AOF 文件,并且同步 AOF 文件,这是最安全的方式,但磁盘操作和阻塞延迟,是 IO 开支较大。
  • everysec:每秒同步一次,性能和安全都比较中庸的⽅方式,也是 redis 推荐的方式。如果遇到物理服务器故障,有可能导致最近一秒内 aof 记录丢失(可能为部分丢失)。
  • no:redis 并不直接调用文件同步,而是交给操作系统来处理,操作系统可以根据 buffer 填充情况/通道空闲时间等择机触发同步;这是一种普通的文件操作方式。性能较好,在物理服务器故障时,数据丢失量会因 OS 配置有关。处于 no 模式下的 flushAppendOnlyFile 调用无须执行同步操作

Redis 两种持久化方案对比

Redis 提供了不同的持久性选项:

  • RDB 持久性以指定的时间间隔执行数据集的时间点快照。
  • AOF 持久性记录服务器接收的每个写入操作,将在服务器启动时再次播放,重建原始数据集。使用与 Redis 协议本身相同的格式以仅追加方式记录命令。当 Redis 太大时,Redis 能够重写日志背景。

RDB 的优缺点

优点:

  • RDB 最大限度地提高了 Redis 的性能,父进程不需要参与磁盘 I/O
  • 与 AOF 相比,RDB 允许使用大数据集更快地重启

缺点:

  • 如果您需要在 Redis 停止工作时(例如断电后)将数据丢失的可能性降至最低,则 RDB 并不好
  • RDB 经常需要 fork() 才能使用子进程持久存储在磁盘上。如果数据集很大,fork() 可能会非常耗时

AOF 的优缺点

优点:

  • 数据更加安全
  • 当 Redis AOF 文件太大时,Redis 能够在后台自动重写 AOF
  • AOF 以易于理解和解析的格式一个接一个地包含所有操作的日志

缺点:

  • AOF 文件通常比同一数据集的等效 RDB 文件大
  • 根据确切的fsync策略,AOF 可能比 RDB 慢

RDB 和 AOF,我应该用哪一个?

一般来说,如果想达到足以媲美 PostgreSQL 的数据安全性, 你应该同时使用两种持久化功能。如果你非常关心你的数据,但仍然可以承受数分钟以内的数据丢失,那么你可以只使用 RDB 持久化。有很多用户都只使用 AOF 持久化, 但我们并不推荐这种方式:因为定时生成 RDB 快照(snapshot)非常便于进行数据库备份, 并且 RDB 恢复数据集的速度也要比 AOF 恢复的速度要快。

在线上我们到底该怎么做?

  • RDB 持久化与 AOF 持久化同步使用
  • 如果 Redis 中的数据并不是特别敏感或者可以通过其它方式重写生成数据,可以关闭持久化,如果丢失数据可以通过其它途径补回
  • 自己制定策略定期检查 Redis 的情况,然后可以手动触发备份、重写数据
  • 采用集群和主从同步

Redis 过期 key 清除策略

Redis 如何淘汰过期的 keys?

惰性删除 :

概念:当一些客户端尝试访问它时,key 会被发现并主动的过期。放任键过期不管,但是每次从键空间中获取键时,都检查取得的键是否过期,如果过期的话,就删除该键

特点:CPU 友好,但如果一个 key 不再使用,那么它会一直存在于内存中,造成浪费

定时删除:

概念:设置键的过期时间的同时,创建一个定时器(timer),让定时器在键的过期时间来临时,立即执行对键的删除操作

定期删除:

隔一段时间,程序就对数据库进行一次检查,删除里面的过期键,至于要删除多少过期键,以及要检查多少个数据库,则由算法决定。 即设置一个定时任务,比如10分钟删除一次过期的 key;间隔小则占用 CPU,间隔大则浪费内存

例如 Redis 每秒处理:

  1. 测试随机的 20 个 keys 进⾏行行相关过期检测。
  2. 删除所有已经过期的 keys。
  3. 如果有多于 25% 的 keys 过期,重复步奏1

Redis 服务器实际使用的是惰性删除和定期删除两种策略:通过配合使用这两种删除策略,服务器可以很好地在合理使用 CPU 时间和避免浪费内存空间之间取得平衡。

惰性删除策略是怎么实现?

通过 expireIfNeeded 函数,当我们操作 key 的时候进行判断 key 是否过期。

定期删除策略是怎么实现的?

通过 activeExpireCycle 函数,serverCron 函数执行时,activeExpireCycle 函数就会被调用,规定的时间里面分多次遍历服务器的 expires 字典随机检查一部分 key 的过期时间,并删除其中的过期 key。

原文地址:https://www.cnblogs.com/jwen1994/p/12264247.html