redis的持久化

redis的持久化

redis的持久化分为RDB和AOF

RDB

RDB简介

RDB持久化是指在指定的时间间隔内将内存中的数据集快照写入磁盘,实际操作过程是fork一个和主进程完全一致的子进程,先将数据快照写入临时文件,写入成功后,也就是持久化过程结束之后,用新的RDB文件替换之前的dumb.rdb文件,用二进制压缩存储。 恢复的时候自动将存储的rdb文件直接读入到内存中,RDB持久化过程中,主线程不再进行任何的IO操作,以保证子线程fork数据的一致性,因此,因为子线程,RDB持久化性能更高,RDB持久化适用于大规模的数据恢复,对数据恢复的精度要求不高时,也就是不要求所有的数据都精确的恢复时,RDB比AOF更合适,但是RDB的缺点是最后一次持久化的数据可能会丢失,比如在最后一次持久化的过程中,系统故障,导致最后一次持久化的数据丢失

RDB持久化测策略

可以配置在什么情况,什么时间内触发rdb持久化,以下是默认持久化配置

save 900 1              #在900秒(15分钟)之后,如果至少有1个key发生变化,则dump内存快照。

save 300 10            #在300秒(5分钟)之后,如果至少有10个key发生变化,则dump内存快照。

save 60 10000        #在60秒(1分钟)之后,如果至少有10000个key发生变化,则dump内存快照。

保存快照的方式:save和bgsave,使用save方式,阻塞保存,bgsave后台异步保存

RDB方式的优劣

优势:

  1. 一旦采用该方式,那么你的整个Redis数据库将只包含一个文件,这对于文件备份而言是非常完美的。比如,你可能打算每个小时归档一次最近24小时的数 据,同时还要每天归档一次最近30天的数据。通过这样的备份策略,一旦系统出现灾难性故障,因为可以非常轻松的将一个单独的文件压缩后再转移到其它存储介质上。我们可以非常容易的进行恢复。

  2. 性能高。对于Redis的服务进程而言,在开始持久化时,它唯一需要做的只是fork出子进程,之后再由子进程完成这些持久化的工作,这样就可以极大的避免服务进程执行IO操作了。

  3. 相比于AOF机制,如果数据集很大,RDB的启动效率会更高。

劣势:

  1. 如果你想保证数据的高可用性,即最大限度的避免数据丢失,那么RDB将不是一个很好的选择。因为系统一旦在定时持久化之前出现宕机现象,此前没有来得及写入磁盘的数据都将丢失。

  2. 由于RDB是通过fork子进程来协助完成数据持久化工作的,因此,如果当数据集较大时,可能会导致整个服务器停止服务几百毫秒,甚至是1秒钟。

  3. 如果存在这样一种情况,执行了flushall命令,清除了所有的key数据,刚好满足了rdb的持久化条件,那么这种情况redis也会立即进行持久化,但是这个时候数据已经全部清空了,也就是持久化的数据也是空的,如果这个时候退出,再重启,rdb恢复的所有的数据也是空的

AOF

AOF简介

AOF是以日志的形式,记录服务器处理的所有的写操作,读操作不会记录,用文本的方式记录。恢复的时候,会把记录的每条写操作都执行一遍

AOF持久化策略

appendfsync always     #每次有数据修改发生时都会写入AOF文件。数据完整性好,但是性能低

appendfsync everysec  #每秒钟同步一次,该策略为AOF的默认策略一秒内服务器挂了会有数据丢失

appendfsync no          #从不同步。高效但是数据不会被持久化。

AOF的rewrite机制

当aof日志文件进行不断的写操作追加记录的时候,文件就会越来越大,为了避免这种情况,当文件大小到了某个设定的值时,就会fork一个新线程,进行文件的优化压缩(也是先写成临时文件再覆盖)只保留可以恢复数据的最小指令集,例如 set key1 1 set key1 2 set key1 3......set key1 10000 在进行重写的时候,就会只保留set key1 10000,因为前面的操作对恢复最终数据没有意义。rewrite的触发机制是文件大小是上次重写大小的一倍且文件大小大于64M的时候,这些触发机制都是可以修改的,一般在分布式系统中64m是不够的。可以设置为5g左右

AOF的优劣

优势:

  1. 该机制可以带来更高的数据安全性,记录每条写操作,保证数据持久性。Redis中提供了3中同步策略,即每秒同步、每修改同步和不同步。事实上,每秒同步也是异步完成的。

  2. 由于该机制对日志文件的写入操作采用的是追加模式,因此在写入过程中即使出现宕机现象,也不会破坏日志文件中已经存在的内容。然而如果我们本次操作只是写入了一半数据就出现了系统崩溃问题,在Redis下一次启动之前,我们可以通过redis-check-aof工具来帮助我们解决数据 一致性的问题。

  3. 如果日志过大,Redis可以自动启用rewrite机制。即Redis以append模式不断的将修改数据写入到老的磁盘文件中,同时Redis还会创 建一个新的文件用于记录此期间有哪些修改命令被执行。因此在进行rewrite切换时可以更好的保证数据安全性。

  4. AOF包含一个格式清晰、易于理解的日志文件用于记录所有的修改操作。

劣势

  1. 对于相同数量的数据集而言,AOF文件通常要大于RDB文件。RDB 在恢复大数据集时的速度比 AOF 的恢复速度要快。

  2. 根据同步策略的不同,AOF在运行效率上往往会慢于RDB。总之,每秒同步策略的效率是比较高的,同步禁用策略的效率和RDB一样高效。

RDB和AOF的选择

二者选择的标准,就是看系统是愿意牺牲一些性能,换取更高的缓存一致性(aof),还是愿意写操作频繁的时候,不启用备份来换取更高的性能,待手动运行save的时候,再做备份(rdb)。 另外,AOF和RDB可以共存,当两者同时存在的时候,优先加载AOF进行数据恢复。

原文地址:https://www.cnblogs.com/blackmlik/p/12765655.html