面试之Redis

面:缓存中间件——Memcached和Redis的区别是什么?

答:Memcached的优点是简单易用,代码层次类似与Hash。支持简单数据类型,但不支持数据持久化存储,也不支持主从同步,也不支持分片。Redis的数据类型丰富,支持数据磁盘持久化存储,支持主从,支持分片。

面:为什么Redis能这么快?(100000+QPS)

  • 完全基于内存,不受限于磁盘I/O,绝大部分请求是纯粹的内存操作,执行效率高
  • 数据结构简单,对数据操作也简单(不使用表,存储结构就是键值对)
  • 采用单线程(主线程,多个线程对同一个键做写操作的时候,不会出现并发问题,避免了上下文的切换和锁竞争),单线程也能处理高并发请求,想多核也可以启动多实例
  • 使用多路I/O复用模型,非阻塞IO

面:说说你用过的Redis的数据类型?

  • String:最基本的数据类型,二进制安全
  • Hash:String元素组成的字典,适合用于存储对象
  • List:列表,按照String元素插入顺序排序
  • Set:String元素组成的无序集合,通过哈希表实现,不允许重复
  • Sorted Set(ZSet):通过分数来为集合中的成员进行从小到大的排序
  • 用于计数的HyperLogLog,用于支持存储地理位置信息的Geo

Redis底层数据类型基础:

  1. 简单动态字符串
  2. 链表
  3. 字典
  4. 跳跃表
  5. 整数集合
  6. 压缩列表
  7. 对象

面:如何从海量Key里查询出某一固定前缀的Key?

答:若使用KEYS pattern:查找出所有符合给定模式patter的key,会对使线上的业务造成卡顿(主要是一次性返回所有的满足条件的key),此时可以使用SCAN指令(SCAN cursor [MATCH pattern] [COUNT count])无阻塞的返回一定数量的key(它是基于游标的迭代器,需要基于上一次的游标延续之前的迭代过程;以0作为游标开始一次新的迭代,直到命令返回游标0完成一次遍历;不保证每次执行都返回某个给定数量的元素,支持模糊查询。)

面:如何通过Redis实现简单的分布式锁?

分布式锁需要解决的问题:互斥性(任意时刻只能有一个客户端获取锁),安全性(锁只能由持有该锁的客户端释放),死锁(持有锁的客户端宕机后,无法释放锁,导致其他客户端无法获取到该锁导致的死锁),容错(当某些客户端宕机后,其他客户端也要能获取锁和释放锁)

答:缺陷方案:首先可以通过Redis命令SETNX key value(原子性的,如果可以不存在,则创建并赋值,时间复杂度O(1),设置成功返回1,失败返回0),若能设置成功则说明此时没有别的线程进入了临界区。若失败,则表明该资源已经被其他线程所占用了,所以需要一直等待,直到SETNX返回1即其他线程设置的key过期了(EXPIRE key seconds)。但是上述方案有个缺点:即SETNX 和 EXPIRE的复合操作不是原子性的,若某个线程执行完SETNX突然挂掉了,那么由于没有执行EXPIRE操作,那么独占资源就一直不能被其他线程所占用。

优秀方案:上述方案之所以有缺陷,是因为原子性没有得到满足,所以可以通过以下命令SET key value [EX secods] [PX milliseconds] [NX|XX](这条命令就是同时满足SETNX和EXPIRE,SET操作成功时返回OK,否则返回nil)此条命令是原子操作。

面:如果有大量的Key同时过期,那么需要注意什么?

集中过期,由于清除大量的key会耗时,会出现短暂的卡顿现象。解决方案是在设置key的过期时间时,给每个key加上随机值,使得过期时间分散些。

面:如何使用Redis做异步队列?

答:使用List作为队列,RPUSH生产消息,LPOP消费消息。但是LPOP不会等待队列有值才消费它会一直尝试消费,可以同过引入Sleep机制调用LPOP重试。也可通过命令BLPOP key [key...] timeout(阻塞直到队列有消息或者超时)。缺点是:只能供一个消费者消费。如果要让多个消费者消费,就可以使用Redis里的pub/sub(主题订阅者模式),但是消息的发布是无状态的,无法保证可达(要解决这个问题,就需要使用专业的队列Kafka)。

面:Redis如何做持久化?

  • RDB(快照)持久化:保存某个时间点的全量数据快照
    • SAVE命令:阻塞Redis的服务器进程,直到RDB文件被创建完毕
    • BGSAVE命令:Fork出一个子进程来创建RDB文件,不阻塞服务器进程
    • 缺点是:由于是内存数据的全量同步,那么当数据量大时会由于I/O而严重影响性能;可能会因为Redis挂掉而丢失从当前至最近一次快照期间的数据
  • AOF(Append-Only-File)持久化:保存写状态。记录除了查询以外的所有变更数据库状态的指令,以append的形式追加保存到AOF文件中(增量)

面:如何解决AOF文件大小不断增大的问题?

答:可以采取日志重写的方式,原理如下:

  1. 调用fork(),创建一个子进程
  2. 子进程把新的AOF写到一个临时文件里,不依赖原来的AOF文件
  3. 主进程持续将新的变动同时写到内存和原来的AOF里(防止重写失败,保证数据的完整性)
  4. 主进程获取子进程重写AOF的完成信号往新AOF同步增量变动
  5. 使用新的AOF文件替换掉旧的AOF文件

面:当RDB和AOF文件共存的情况下,如何恢复Redis的数据?

面:谈谈RDB和AOF的优缺点?

  • RDB优点:全量数据快照,文件小,恢复快
  • RDB缺点:无法保存最近一次快照之后的数据
  • AOF优点:可读性高,适合保存增量数据,数据不易丢失
  • AOF缺点:文件体积大,恢复时间长

RDB-AOF混合持久化方式:BGSAVE做镜像全量持久化,AOF做增量持久化。

面:如何从海量数据里快速找到所需要的数据?

答:使用分片:按照某种规则去划分数据,使数据分散存储在多个节点上。并且Redis为了能够提高key的命中率,采用的是一致性hash算法(一致性hash算法:对2^32取模将hash值空间组织成虚拟的圆环,将数据key使用相同的hash函数计算出hash值,引入虚拟节点解决数据倾斜)。

参考资料

慕课网 剑指Java面试-Offer直通车

原文地址:https://www.cnblogs.com/yunche/p/10546628.html