Redis面试题

1.Redis支持哪几种数据类型?

支持多种类型的数据结构

1.string:最基本的数据类型,二进制安全的字符串,最大512M。

2.list:按照添加顺序保持顺序的字符串列表。

3.set:无序的字符串集合,不存在重复的元素。

4.sorted set:已排序的字符串集合。

5.hash:key-value对的一种集合。

 

2.Redis主要有哪些功能?

  1.哨兵(Sentinel)和复制(Replication)

  Redis服务器毫无征兆的罢工是个麻烦事,如何保证备份的机器是原始服务器的完整备份呢?这时候就需要哨兵和复制。

  哨兵Sentinel可以管理多个Redis服务器,它提供了监控,提醒以及自动的故障转移的功能,Replication则是负责让一个Redis服务器可以配备多个备份的服务器。

  Redis也是利用这两个功能来保证Redis的高可用的。

  2.事务

  很多情况下我们需要一次执行不止一个命令,而且需要其同时成功或者失败。redis对事务的支持也是源自于这部分需求,即支持一次性按顺序执行多个命令的能力,并保证其原子性。

  3.LUA脚本

  在事务的基础上,如果我们需要在服务端一次性的执行更复杂的操作(包含一些逻辑判断),则lua就可以排上用场了。

  4.持久化

  redis的持久化指的是redis会把内存的中的数据写入到硬盘中,在redis重新启动的时候加载这些数据,从而最大限度的降低缓存丢失带来的影响。

  5.集群(Cluster)

  单台服务器资源的总是有上限的,CPU资源和IO资源我们可以通过主从复制,进行读写分离,把一部分CPU和IO的压力转移到从服务器上,这也有点类似mysql数据库的主从同步。

 

3.Redis是单进程单线程的?

  Redis是单进程单线程的,Redis利用队列技术将并发访问变为串行访问,消除了传统数据库串行控制的开销。

 

4.Redis为什么是单线程的?

  多线程处理会涉及到锁,而且多线程处理会涉及到线程切换而消耗CPU。因为CPU不是Redis的瓶颈,Redis的瓶颈最有可能是机器内存或者网络带宽。单线程无法发挥多核CPU性能,不过可以通过在单机开多个Redis实例来解决。

  其它开源软件采用的模型

  Nginx:多进程单线程模型

  Memcached:单进程多线程模型

 

5.使用Redis的优势?

  1.速度快,因为数据存在内存中,类似于HashMap,HashMap的优势就是查找和操作的时间复杂度都是O(1)

  2.支持丰富数据类型,支持string,list,set,sorted set,hash

  3.支持事务,操作都是原子性,所谓的原子性就是对数据的更改要么全部执行,要么全部不执行

  4.丰富的特性:可用于缓存,消息,按key设置过期时间,过期后将会自动删除

 

6.Redis单点吞吐量

  官方数据给出的最新硬件单点TPS达到8万/秒,QPS达到10万/秒,但是也跟具体数据有关,只是实验数据。

 

7.Redis相比memcached有哪些优势?

  1.memcached所有的值均是简单的字符串,Redis作为其替代者,支持更为丰富的数据类型

  2.Redis的速度比memcached快很多

  3.Redis可以持久化其数据

  4.Redis支持数据的备份,即master-slave模式的数据备份。

 

8.Redis有哪几种数据淘汰策略?

  在Redis中,允许用户设置最大使用内存大小server.maxmemory,当Redis 内存数据集大小上升到一定大小的时候,就会施行数据淘汰策略。

  1.volatile-lru:从已设置过期的数据集中挑选最近最少使用的淘汰

  2.volatile-ttr:从已设置过期的数据集中挑选将要过期的数据淘汰

  3.volatile-random:从已设置过期的数据集中任意挑选数据淘汰

  4.allkeys-lru:从数据集中挑选最近最少使用的数据淘汰

  5.allkeys-random:从数据集中任意挑选数据淘汰

  6.noenviction:禁止淘汰数据

  redis淘汰数据时还会同步到aof

 

9.Redis集群方案应该怎么做?都有哪些方案?

  1.twemproxy

  2.codis,目前用的最多的集群方案,基本和twemproxy一致的效果,但它支持在 节点数量改变情况下,旧节点数据可恢复到新hash节点。

  3.Redis cluster3.0自带的集,特点在于他的分布式算法不是一致性hash,而是hash槽的概念,以及自身支持节点设置从节点。

 

10.Redis读写分离模型

  通过增加Slave DB的数量,读的性能可以线性增长。为了避免Master DB的单点故障,集群一般都会采用两台Master DB做双机热备,所以整个集群的读和写的可用性都非常高。

  读写分离架构的缺陷在于,不管是Master还是Slave,每个节点都必须保存完整的数据,如果在数据量很大的情况下,集群的扩展能力还是受限于单个节点的存储能力,而且对于Write-intensive类型的应用,读写分离架构并不适合。

 

11.Redis数据分片模型

  为了解决读写分离模型的缺陷,可以将数据分片模型应用进来。

  可以将每个节点看成都是独立的master,然后通过业务实现数据分片。

  结合上面两种模型,可以将每个master设计成由一个master和多个slave组成的模型。

 

12.Redis提供了哪几种持久化方式?

  RDB持久化方式能够在指定的时间间隔能对你的数据进行快照存储

  AOF持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF命令以Redis协议追加保存每次写的操作到文件末尾.Redis还能对AOF文件进行后台重写,使得AOF文件的体积不至于过大.

  如果你只希望你的数据在服务器运行的时候存在,你也可以不使用任何持久化方式.

  你也可以同时开启两种持久化方式, 在这种情况下, 当Redis重启的时候会优先载入AOF文件来恢复原始的数据,因为在通常情况下AOF文件保存的数据集要比RDB文件保存的数据集要完整.

  最重要的事情是了解RDB和AOF持久化方式的不同,让我们以RDB持久化方式开始。

  如何选择合适的持久化方式?

  1.Redis主要提供了两种持久化机制:RDB和AOF

  2.RDB

  默认开启,会按照配置的指定时间将内存中的数据快照到磁盘中,创建一个dump.rdb文件,Redis启动时再恢复到内存中。

  Redis会单独创建fork()一个子进程,将当前父进程的数据库数据复制到子进程的内存中,然后由子进程写入到临时文件中,持久化的过程结束了,再用这个临时文件替换上次的快照文件,然后子进程退出,内存释放。

  需要注意的是,每次快照持久化都会将主进程的数据库数据复制一遍,导致内存开销加倍,若此时内存不足,则会阻塞服务器运行,直到复制结束释放内存;都会将内存数据完整写入磁盘一次,所以如果数据量大的话,而且写操作频繁,必然会引起大量的磁盘I/O操作,严重影响性能,并且最后一次持久化后的数据可能会丢失;

  3.AOF

  以日志的形式记录每个写操作(读操作不记录),只需追加文件但不可以改写文件,Redis启动时会根据日志从头到尾全部执行一遍以完成数据的恢复工作。包括flushDB也会执行。

  主要有两种方式触发:有写操作就写、每秒定时写(也会丢数据)。

  因为AOF采用追加的方式,所以文件会越来越大,针对这个问题,新增了重写机制,就是当日志文件大到一定程度的时候,会fork出一条新进程来遍历进程内存中的数据,每条记录对应一条set语句,写到临时文件中,然后再替换到旧的日志文件(类似rdb的操作方式)。默认触发是当aof文件大小是上次重写后大小的一倍且文件大于64M时触发。

  当两种方式同时开启时,数据恢复Redis会优先选择AOF恢复。一般情况下,只要使用默认开启的RDB即可,因为相对于AOF,RDB便于进行数据库备份,并且恢复数据集的速度也要快很多。

  开启持久化缓存机制,对性能会有一定的影响,特别是当设置的内存满了的时候,更是下降到几百reqs/s。所以如果只是用来做缓存的话,可以关掉持久化。

 

13.Redis常见性能问题和解决方案?

  (1) Master最好不要做任何持久化工作,如RDB内存快照和AOF日志文件

  (2) 如果数据比较重要,某个Slave开启AOF备份数据,策略设置为每秒同步一次

  (3) 为了主从复制的速度和连接的稳定性,Master和Slave最好在同一个局域网内

  (4) 尽量避免在压力很大的主库上增加从库

  (5) 主从复制不要用图状结构,用单向链表结构更为稳定,即:Master <- Slave1 <- Slave2 <- Slave3...

  这样的结构方便解决单点故障问题,实现Slave对Master的替换。如果Master挂了,可以立刻启用Slave1做Master,其他不变。

 

14.Redis哈希槽的概念?

  Redis集群没有使用一致性hash,而是引入了哈希槽的概念,当需要在 Redis 集群中放置一个 key-value 时,根据 CRC16(key) mod 16384的值,决定将一个key放到哪个桶中。

 

15.Redis集群最大节点个数是多少?

  Redis集群预分好16384个桶(哈希槽)

 

16.Redis集群会有写操作丢失吗?为什么?

  Redis并不能保证数据的强一致性,这意味这在实际中集群在特定的条件下可能会丢失写操作。

 

17.Redis集群之间是如何复制的?

异步复制

 

18.Redis如何做内存优化?

  该尽可能的将你的数据模型抽象到一个散列表里面。比如你的web系统中有一个用户对象,不要为这个用户的名称,姓氏,邮箱,密码设置单独的key,而是应该把这个用户的所有信息存储到一张散列表里面.

尽量key值不要太长,容易占用内存。

 

19.Redis回收进程如何工作的?

  一个客户端运行了新的命令,添加了新的数据。

  Redis检查内存使用情况,如果大于maxmemory的限制, 则根据设定好的策略进行回收。

 

20.Redis回收使用的是什么算法?

LRU算法

 

21.Redis有哪些适合的场景?

  1)Session共享(单点登录)

  2)页面缓存

  3)队列

  4)排行榜/计数器

  5)发布/订阅

 

22.Redis为什么是key,value的,为什么不是支持SQL的?

  选择key-value的原因:key-value简单粗暴,使用方便?效率更佳?
  为什么不支持sql:
  因为redis的内存模型是一个hashtable,不使用表来存储数据,也不会预定义或强制要求用户对redis储存的不同数据进行关联。

 

23.Redis是多线程还是单线程?

  redis中io多路复用器模块是单线程执行,事件处理器也是单线程执行,两个线程不一样。所以实际redis应该是单进程多线程,只是不同的模块都用的单线程实现。

  两个维度来举例:

  (1)若是client发送命令到server的话,server处理命令是单线程逐条进行的。

  (2)server内部可以是多线程的,比如aof持久化,假设策略每秒,那就是再单独开启一个线程去执行aof文件持久化操作,这就是多线程了。

 

24.Redis的持久化开启了RDB和AOF下重启服务是如何加载的?

  优先AOF,AOF没找到的话再找RDB,因为AOF文件的数据要全于RDB。

 

25.Redis如果做集群该如何规划?AKF/CAP如何实现和设计?

  参考redis各种部署方式的优缺点来决定。

  如果希望快速部署,那么可以考虑单节点部署方式。

  如果只需要考虑可靠性,那么可以考虑主从复制模式。

  如果想要保证高可用,不需要考虑储存成本可以考虑哨兵模式。

  如果想提高集群的扩展性和可用性,不要求保证数据的强一致性,且没有批量操作,那么可以考虑集群模式。

 

26.10万用户一年365天的登录情况如何用redis存储,并快速检索任意时间窗内的活跃用户?

Bitmap

 

27.Redis的5种Value类型你用过几种,能举例吗?

string、list、set、sorted_set、hash

string:int、raw、embstr

list:ziplist、linkedlist

hash:ziplist、hashtable

set:intset、hashtable

sorted set:ziplist、skiplist+dict

 

28.一个Redis实例最多能存放多少的keys?

  List、Set、Sorted Set他们最多能存放多少元素?理论上Redis可以处理多达232的keys,并且在实际中进行了测试,每个实例至少存放了2亿5千万的keys。我们正在测试一些较大的值。任何list、set、和sorted set都可以放232个元素。换句话说,Redis的存储极限是系统中的可用内存值。

 

29.如何做内存优化

  尽量使用整数对象以节省内存。有共享空间,比较节约内存。但是开始maxmemroy和LRU后,对象池无效。因为怕LRU字段被共享清除。

  尽可能使用散列表(hashes),散列表(是说散列表里面存储的数少)使用的内存非常小,所以你应该尽可能的将你的数据模型抽象到一个散列表里面。比如你的web系统中有一个用户对象,不要为这个用户的名称,姓氏,邮箱,密码设置单独的key,而是应该把这个用户的所有信息存储到一张散列表里面。不过要控制哈希在ziplist和 hashtable两种内部编码的转换,hashtable会消耗更多内存。

30.Redis常见性能问题和解决方案?

(1) Master最好不要做任何持久化工作,如RDB内存快照和AOF日志文件

(2) 如果数据比较重要,某个Slave开启AOF备份数据,策略设置为每秒同步一次

(3) 为了主从复制的速度和连接的稳定性,Master和Slave最好在同一个局域网内

(4) 尽量避免在压力很大的主库上增加从库

(5) 主从复制不要用图状结构,用单向链表结构更为稳定,即:Master <- Slave1 <- Slave2 <- Slave3...

  这样的结构方便解决单点故障问题,实现Slave对Master的替换。如果Master挂了,可以立刻启用Slave1做Master,其他不变。

 

31.Redis回收进程如何工作?

  一个客户端运行了新的命令,添加了新的数据。

  Redi检查内存使用情况,如果大于maxmemory的限制, 则根据设定好的策略进行回收。

 

32.Redis 和 Mysql 的数据不一致怎么办

采用延时双删策略

第二个删redis。如果删除了缓存Redis,还没有来得及写库MySQL,另一个线程就来读取,发现缓存为空,则去数据库中读取数据写入缓存,此时缓存中为脏数据。

第一个删redis。如果先写了库,在删除缓存前,写库的线程宕机了,没有删除掉缓存,则也会出现数据不一致情况。

public void use(String key, Object data){
    redis.delKey(key);
    db.updateData(data);
    Thread.sleep(800);
    redis.delKey(key);
}

1) 先淘汰缓存

2) 再写数据库(这两步和原来一样)

3) 休眠800ms,再次淘汰缓存

这么做,可以将800ms内所造成的缓存脏数据,再次删除。

 

  32.项目中有没有用Redis事务

  采用的是Redis Cluster集群架构,不同的key是有可能分配在不同的Redis节点上的,在这种情况下Redis的事务机制是不生效的。其次,Redis事务不支持回滚操作,所以基本不用!

 

  33.Redis关于线程安全问题

  redis实际上是采用了线程封闭的观念,把任务封闭在一个线程,自然避免了线程安全问题,不过对于需要依赖多个redis操作的复合操作来说,依然需要锁,而且有可能是分布式锁。

 

  34.为什么要做Redis分区?

  分区可以让Redis管理更大的内存,Redis将可以使用所有机器的内存。如果没有分区,你最多只能使用一台机器的内存。分区使Redis的计算能力通过简单地增加计算机得到成倍提升,Redis的网络带宽也会随着计算机和网卡的增加而成倍增长。

 

  35.Redis分区有什么缺点?

  涉及多个key的操作通常不会被支持。例如你不能对两个集合求交集,因为他们可能被存储到不同的Redis实例(实际上这种情况也有办法,但是不能直接使用交集指令)。

  同时操作多个key,则不能使用Redis事务.

  分区使用的粒度是key,不能使用一个非常长的排序key存储一个数据集(The partitioning granularity is the key, so it is not possible to shard a dataset with a single huge key like a very big sorted set)

  当使用分区的时候,数据处理会非常复杂,例如为了备份你必须从不同的Redis实例和主机同时收集RDB / AOF文件。

  分区时动态扩容或缩容可能非常复杂。Redis集群在运行时增加或者删除Redis节点,能做到最大程度对用户透明地数据再平衡,但其他一些客户端分区或者代理分区方法则不支持这种特性。然而,有一种预分片的技术也可以较好的解决这个问题。

 

  36.什么是RedLock

  Redis 官方站提出了一种权威的基于 Redis 实现分布式锁的方式名叫 Redlock,此种方式比原先的单节点的方法更安全。它可以保证以下特性:

安全特性:互斥访问,即永远只有一个 client 能拿到锁

避免死锁:最终 client 都可能拿到锁,不会出现死锁的情况,即使原本锁住某资源的 client crash 了或者出现了网络分区

容错性:只要大部分 Redis 节点存活就可以正常提供服务

 

  37.假如Redis里面有1亿个key,其中有10w个key是以某个固定的已知的前缀开头的,如果将它们全部找出来?

  使用keys指令可以扫出指定模式的key列表。

  对方接着追问:如果这个redis正在给线上的业务提供服务,那使用keys指令会有什么问题?

  这个时候你要回答redis关键的一个特性:redis的单线程的。keys指令会导致线程阻塞一段时间,线上服务会停顿,直到指令执行完毕,服务才能恢复。这个时候可以使用scan指令,scan指令可以无阻塞的提取出指定模式的key列表,但是会有一定的重复概率,在客户端做一次去重就可以了,但是整体所花费的时间会比直接用keys指令长。

 

  38.缓存降级

  当访问量剧增、服务出现问题(如响应时间慢或不响应)或非核心服务影响到核心流程的性能时,仍然需要保证服务还是可用的,即使是有损服务。系统可以根据一些关键数据进行自动降级,也可以配置开关实现人工降级。

  缓存降级的最终目的是保证核心服务可用,即使是有损的。而且有些服务是无法降级的(如加入购物车、结算)。

  在进行降级之前要对系统进行梳理,看看系统是不是可以丢卒保帅;从而梳理出哪些必须誓死保护,哪些可降级;比如可以参考日志级别设置预案:

    • 一般:比如有些服务偶尔因为网络抖动或者服务正在上线而超时,可以自动降级;
    • 警告:有些服务在一段时间内成功率有波动(如在95~100%之间),可以自动降级或人工降级,并发送告警;
    • 错误:比如可用率低于90%,或者数据库连接池被打爆了,或者访问量突然猛增到系统能承受的最大阀值,此时可以根据情况自动降级或者人工降级;
    • 严重错误:比如因为特殊原因数据错误了,此时需要紧急人工降级。

  服务降级的目的,是为了防止Redis服务故障,导致数据库跟着一起发生雪崩问题。因此,对于不重要的缓存数据,可以采取服务降级策略,例如一个比较常见的做法就是,Redis出现问题,不去数据库查询,而是直接返回默认值给用户。

作者:小家电维修

相见有时,后会无期。

原文地址:https://www.cnblogs.com/lizexiong/p/14629578.html