Redis面试题

1.Redis支持哪几种数据类型？

支持多种类型的数据结构

1.string：最基本的数据类型，二进制安全的字符串，最大512M。

2.list：按照添加顺序保持顺序的字符串列表。

3.set：无序的字符串集合，不存在重复的元素。

4.sorted set：已排序的字符串集合。

5.hash：key-value对的一种集合。

2.Redis主要有哪些功能？

　　1.哨兵（Sentinel）和复制（Replication）

　　Redis服务器毫无征兆的罢工是个麻烦事，如何保证备份的机器是原始服务器的完整备份呢？这时候就需要哨兵和复制。

　　哨兵Sentinel可以管理多个Redis服务器，它提供了监控，提醒以及自动的故障转移的功能，Replication则是负责让一个Redis服务器可以配备多个备份的服务器。

　　Redis也是利用这两个功能来保证Redis的高可用的。

　　2.事务

　　很多情况下我们需要一次执行不止一个命令，而且需要其同时成功或者失败。redis对事务的支持也是源自于这部分需求，即支持一次性按顺序执行多个命令的能力，并保证其原子性。

　　3.LUA脚本

　　在事务的基础上，如果我们需要在服务端一次性的执行更复杂的操作（包含一些逻辑判断），则lua就可以排上用场了。

　　4.持久化

　　redis的持久化指的是redis会把内存的中的数据写入到硬盘中，在redis重新启动的时候加载这些数据，从而最大限度的降低缓存丢失带来的影响。

　　5.集群（Cluster）

　　单台服务器资源的总是有上限的，CPU资源和IO资源我们可以通过主从复制，进行读写分离，把一部分CPU和IO的压力转移到从服务器上，这也有点类似mysql数据库的主从同步。

3.Redis是单进程单线程的？

　　Redis是单进程单线程的，Redis利用队列技术将并发访问变为串行访问，消除了传统数据库串行控制的开销。

4.Redis为什么是单线程的？

　　多线程处理会涉及到锁，而且多线程处理会涉及到线程切换而消耗CPU。因为CPU不是Redis的瓶颈，Redis的瓶颈最有可能是机器内存或者网络带宽。单线程无法发挥多核CPU性能，不过可以通过在单机开多个Redis实例来解决。

　　其它开源软件采用的模型

　　Nginx：多进程单线程模型

　　Memcached：单进程多线程模型

5.使用Redis的优势？

　　1.速度快，因为数据存在内存中，类似于HashMap，HashMap的优势就是查找和操作的时间复杂度都是O(1)

　　2.支持丰富数据类型，支持string，list，set，sorted set，hash

　　3.支持事务，操作都是原子性，所谓的原子性就是对数据的更改要么全部执行，要么全部不执行

　　4.丰富的特性：可用于缓存，消息，按key设置过期时间，过期后将会自动删除

6.Redis单点吞吐量

　　官方数据给出的最新硬件单点TPS达到8万/秒，QPS达到10万/秒，但是也跟具体数据有关，只是实验数据。

7.Redis相比memcached有哪些优势？

　　1.memcached所有的值均是简单的字符串，Redis作为其替代者，支持更为丰富的数据类型

　　2.Redis的速度比memcached快很多

　　3.Redis可以持久化其数据

　　4.Redis支持数据的备份，即master-slave模式的数据备份。

8.Redis有哪几种数据淘汰策略？

　　在Redis中，允许用户设置最大使用内存大小server.maxmemory，当Redis 内存数据集大小上升到一定大小的时候，就会施行数据淘汰策略。

　　1.volatile-lru:从已设置过期的数据集中挑选最近最少使用的淘汰

　　2.volatile-ttr:从已设置过期的数据集中挑选将要过期的数据淘汰

　　3.volatile-random:从已设置过期的数据集中任意挑选数据淘汰

　　4.allkeys-lru:从数据集中挑选最近最少使用的数据淘汰

　　5.allkeys-random:从数据集中任意挑选数据淘汰

　　6.noenviction:禁止淘汰数据

　　redis淘汰数据时还会同步到aof

9.Redis集群方案应该怎么做？都有哪些方案？

　　1.twemproxy

　　2.codis，目前用的最多的集群方案，基本和twemproxy一致的效果，但它支持在节点数量改变情况下，旧节点数据可恢复到新hash节点。

　　3.Redis cluster3.0自带的集，特点在于他的分布式算法不是一致性hash，而是hash槽的概念，以及自身支持节点设置从节点。

10.Redis读写分离模型

　　通过增加Slave DB的数量，读的性能可以线性增长。为了避免Master DB的单点故障，集群一般都会采用两台Master DB做双机热备，所以整个集群的读和写的可用性都非常高。

　　读写分离架构的缺陷在于，不管是Master还是Slave，每个节点都必须保存完整的数据，如果在数据量很大的情况下，集群的扩展能力还是受限于单个节点的存储能力，而且对于Write-intensive类型的应用，读写分离架构并不适合。

11.Redis数据分片模型

　　为了解决读写分离模型的缺陷，可以将数据分片模型应用进来。

　　可以将每个节点看成都是独立的master，然后通过业务实现数据分片。

　　结合上面两种模型，可以将每个master设计成由一个master和多个slave组成的模型。

12.Redis提供了哪几种持久化方式？

　　RDB持久化方式能够在指定的时间间隔能对你的数据进行快照存储

　　AOF持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF命令以Redis协议追加保存每次写的操作到文件末尾.Redis还能对AOF文件进行后台重写,使得AOF文件的体积不至于过大.

　　如果你只希望你的数据在服务器运行的时候存在,你也可以不使用任何持久化方式.

　　你也可以同时开启两种持久化方式, 在这种情况下, 当Redis重启的时候会优先载入AOF文件来恢复原始的数据,因为在通常情况下AOF文件保存的数据集要比RDB文件保存的数据集要完整.

　　最重要的事情是了解RDB和AOF持久化方式的不同,让我们以RDB持久化方式开始。

　　如何选择合适的持久化方式？

　　1.Redis主要提供了两种持久化机制：RDB和AOF

　　2.RDB

　　默认开启，会按照配置的指定时间将内存中的数据快照到磁盘中，创建一个dump.rdb文件，Redis启动时再恢复到内存中。

　　Redis会单独创建fork()一个子进程，将当前父进程的数据库数据复制到子进程的内存中，然后由子进程写入到临时文件中，持久化的过程结束了，再用这个临时文件替换上次的快照文件，然后子进程退出，内存释放。

　　需要注意的是，每次快照持久化都会将主进程的数据库数据复制一遍，导致内存开销加倍，若此时内存不足，则会阻塞服务器运行，直到复制结束释放内存；都会将内存数据完整写入磁盘一次，所以如果数据量大的话，而且写操作频繁，必然会引起大量的磁盘I/O操作，严重影响性能，并且最后一次持久化后的数据可能会丢失；

　　3.AOF

　　以日志的形式记录每个写操作（读操作不记录），只需追加文件但不可以改写文件，Redis启动时会根据日志从头到尾全部执行一遍以完成数据的恢复工作。包括flushDB也会执行。

　　主要有两种方式触发：有写操作就写、每秒定时写（也会丢数据）。

　　因为AOF采用追加的方式，所以文件会越来越大，针对这个问题，新增了重写机制，就是当日志文件大到一定程度的时候，会fork出一条新进程来遍历进程内存中的数据，每条记录对应一条set语句，写到临时文件中，然后再替换到旧的日志文件（类似rdb的操作方式）。默认触发是当aof文件大小是上次重写后大小的一倍且文件大于64M时触发。

　　当两种方式同时开启时，数据恢复Redis会优先选择AOF恢复。一般情况下，只要使用默认开启的RDB即可，因为相对于AOF，RDB便于进行数据库备份，并且恢复数据集的速度也要快很多。

　　开启持久化缓存机制，对性能会有一定的影响，特别是当设置的内存满了的时候，更是下降到几百reqs/s。所以如果只是用来做缓存的话，可以关掉持久化。

13.Redis常见性能问题和解决方案？

　　(1) Master最好不要做任何持久化工作，如RDB内存快照和AOF日志文件

　　(2) 如果数据比较重要，某个Slave开启AOF备份数据，策略设置为每秒同步一次

　　(3) 为了主从复制的速度和连接的稳定性，Master和Slave最好在同一个局域网内

　　(4) 尽量避免在压力很大的主库上增加从库

　　(5) 主从复制不要用图状结构，用单向链表结构更为稳定，即：Master <- Slave1 <- Slave2 <- Slave3...

　　这样的结构方便解决单点故障问题，实现Slave对Master的替换。如果Master挂了，可以立刻启用Slave1做Master，其他不变。

14.Redis哈希槽的概念？

　　Redis集群没有使用一致性hash,而是引入了哈希槽的概念，当需要在 Redis 集群中放置一个 key-value 时，根据 CRC16(key) mod 16384的值，决定将一个key放到哪个桶中。

15.Redis集群最大节点个数是多少？

　　Redis集群预分好16384个桶(哈希槽)

16.Redis集群会有写操作丢失吗？为什么？

　　Redis并不能保证数据的强一致性，这意味这在实际中集群在特定的条件下可能会丢失写操作。

17.Redis集群之间是如何复制的？

异步复制

18.Redis如何做内存优化？

　　该尽可能的将你的数据模型抽象到一个散列表里面。比如你的web系统中有一个用户对象，不要为这个用户的名称，姓氏，邮箱，密码设置单独的key,而是应该把这个用户的所有信息存储到一张散列表里面.

尽量key值不要太长，容易占用内存。

19.Redis回收进程如何工作的？

　　一个客户端运行了新的命令，添加了新的数据。

　　Redis检查内存使用情况，如果大于maxmemory的限制, 则根据设定好的策略进行回收。

20.Redis回收使用的是什么算法？

LRU算法

21.Redis有哪些适合的场景？

　　1）Session共享(单点登录)

　　2）页面缓存

　　3）队列

　　4）排行榜/计数器

　　5）发布/订阅

22.Redis为什么是key，value的，为什么不是支持SQL的？

　　选择key-value的原因：key-value简单粗暴，使用方便？效率更佳？
　　为什么不支持sql：
　　因为redis的内存模型是一个hashtable，不使用表来存储数据，也不会预定义或强制要求用户对redis储存的不同数据进行关联。

23.Redis是多线程还是单线程？

　　redis中io多路复用器模块是单线程执行，事件处理器也是单线程执行，两个线程不一样。所以实际redis应该是单进程多线程，只是不同的模块都用的单线程实现。

　　两个维度来举例：

　　（1）若是client发送命令到server的话，server处理命令是单线程逐条进行的。

　　（2）server内部可以是多线程的，比如aof持久化，假设策略每秒，那就是再单独开启一个线程去执行aof文件持久化操作，这就是多线程了。

24.Redis的持久化开启了RDB和AOF下重启服务是如何加载的？

　　优先AOF，AOF没找到的话再找RDB，因为AOF文件的数据要全于RDB。

25.Redis如果做集群该如何规划？AKF/CAP如何实现和设计？

　　参考redis各种部署方式的优缺点来决定。

　　如果希望快速部署，那么可以考虑单节点部署方式。

　　如果只需要考虑可靠性，那么可以考虑主从复制模式。

　　如果想要保证高可用，不需要考虑储存成本可以考虑哨兵模式。

　　如果想提高集群的扩展性和可用性，不要求保证数据的强一致性，且没有批量操作，那么可以考虑集群模式。

26.10万用户一年365天的登录情况如何用redis存储，并快速检索任意时间窗内的活跃用户？

Bitmap

27.Redis的5种Value类型你用过几种，能举例吗？

string、list、set、sorted_set、hash

string：int、raw、embstr

list：ziplist、linkedlist

hash：ziplist、hashtable

set：intset、hashtable

sorted set：ziplist、skiplist+dict

28.一个Redis实例最多能存放多少的keys？

　　List、Set、Sorted Set他们最多能存放多少元素？理论上Redis可以处理多达232的keys，并且在实际中进行了测试，每个实例至少存放了2亿5千万的keys。我们正在测试一些较大的值。任何list、set、和sorted set都可以放232个元素。换句话说，Redis的存储极限是系统中的可用内存值。

29.如何做内存优化

　　尽量使用整数对象以节省内存。有共享空间，比较节约内存。但是开始maxmemroy和LRU后，对象池无效。因为怕LRU字段被共享清除。

　　尽可能使用散列表（hashes），散列表（是说散列表里面存储的数少）使用的内存非常小，所以你应该尽可能的将你的数据模型抽象到一个散列表里面。比如你的web系统中有一个用户对象，不要为这个用户的名称，姓氏，邮箱，密码设置单独的key,而是应该把这个用户的所有信息存储到一张散列表里面。不过要控制哈希在ziplist和 hashtable两种内部编码的转换，hashtable会消耗更多内存。

30.Redis常见性能问题和解决方案？

(1) Master最好不要做任何持久化工作，如RDB内存快照和AOF日志文件

(2) 如果数据比较重要，某个Slave开启AOF备份数据，策略设置为每秒同步一次

(3) 为了主从复制的速度和连接的稳定性，Master和Slave最好在同一个局域网内

(4) 尽量避免在压力很大的主库上增加从库

(5) 主从复制不要用图状结构，用单向链表结构更为稳定，即：Master <- Slave1 <- Slave2 <- Slave3...

　　这样的结构方便解决单点故障问题，实现Slave对Master的替换。如果Master挂了，可以立刻启用Slave1做Master，其他不变。

31.Redis回收进程如何工作？

　　一个客户端运行了新的命令，添加了新的数据。

　　Redi检查内存使用情况，如果大于maxmemory的限制, 则根据设定好的策略进行回收。

32.Redis 和 Mysql 的数据不一致怎么办

采用延时双删策略

第二个删redis。如果删除了缓存Redis，还没有来得及写库MySQL，另一个线程就来读取，发现缓存为空，则去数据库中读取数据写入缓存，此时缓存中为脏数据。

第一个删redis。如果先写了库，在删除缓存前，写库的线程宕机了，没有删除掉缓存，则也会出现数据不一致情况。

public void use(String key, Object data){
    redis.delKey(key);
    db.updateData(data);
    Thread.sleep(800);
    redis.delKey(key);
}

1) 先淘汰缓存

2) 再写数据库（这两步和原来一样）

3) 休眠800ms，再次淘汰缓存

这么做，可以将800ms内所造成的缓存脏数据，再次删除。

　　32.项目中有没有用Redis事务

　　采用的是Redis Cluster集群架构，不同的key是有可能分配在不同的Redis节点上的，在这种情况下Redis的事务机制是不生效的。其次，Redis事务不支持回滚操作，所以基本不用！

　　33.Redis关于线程安全问题

　　redis实际上是采用了线程封闭的观念，把任务封闭在一个线程，自然避免了线程安全问题，不过对于需要依赖多个redis操作的复合操作来说，依然需要锁，而且有可能是分布式锁。

　　34.为什么要做Redis分区？

　　分区可以让Redis管理更大的内存，Redis将可以使用所有机器的内存。如果没有分区，你最多只能使用一台机器的内存。分区使Redis的计算能力通过简单地增加计算机得到成倍提升，Redis的网络带宽也会随着计算机和网卡的增加而成倍增长。

　　35.Redis分区有什么缺点？

　　涉及多个key的操作通常不会被支持。例如你不能对两个集合求交集，因为他们可能被存储到不同的Redis实例（实际上这种情况也有办法，但是不能直接使用交集指令）。

　　同时操作多个key,则不能使用Redis事务.

　　分区使用的粒度是key，不能使用一个非常长的排序key存储一个数据集（The partitioning granularity is the key, so it is not possible to shard a dataset with a single huge key like a very big sorted set）

　　当使用分区的时候，数据处理会非常复杂，例如为了备份你必须从不同的Redis实例和主机同时收集RDB / AOF文件。

　　分区时动态扩容或缩容可能非常复杂。Redis集群在运行时增加或者删除Redis节点，能做到最大程度对用户透明地数据再平衡，但其他一些客户端分区或者代理分区方法则不支持这种特性。然而，有一种预分片的技术也可以较好的解决这个问题。

　　36.什么是RedLock

　　Redis 官方站提出了一种权威的基于 Redis 实现分布式锁的方式名叫 Redlock，此种方式比原先的单节点的方法更安全。它可以保证以下特性：

安全特性：互斥访问，即永远只有一个 client 能拿到锁

避免死锁：最终 client 都可能拿到锁，不会出现死锁的情况，即使原本锁住某资源的 client crash 了或者出现了网络分区

容错性：只要大部分 Redis 节点存活就可以正常提供服务

　　37.假如Redis里面有1亿个key，其中有10w个key是以某个固定的已知的前缀开头的，如果将它们全部找出来？

　　使用keys指令可以扫出指定模式的key列表。

　　对方接着追问：如果这个redis正在给线上的业务提供服务，那使用keys指令会有什么问题？

　　这个时候你要回答redis关键的一个特性：redis的单线程的。keys指令会导致线程阻塞一段时间，线上服务会停顿，直到指令执行完毕，服务才能恢复。这个时候可以使用scan指令，scan指令可以无阻塞的提取出指定模式的key列表，但是会有一定的重复概率，在客户端做一次去重就可以了，但是整体所花费的时间会比直接用keys指令长。

　　38.缓存降级

　　当访问量剧增、服务出现问题（如响应时间慢或不响应）或非核心服务影响到核心流程的性能时，仍然需要保证服务还是可用的，即使是有损服务。系统可以根据一些关键数据进行自动降级，也可以配置开关实现人工降级。

　　缓存降级的最终目的是保证核心服务可用，即使是有损的。而且有些服务是无法降级的（如加入购物车、结算）。

　　在进行降级之前要对系统进行梳理，看看系统是不是可以丢卒保帅；从而梳理出哪些必须誓死保护，哪些可降级；比如可以参考日志级别设置预案：

- 一般：比如有些服务偶尔因为网络抖动或者服务正在上线而超时，可以自动降级；
- 警告：有些服务在一段时间内成功率有波动（如在95~100%之间），可以自动降级或人工降级，并发送告警；
- 错误：比如可用率低于90%，或者数据库连接池被打爆了，或者访问量突然猛增到系统能承受的最大阀值，此时可以根据情况自动降级或者人工降级；
- 严重错误：比如因为特殊原因数据错误了，此时需要紧急人工降级。

　　服务降级的目的，是为了防止Redis服务故障，导致数据库跟着一起发生雪崩问题。因此，对于不重要的缓存数据，可以采取服务降级策略，例如一个比较常见的做法就是，Redis出现问题，不去数据库查询，而是直接返回默认值给用户。

作者：小家电维修

相见有时，后会无期。