Redis为什么是单线程

转自：https://www.zhihu.com/question/23162208 https://www.zhihu.com/question/55818031；加了一些个人的理解。

Redis为什么是单线程的？（注：并不是说redis内部只有一个线程，而是说执行同步队列中的命令对象是统一由一个线程来poll的，但是和客户端的交互是可以为多线程）

因为CPU不是Redis的瓶颈。Redis的瓶颈最有可能是机器内存或者网络带宽。（以上主要来自官方FAQ）既然单线程容易实现，而且CPU不会成为瓶颈，那就顺理成章地采用单线程的方案了。关于redis的性能，官方网站也有，普通笔记本轻松处理每秒几十万的请求，参见：How fast is Redis?

如果万一CPU成为你的Redis瓶颈了，或者，你就是不想让服务器其他核闲置，那怎么办？（注：因为一个redis里key不能重复，因此一般来说有多少个应用需要redis就可以开启多少个redis进程，或者每个key都应该有对应的应用后缀和ops后缀；或者通过select每个模块都选择不同的库但需要自己记录好index对应的模块名）

那也很简单，你多起几个Redis进程就好了。Redis是keyvalue数据库，又不是关系数据库，数据之间没有约束。只要客户端分清哪些key放在哪个Redis进程上就可以了。redis-cluster可以帮你做的更好。

单线程可以处理高并发请求吗？

当然可以了，Redis都实现了。

有一点概念需要澄清，并发并不是并行。

（相关概念：并发性I/O流，意味着能够让一个计算单元来处理来自多个客户端的流请求。并行性，意味着服务器能够同时执行几个事情，具有多个计算单元）

Redis总体快速的原因：

采用队列模式将并发访问变为串行访问（？）（注：这里个人认为是的，之前自己写了个日志系统也是采用命令队列的形式，每次log都是提交一个日志命令，然后由单独的线程对此队列poll，如果poll为null，这wait，而每次log都会notifyAll唤醒此线程去poll命令执行）

单线程指的是网络请求模块使用了一个线程（所以不需考虑并发安全性），其他模块仍用了多个线程。（注：这里个人不认可，redis是可以同时和多个客户端打交道的，因此网络请求是可以为多线程或线程池，不过redis的命令队列是同步队列[有点像java的vector]，然后由一个单独的线程从这个队列里poll 命令/事务并执行）

总体来说快速的原因如下：

1）绝大部分请求是纯粹的内存操作（非常快速）

2）采用单线程,避免了不必要的上下文切换和竞争条件（注：指获取命令或事务并执行的线程，执行完后获得的结果将提供给线程池中和客户的连接的socket/socketchannel对象去返回，包括返回错误消息或成功消息或返回值）

3）非阻塞IO（注：tcp通信方面，对于java可以理解为用的是nio）

内部实现采用epoll，采用了epoll+自己实现的简单的事件框架。epoll中的读、写、关闭、连接都转化成了事件，然后利用epoll的多路复用特性，绝不在io上浪费一点时间

这3个条件不是相互独立的，特别是第一条，如果请求都是耗时的，采用单线程吞吐量及性能可想而知了。应该说redis为特殊的场景选择了合适的技术方案。

======

1. Redis服务端是个单线程的架构，不同的Client虽然看似可以同时保持连接，但发出去的命令是序列化执行的，这在通常的数据库理论下是最高级别的隔离（serialize）
2. 用MULTI/EXEC 来把多个命令组装成一次发送，达到原子性。（注：用了MULTI命令后服务端收到然后对接下来的命令都缓存到一个List里，直到EXEC，然后将这个List作为一个特殊命令offer到命令队列里，命令执行线程将这个List的所有命令一起执行）
3. 用WATCH提供的乐观锁功能，在你EXEC的那一刻，如果被WATCH的键发生过改动，则MULTI到EXEC之间的指令全部不执行，不需要rollback
4. 其他回答中提到的DISCARD指令只是用来撤销EXEC之前被暂存的指令，并不是回滚；（注：MULTI后如果用了discard则会撤销此次MULTI命令并清除之前用于缓存命令的List，此次MULTI结束不需要EXEC；如果在MULTI后提交事务的命令时被redis检测到有错误的命令则redis会提示，那么这时候应该直接discard而不是exec，用后者也是被discard且还会提示操作失败，这里个人有个小疑问，有没有撤销MUTIL中上个命令的cmd指令？）