Redis

一简介

1.1概要

redis是一个key-value存储系统。和Memcached类似，它支持存储的value类型相对更多，包括string(字符串)、list(链表)、set(集合)、zset(sorted set --有序集合)和hash（哈希类型）。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作，而且这些操作都是原子性的。在此基础上，redis支持各种不同方式的排序。与memcached一样，为了保证效率，数据都是缓存在内存中。区别的是redis会周期性的把更新的数据写入磁盘或者把修改操作写入追加的记录文件，并且在此基础上实现了master-slave(主从)同步

1.2Redis特点

1. 使用Redis有哪些好处？

(1) 速度快，因为数据存在内存中，类似于HashMap，HashMap的优势就是查找和操作的时间复杂度都是O(1)

(2) 支持丰富数据类型，支持string，list，set，sorted set，hash

(3) 支持事务，操作都是原子性，所谓的原子性就是对数据的更改要么全部执行，要么全部不执行

(4) 丰富的特性：可用于缓存，消息，按key设置过期时间，过期后将会自动删除

2. redis相比memcached有哪些优势？

(1) memcached所有的值均是简单的字符串，redis作为其替代者，支持更为丰富的数据类型

(2) redis的速度比memcached快很多

(3) redis可以持久化其数据

3. redis常见性能问题和解决方案：

(1) Master最好不要做任何持久化工作，如RDB内存快照和AOF日志文件

(2) 如果数据比较重要，某个Slave开启AOF备份数据，策略设置为每秒同步一次

(3) 为了主从复制的速度和连接的稳定性，Master和Slave最好在同一个局域网内

(4) 尽量避免在压力很大的主库上增加从库

(5) 主从复制不要用图状结构，用单向链表结构更为稳定，即：Master <- Slave1 <- Slave2 <- Slave3...

这样的结构方便解决单点故障问题，实现Slave对Master的替换。如果Master挂了，可以立刻启用Slave1做Master，其他不变。

4. MySQL里有2000w数据，redis中只存20w的数据，如何保证redis中的数据都是热点数据

voltile-lru：从已设置过期时间的数据集（server.db[i].expires）中挑选最近最少使用的数据淘汰

volatile-ttl：从已设置过期时间的数据集（server.db[i].expires）中挑选将要过期的数据淘汰

volatile-random：从已设置过期时间的数据集（server.db[i].expires）中任意选择数据淘汰

allkeys-lru：从数据集（server.db[i].dict）中挑选最近最少使用的数据淘汰

allkeys-random：从数据集（server.db[i].dict）中任意选择数据淘汰

no-enviction（驱逐）：禁止驱逐数据

5. Memcache与Redis的区别都有哪些？

1)、存储方式

Memecache把数据全部存在内存之中，断电后会挂掉，数据不能超过内存大小。

Redis有部份存在硬盘上，这样能保证数据的持久性。

2)、数据支持类型

Memcache对数据类型支持相对简单。

Redis有复杂的数据类型。

3），value大小

redis最大可以达到1GB，而memcache只有1MB

6. Redis 常见的性能问题都有哪些？如何解决？

1).Master写内存快照，save命令调度rdbSave函数，会阻塞主线程的工作，当快照比较大时对性能影响是非常大的，会间断性暂停服务，所以Master最好不要写内存快照。

2).Master AOF持久化，如果不重写AOF文件，这个持久化方式对性能的影响是最小的，但是AOF文件会不断增大，AOF文件过大会影响Master重启的恢复速度。Master最好不要做任何持久化工作，包括内存快照和AOF日志文件，特别是不要启用内存快照做持久化,如果数据比较关键，某个Slave开启AOF备份数据，策略为每秒同步一次。

3).Master调用BGREWRITEAOF重写AOF文件，AOF在重写的时候会占大量的CPU和内存资源，导致服务load过高，出现短暂服务暂停现象。

4). Redis主从复制的性能问题，为了主从复制的速度和连接的稳定性，Slave和Master最好在同一个局域网内

7, redis 最适合的场景

Redis最适合所有数据in-momory的场景，虽然Redis也提供持久化功能，但实际更多的是一个disk-backed的功能，跟传统意义上的持久化有比较大的差别，那么可能大家就会有疑问，似乎Redis更像一个加强版的Memcached，那么何时使用Memcached,何时使用Redis呢?

如果简单地比较Redis与Memcached的区别，大多数都会得到以下观点：
、Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，zset，hash等数据结构的存储。
、Redis支持数据的备份，即master-slave模式的数据备份。
、Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。

（1）、会话缓存（Session Cache）

最常用的一种使用Redis的情景是会话缓存（session cache）。用Redis缓存会话比其他存储（如Memcached）的优势在于：Redis提供持久化。当维护一个不是严格要求一致性的缓存时，如果用户的购物车信息全部丢失，大部分人都会不高兴的，现在，他们还会这样吗？

幸运的是，随着 Redis 这些年的改进，很容易找到怎么恰当的使用Redis来缓存会话的文档。甚至广为人知的商业平台Magento也提供Redis的插件。

（2）、全页缓存（FPC）

除基本的会话token之外，Redis还提供很简便的FPC平台。回到一致性问题，即使重启了Redis实例，因为有磁盘的持久化，用户也不会看到页面加载速度的下降，这是一个极大改进，类似PHP本地FPC。

再次以Magento为例，Magento提供一个插件来使用Redis作为全页缓存后端。

此外，对WordPress的用户来说，Pantheon有一个非常好的插件 wp-redis，这个插件能帮助你以最快速度加载你曾浏览过的页面。

（3）、队列

Reids在内存存储引擎领域的一大优点是提供 list 和 set 操作，这使得Redis能作为一个很好的消息队列平台来使用。Redis作为队列使用的操作，就类似于本地程序语言（如Python）对 list 的 push/pop 操作。

如果你快速的在Google中搜索“Redis queues”，你马上就能找到大量的开源项目，这些项目的目的就是利用Redis创建非常好的后端工具，以满足各种队列需求。例如，Celery有一个后台就是使用Redis作为broker，你可以从这里去查看。

（4），排行榜/计数器

Redis在内存中对数字进行递增或递减的操作实现的非常好。集合（Set）和有序集合（Sorted Set）也使得我们在执行这些操作的时候变的非常简单，Redis只是正好提供了这两种数据结构。所以，我们要从排序集合中获取到排名最靠前的10个用户–我们称之为“user_scores”，我们只需要像下面一样执行即可：

当然，这是假定你是根据你用户的分数做递增的排序。如果你想返回用户及用户的分数，你需要这样执行：

ZRANGE user_scores 0 10 WITHSCORES

Agora Games就是一个很好的例子，用Ruby实现的，它的排行榜就是使用Redis来存储数据的，你可以在这里看到。

（5）、发布/订阅

最后（但肯定不是最不重要的）是Redis的发布/订阅功能。发布/订阅的使用场景确实非常多。我已看见人们在社交网络连接中使用，还可作为基于发布/订阅的脚本触发器，甚至用Redis的发布/订阅功能来建立聊天系统！（不，这是真的，你可以去核实）。

Redis提供的所有特性中，我感觉这个是喜欢的人最少的一个，虽然它为用户提供如果此多功能。

1.3支持数据类型

redis={
　　　　k1:'123',　　字符串 string
　　　　k2:[1,2,3,4],　　列表/数组 list
　　　　k3:{1,2,3,4},　　集合 set
　　　　k4:{name:lqz,age:12} ,　　字典/哈希表 zset
　　　　k5:{('lqz',18),('egon',33)} 　　有序集合 hash
}

特点:

可持久化
单线程,单进程

二 Redis的安装和使用

windows下安装:详见链接

详细操作

安装redis模块:pip3 install redis

三 string操作

String操作，redis中的String在在内存中按照一个name对应一个value来存储。如图：

普通连接

import redis
conn = redis.Redis('127.0.0.1',6379)

1.set(name, value, ex=None, px=None, nx=False, xx=False)

在Redis中设置值，默认，不存在则创建，存在则修改
参数：
     ex，过期时间（秒）
     px，过期时间（毫秒）
     nx，如果设置为True，则只有name不存在时，当前set操作才执行,值存在，就修改不了，执行没效果
     xx，如果设置为True，则只有name存在时，当前set操作才执行，值存在才能修改，值不存在，不会设置新值

conn.set('name','zjh')

conn.set('name','zjh')
conn.set('key1','value',ex=5)
conn.setex('token',5,'sadfja23545hfdj')
conn.mset({'k1':'v1','k2':'v2'})  #设置多个值

print(conn.get('name').decode('utf-8'))  #获取值
print(conn.get('key1').decode('utf-8'))
print(conn.get('token').decode('utf-8'))
print(conn.mget({'k1','k2'}))   #批量获取

需要掌握的操作:set get mset mget append incr getrange strlen

四 Hash操作

Hash操作，redis中Hash在内存中的存储格式如下图：

# ******重点
# redis支持5大数据类型,只支持第一层,也就是说字典的value值,必须是字符串
# 如果value值想存字典格式,必须用json转换一下,转成字符串
conn.hset('m1','key2','value2')
conn.hmset('m2',{'key1':'vaule1','key2':'vaule2'})

print(conn.hget('m2','key2'))
print(conn.hmget('m2','key1','key2'))
print(conn.hmget('m2',['key1','key2']))  #与上面的方法取出的值一样
# 取出所有的
print(conn.hgetall('m1'))

print(conn.hlen('m1'))
print(conn.hkeys('m2'))
print(conn.hvals('m2'))
print(conn.hexists('m2','key1333'))

# 删除值
conn.hdel('m2','key1','key2')
# 这样可以
conn.hdel('m2',*['key1','key2'])
# 这样不行
conn.hdel('m2',['key1','key2'])

conn.hmset('m4',{'key4':'1','key5':'vaule2'})
conn.hincrby('m4','key4')
# 应用场景:
#     统计文章阅读数:key是文章id,value是文章阅读数,有一个阅读者,数字加一,固定一个时间,将数据同步到数据库
# hscan_iter
# 问:我redis中字典有10000w条数据,全部打印出来
for i in range(1000):
    conn.hset('m2','key%s'%i,'value%s'%i)
# 指定每次取10条,直到取完
ret=conn.hscan_iter('m2',count=100)
# 不要用这种方式
ret=conn.hgetall('m2')

五 List操作

List操作，redis中的List在在内存中按照一个name对应一个List来存储。如图：

# redis 之列表操作

conn.lpush('l1','12')
conn.lpush('l1','22')

conn.rpush('l1','888')
print(conn.llen('l1'))

# 在12 前面插一个值
conn.linsert('l1','before',12,777)
conn.linsert('l1','after',22,666)
# 索引从0开始
conn.lset('l1',2,'4444')
# 注意参数位置
conn.lrem('l1',-2,22)
print(conn.lindex('l1',5))
# ******列表操作,没有getall这个东西,可以通过切片来获取全部
print(conn.lrange('l1',0,conn.llen('l1')))
# 前闭后闭区间
print(conn.lrange('l1',0,1))

# blpop   重点 如果列表中没有值,会一直hang住(等于将函数挂起),实现简单的分布式
print(conn.blpop('l1',timeout=3))

def scan_list(name,count=2):
    index=0
    while True:
        data_list=conn.lrange(name,index,count+index-1)
        if not data_list:
            return
        index+=count
        for item in data_list:
            yield item

# 管道,实现事务操作
import redis
pool = redis.ConnectionPool(host='10.211.55.4', port=6379)
conn = redis.Redis(connection_pool=pool)
# pipe = r.pipeline(transaction=False)
# 拿到一个管道对象
pipe = conn.pipeline(transaction=True)
# 开启一次执行多条命令
pipe.multi()
pipe.set('name', 'lqz')
pipe.set('role', 'teacher')
# 直接执行上面所有命令
pipe.execute()