NoSQL之Redis学习笔记

一、NoSQL与Redis

1、什么是NoSQL?

NoSQL=Not Only SQL ，泛指非关系型数据库。随着互联网的兴起，传统的关系型数据库已经暴露了很多问题，NoSQL数据库的产生就是为了解决超大规模数据带来的应用难题。

2、NoSQL有哪些优势

1>. 易扩展

NoSQL数据库种类繁多，但都有一个共同特点就是去掉了关系型数据库的关系型特性。数据之间无关系，这样就非常容易扩展。也无形之间，在架构的层面上带来了可扩展能力。

2>.高性能

NoSQL数据库都具有非常高的读写性能，尤其在大数据量下，同样表现优秀。这得益于它的无关系性，数据库结构简单。一般MySQL使用Query Cache，每次表的更新Cache就失败，是一种大粒度的Cache，性能不高，而NoSQL是记录级的，是一种细粒度的Cache。

3、NoSQL数据库的四大分类

KV键值　　memcache redis
文档型数据库　　mongoDB
列式存储 HBase
图关系数据库 Neo4J

4、分布式存储系统的CAP原则

C：Consistency　　强一致性

A：Availability　　高可用性

P：Partition tolerance 分区容错性

CAP理论是指在分布式存储系统中，最多只能实现上面两点，而由于当前的网络问题肯定会出现延迟丢包等问题，所以分区容错性是必须要保证的，我们只能在一致性和可用性之间进行权衡，没有NoSQL系统能同时保证这三点。

5、什么是Redis

Redis即 Remote Dictionary Server（远程字典服务器），是一个开源的高性能Key/Value式分布式内存数据库，是当前最热门的NoSQL数据库之一。

Redis支持数据的持久化，可将内存数据保存到磁盘中，重启时可再次加载

Redis不仅仅支持简单的Key-Value类型的数据，同时还支持list,set,zset,hash等数据类型

Redis支持主从模式的数据备份

6、如何安装？

1>下载 wget http://download.redis.io/releases/redis-5.0.3.tar.gz

2>解压 tar zxvf redis-5.0.3.tar.gz

3>make & make install

4>启动 ./redis-server [redis.conf路径]

5>关闭 ./redis-cli shutdown

7、使用前需要了解的基础知识

默认16个数据库，下标从零开始，默认使用零号库，select命令切换数据库
dbsize 查看当前数据库key的数量
flushdb 清空当前库
flushall 清空所有库
默认端口6379

二、Redis的数据类型

Redis命令参考　　http://redisdoc.com/

0、Key（键）

1、String（字符串）

string是redis最基本的类型，一个key对应一个value。string类型是二进制安全的，可以包含任何数据如jpg图片或序列化对象。一个redis字符串的value最大512M

2、List（列表）

list是简单的字符串列表，底层采用链表实现，可以添加一个元素到列表的头部或者尾部。

3、Set（集合）

Set是string类型的无序集合，它是通过HashTable来实现的。

4、Zset（有序集合）

Zset每个元素都会关联一个double类型的分数，通过分数进行从小到大的排序，zset成员是唯一的但是分数可以重复。

5、Hash（哈希）

Hash是一个键值对集合，是一个string类型的filed和value的映射表，hash特别适合存储对象。

三、解析配置文件 redis.conf

1. Redis默认不是以守护进程的方式运行，可以通过该配置项修改，使用yes启用守护进程
daemonize no
2. 当Redis以守护进程方式运行时，Redis默认会把pid写入/var/run/redis.pid文件，可以通过pidfile指定
pidfile /var/run/redis.pid
3. 指定Redis监听端口，默认端口为6379，作者在自己的一篇博文中解释了为什么选用6379作为默认端口，因为6379在手机按键上MERZ对应的号码，而MERZ取自意大利歌女Alessia Merz的名字
port 6379
4. 绑定的主机地址
bind 127.0.0.1
5.当客户端闲置多长时间后关闭连接，如果指定为0，表示关闭该功能
timeout 300
6. 指定日志记录级别，Redis总共支持四个级别：debug、verbose、notice、warning，默认为verbose
loglevel verbose
7. 日志记录方式，默认为标准输出，如果配置Redis为守护进程方式运行，而这里又配置为日志记录方式为标准输出，则日志将会发送给/dev/null
logfile stdout
8. 设置数据库的数量，默认数据库为0，可以使用SELECT <dbid>命令在连接上指定数据库id
databases 16
9. 指定在多长时间内，有多少次更新操作，就将数据同步到数据文件，可以多个条件配合
save <seconds> <changes>
Redis默认配置文件中提供了三个条件：
save 900 1
save 300 10
save 60 10000
分别表示900秒（15分钟）内有1个更改，300秒（5分钟）内有10个更改以及60秒内有10000个更改。

10. 指定存储至本地数据库时是否压缩数据，默认为yes，Redis采用LZF压缩，如果为了节省CPU时间，可以关闭该选项，但会导致数据库文件变的巨大
rdbcompression yes
11. 指定本地数据库文件名，默认值为dump.rdb
dbfilename dump.rdb
12. 指定本地数据库存放目录
dir ./
13. 设置当本机为slav服务时，设置master服务的IP地址及端口，在Redis启动时，它会自动从master进行数据同步
slaveof <masterip> <masterport>
14. 当master服务设置了密码保护时，slav服务连接master的密码
masterauth <master-password>
15. 设置Redis连接密码，如果配置了连接密码，客户端在连接Redis时需要通过AUTH <password>命令提供密码，默认关闭
requirepass foobared
16. 设置同一时间最大客户端连接数，默认无限制，Redis可以同时打开的客户端连接数为Redis进程可以打开的最大文件描述符数，如果设置 maxclients 0，表示不作限制。当客户端连接数到达限制时，Redis会关闭新的连接并向客户端返回max number of clients reached错误信息
maxclients 128
17. 指定Redis最大内存限制，Redis在启动时会把数据加载到内存中，达到最大内存后，Redis会先尝试清除已到期或即将到期的Key，当此方法处理后，仍然到达最大内存设置，将无法再进行写入操作，但仍然可以进行读取操作。Redis新的vm机制，会把Key存放内存，Value会存放在swap区
maxmemory <bytes>
18. 指定是否在每次更新操作后进行日志记录，Redis在默认情况下是异步的把数据写入磁盘，如果不开启，可能会在断电时导致一段时间内的数据丢失。因为 redis本身同步数据文件是按上面save条件来同步的，所以有的数据会在一段时间内只存在于内存中。默认为no
appendonly no
19. 指定更新日志文件名，默认为appendonly.aof
appendfilename appendonly.aof
20. 指定更新日志条件，共有3个可选值：
no：表示等操作系统进行数据缓存同步到磁盘（快）
always：表示每次更新操作后手动调用fsync()将数据写到磁盘（慢，安全）
everysec：表示每秒同步一次（折衷，默认值）
appendfsync everysec

21. 指定是否启用虚拟内存机制，默认值为no，简单的介绍一下，VM机制将数据分页存放，由Redis将访问量较少的页即冷数据swap到磁盘上，访问多的页面由磁盘自动换出到内存中（在后面的文章我会仔细分析Redis的VM机制）
vm-enabled no
22. 虚拟内存文件路径，默认值为/tmp/redis.swap，不可多个Redis实例共享
vm-swap-file /tmp/redis.swap
23. 将所有大于vm-max-memory的数据存入虚拟内存,无论vm-max-memory设置多小,所有索引数据都是内存存储的(Redis的索引数据就是keys),也就是说,当vm-max-memory设置为0的时候,其实是所有value都存在于磁盘。默认值为0
vm-max-memory 0
24. Redis swap文件分成了很多的page，一个对象可以保存在多个page上面，但一个page上不能被多个对象共享，vm-page-size是要根据存储的数据大小来设定的，作者建议如果存储很多小对象，page大小最好设置为32或者64bytes；如果存储很大大对象，则可以使用更大的page，如果不确定，就使用默认值
vm-page-size 32
25. 设置swap文件中的page数量，由于页表（一种表示页面空闲或使用的bitmap）是在放在内存中的，，在磁盘上每8个pages将消耗1byte的内存。
vm-pages 134217728
26. 设置访问swap文件的线程数,最好不要超过机器的核数,如果设置为0,那么所有对swap文件的操作都是串行的，可能会造成比较长时间的延迟。默认值为4
vm-max-threads 4
27. 设置在向客户端应答时，是否把较小的包合并为一个包发送，默认为开启
glueoutputbuf yes
28. 指定在超过一定的数量或者最大的元素超过某一临界值时，采用一种特殊的哈希算法
hash-max-zipmap-entries 64
hash-max-zipmap-value 512
29. 指定是否激活重置哈希，默认为开启（后面在介绍Redis的哈希算法时具体介绍）
activerehashing yes
30. 指定包含其它的配置文件，可以在同一主机上多个Redis实例之间使用同一份配置文件，而同时各个实例又拥有自己的特定配置文件
include /path/to/local.conf

四、Redis的持久化

1.RDB

　　在指定的时间间隔内将内存中的数据集快照写入磁盘，恢复时直接将快照文件读到内存中。Redis会通过Fork复制一个与当前进程一样的进程。新进程的所有数据都和原进程一样，并作为原进程的子进程来进行持久化，会先将数据写入到一个临时文件中，待持久化过程结束了，再用这个临时文件替换上次持久化的文件。整个过程中主进程是不进行任何IO操作的，这就确保了极高的性能。如果要进行大规模的数据恢复，且对数据恢复的完成性不是很敏感，那RDB方式比AOF方式更加的高效。RDB的缺点就是最后一次持久化后的数据可能丢失。

1>RDB的配置

　　save <seconds> <changes>

　　给定时间范围内发生给定次数的写操作将会出发RDB，示例

　　#save 900 1
　　#save 300 10
　　#save 60 10000

　　stop-writes-on-bgsave-error yes　后台备份出错就停止redis写操作，如果配置成no，表示你不在乎数据不一致或者有其他的手段发现和控制

　　rdbcompression yes 对于存储到磁盘中的快照，可以设置是否进行压缩存储。如果是的话，redis会采用LZF算法进行压缩。如果你不想消耗CPU来进行压缩的话，可以设置为关闭此功能

　　 rdbchecksum yes 在存储快照后，还可以让redis使用CRC64算法来进行数据校验，但是这样做会增加大约10%的性能消耗，如果希望获取到最大的性能提升，可以关闭此功能

　　dbfilename 文件名称

　　dir 工作目录

2>如何触发RDB

配置文件中默认的快照配置
save/bgsave命令 save时全部阻塞，bgsave通过lastsave命令获取最后一次成功执行快照的时间
执行flushall命令 dump文件里面是空的，无意义

RDB的缺点

　　1.Fork时内存中的数据被克隆了一份，大致2倍的膨胀性需要考虑

　　2.redis意外down机，最后一次备份之后的数据将会丢失

2.AOF

　　以日志的形式来记录每个操作，读操作不记录，redis启动之初会读取这个文件重新构建数据。

1>AOF的配置

　　appendonly no aof开关

　　appendfilename 文件名称

　　appendfsync

　　　　always：同步持久化每次发生数据变更会被立即记录到磁盘性能较差但数据完整性比较好

　　　　everysec：出厂默认推荐，异步操作，每秒记录如果一秒内宕机，有数据丢失

　　　　no ： ...

　　no-appendfsync-on-rewrite　　

　　auto-aof-rewrite-min-size　64m　最小触发的文件大小

　　auto-aof-rewrite-percentage 100 文件大小翻倍时触发

2>AOF的恢复

　　redis-check-aof --fix 恢复写坏的AOF

3>Rewrite

　　AOF文件持续增长超过所设定的阈值时，会fork出一条新进程来将文件重写，只保留可恢复数据的最小指令集，可使用命令bgrewriteaof手动触发。

　　重写AOF文件的操作，并没有读取旧的AOF，而是和快照相似，将整个内存中的数据库内容用命令的方式重写了一个新的AOF文件。

AOF的缺点

　　相同数据集的数据而言aof文件要远大于rdb，恢复速度慢于rdb，aof运行效率要慢于rdb

五、Redis的事务

　　可以一次执行多个命令，本质是一组命令的集合。一个事务中的所有命令都会序列化，按顺序地串行化执行而不会被其它命令插入

1.常用命令

2.使用方式

　　开启：以MULTI开始一个事务

　　入队：将多个命令入队到事务中，接到这些命令并不会立即执行，而是放到等待执行的事务队列里面

　　执行：由EXEC命令触发事务

3.redis事务的特性

　　单独的隔离操作：事务中的所有命令都会序列化、按顺序地执行。事务在执行的过程中，不会被其他客户端发送来的命令请求所打断。

　　没有隔离级别的概念：队列中的命令没有提交之前都不会实际的被执行，因为事务提交前任何指令都不会被实际执行

　　不保证原子性：redis同一个事务中如果有一条命令执行失败，其后的命令仍然会被执行，没有回滚

六、Redis的发布订阅

是进程间的一种消息通信模式：发送者(pub)发送消息，订阅者(sub)接收消息。

可以一次性订阅多个，SUBSCRIBE c1 c2 c3 通配符*， PSUBSCRIBE new*

消息发布，PUBLISH c2 hello-redis

七、Redis主从复制

1.如何配置

从库配置：slaveof 主库IP 主库端口每次与master断开之后，都需要重新连接，除非你配置进redis.conf文件

2.配置方式

　　1>一主二仆

　　一个Master两个Slave

　　2>薪火相传

　　上一个Slave可以是下一个slave的Master，Slave同样可以接收其他slaves的连接和同步请求，那么该slave作为了链条中下一个的master,可以有效减轻master的写压力

3.反客为主

　　1>手动执行 slaveof no one 使当前数据库停止与其他数据库的同步，转成主数据库

　　2>哨兵模式(sentinel)

　　配置sentinel.conf sentinel monitor 被监控数据库名字(自己起名字) 127.0.0.1 6379 1

　　启动哨兵 redis-sentinel sentinel.conf