redis使用基础（二） —

redis使用基础（二） ——Redis数据类型

redis使用基础（二）

——Redis数据类型

（转载请附上本文链接——linhxx）

一、概述

Redis是一种Key-Value类型的数据库，属于非关系型数据库，NoSQL的一种。Redis共有5种数据类型：字符串（string）、散列（hash）、列表（list）、集合（set）、有序集合（zset）。

1、通配符

Redis支持部分通配符，包括?、*、[]、x，和正则表达式一致，?表示匹配0或1个，*匹配任意个，[]匹配框内的任意一个内容，x转义，例如?表示匹配?。

2、获取键 KEYS

当要获取键值时，可以用KEYS * 获取所有的键，也可以用KEYS a*获取所有a开头的键。该方法会遍历所有的键，影响性能，不建议使用。

3、判断键是否存在 EXISTS

如 EXISTS test ，判断test键是否存在，存在返回整数1，不存在返回0。

4、删除键 DEL

DEL test，如果test存在，则删除，返回1；如果不存在，则返回0。

该命令不支持通配符，因此要删除多个键时，可以在linux命令行下，通过管道符的方式获取与删除，例如 redis-cli KEYS “user*” | xargs redis-cli DEL。其中xargs是将管道符前面的命令的执行结果作为参数传给xargs后面的命令。也可以使用redis-cli DEL “user*”的方式删除。

5、获取键的数据类型 TYPE

TYPE test 可以获取test键的数据类型，返回值即上述五种数据类型中的一种。

6、原子性

redis的所有命令都是原子性的，例如自增命令incr，当并发调用incr对某个key的value设置自增，只会增加一次。其他命令也是如此。

7、存储方式

redis存储元素都是用hash的方式存储，将每个键用hash进行计算后，存储在hash(key)的位置，每个位置即为一个bucket。当hash(key1)和hash(key2)相同时，会采用链表的方式，将key1和key2都存储在同一个bucket的结果中，bucket根路径指向key1，key1再指向key2。

二、字符串类型（String）

字符串是redis的最基本数据类型，其他的数据类型可以看作是各种方式把字符串集合在一起的类型。字符串的一个键允许存储512MB的值，因此可以存放绝大多数的内容。

1、使用方式

赋值：SET key value，给key赋值为value。获取：GET key。当get不存在的键，会返回(nil)。

用PHP连接redis，并接收命令行的参数，使用set和get操作redis，如下：

<?php

$redis = new Redis();

$redis->pconnect('127.0.0.1', 6379);

$name = $argv[1];

$redis->set('test:1:name', $name);

echo $redis->get('test:1:name');

echo PHP_EOL;

2、递增数字

INCR key，当key对于的value是数字时自增1，否则会报error。当key没有设定value时，默认是0，所以执行INCR会变成1。

redis中的操作都是都是原子操作，因此当有多个客户端并发对某个键使用INCR时，最后的结果也仅加1次，不会出现多次加的情况。

3、实现文章访问量统计

给每篇文章设置一个名字，名字为article:id:page.view，表示文章的id中某个页面的访问量。

1）id可以选用文章在数据库（如mysql）中的id。如果文章不用数据库存储，而用redis，则也可以自制自增的id。自增id的设置方法为，新建一个字段为articles:count，初始值为1，每有一篇文章要计算时，就把这个值INCR，返回的结果就是文章的id。

2）当要用redis存储文章标题、内容等信息时，需要将文章的各类内容存储在数组中，通过PHP序列化后进行存储，取出则同样是反序列化后使用。

4、字符串相关其他命令

1）增加指定整数：INCRBY、自减一：DECR、减少指定整数：DECRBY、增加浮点数：INCRBYFLOAT。

2）尾部追加内容：APPEND、获取串长度：STRLEN。

3）同时获取/设置多个值：MGET key1 key2…. ，MSET key1 value1 key2 value2…

4）位操作：SETBIT i val、GETBIT，获取或者操作变量的第i位，由于是二进制操作，因此值只有0或1。此方法用于获取或设置数量较小的内容时，效率极高，如性别、状态等，只有几个数字的可能的情况，用此方法比较好。

三、散列类型（Hash）

散列存储了字段和字段值的映射，即每个key对应的值仍是field =>value的形式，每个key可以对应多个field =>value形式的内容，最多支持2³²-1。但是字段值只能是string，不能是其他类型，即不支持嵌套。

redis的每种类型都只支持字符串，不支持类型的嵌套。

1、设置与获取

1）单次单个：HGET key field、HSET key field value

2）单次多个：HMGET key field1 field2… 、HMSET key field1 value1 field2 value2…

3）获取某个key的全部：HGETALL，返回的是field1、value1、field2、value2…，不是很直观，但是很多语言都已经将结果封装。

在PHP中，$redis->hgetall(key)会返回key对应的field=>value的一个二维数组。

但是，当字段数量非常多时，由于redis是单线程的，hgetall要遍历某个key所有的field和value，因此会发生阻塞，甚至可能是服务器宕机。

因此，可以将key和field另外进行存储。

2、判断

1）field是否存在：HEXISTS key field

2）field不存在时赋值：HSETNX key field value，由于具有原子性，当多个hsetnx命令同时发出时，只会执行第一个命令，后面的命令由于已经有值了所以不会再次设置。

3）增加数字：HINCRBY key field increment

4）删除field：HDEL key field1 field2…

3、存储文章数据

当使用序列化将文章的标题、内容等存储，反序列化取出时，存在的问题由于反序列化以及修改的操作不是在redis执行，不是原子性，因此并发情况下有可能发生问题。另外，反序列化则如果只修改标题也需要取出全部内容，浪费资源。

使用散列可以很好解决此问题，存储的方法是关键字设置为article:id，然后里面的field分别是title、content等，要修改也可以用HSET进行修改。

4、其他命令

1）部分获取：只获取field——HKEYS key，只获取value——HVALS key，获取field的数量：HLEN key

四、列表类型（List）

列表类型可以存储一个有序的字符串列表，其存储方式是双向链表的数据结构，即可以从两头增加、删除内容。因此，redis列表的操作方式和数据结构的链表非常像，大部分情况下是用push、pop进行操作。

列表的优势很明显，两头的数据增加、删除很快，但是缺点也比较明显，就是当需要获取中间的第i个元素的时候，则需要从头（或尾）逐个进行遍历。但是，遍历的过程中如果还有并发的增加元素，则可以直接从另一头增加，不需要将列表锁起来，这也是其优势。

列表类型的元素在如新鲜事（即通常只会查看前n条记录，且n较小）等场景速度非常快。因为即使原始数据非常多，但是列表可以从另一头取数据，且当有新内容时也是直接加入到尾部，因此非常的便利且高效。

1、设置、获取数据

1）设置：LPUSH key value1 value2…、RPUSH key value value2…分别是从表的左、右两头塞入新的数据。

2）弹出：LPOP key、RPOP key分别是从左右两头弹出第一个数据。

3）获取元素个数：LLEN key，不存在返回0，redis的获取类似数据库的count，但是非常高效，时间复杂度是O(1)，即读取现成值，不用遍历。

4）获取列表片段：LRANGE key start stop，从key左边第start个获取到第stop个元素，获取的过程不会删除元素，和pop命令不一样。另外，key或stop的值为负数，则表示从右边计算。如-1,-10表示从右边第一个到第十个。

5）删除列表指定值：LREM key count value，将key的值为value的元素删除count个，count为正数从左数，负数从右数，0则删除全部。

2、实例

1）新鲜事存取

设定key为usernews:userid，每当有新鲜事时，则用lpush usernews:userid value的方式将值从左边插入，拉取最近10条新鲜事则采用lrange usernews:userid 1 10的方式。

2）文章id存取

当要获取最新10个文章时，如果用前面说的自增count的方式获取最大的10个id，存在的问题是如果中间有删除的文章，则id不是连续的，此时的获取如果还要加上判断，效率很低。

而将id存在列表内，当删除文章时使用lrem相应的把列表的值删除，获取最新10个文章则使用lrange的方式，更为高效。

3、其他命令

1）数组方式使用列表：LINDEX key index 获取列表key的第index个元素，LSET key index value相应的赋值，index是负数时从右边开始计算。

2）批量删除：LTRIM key start end，将索引小于start和大于end的值全部删除，仅保留start至end的元素。删除之后列表的索引会变化，此时在最左边的元素下标将变成0，以此类推。

3）向列表中间插入元素：LINSERT key BEFORE|AFTER index value，会在key的下标为index的元素的前面|后面插入值。

4）原子性的将列表从一个元素移到另一个元素：RPOPLPUSH key1 key2，把key1的最右边的元素移除，插入到key2的最左边。当redis用作消息队列系统时，如果需要经过多个队列，则此操作很重要，可以将监控到的队列进行转移，完成一个转移到下一个队列。

五、集合类型（Set）

集合是一组没有顺序的元素，其中每个值都不相同，一个集合最多可以存储2³²-1个字符串。集合和列表很相似，但是区别在于集合是无序的、每个元素值唯一的，列表是有序的、元素值不唯一的。

1、设置与获取

1）增加/删除元素：SADD key member1 member2…，SREM key member1 member2…，返回的是成功的个数，sadd的member如果有重复的则重复的那一个不会插入，srem如果删除不存在的member也不会去删除。

2）获取全部：SMEMBERS key、判断是否存在：SISMEMBER key member

3）集合间运算：SDIFF key1 key2…，SINTER key1 key2…，SUNION key1 key2…分别表示若干个集合的差集、交集和并集。返回集合运算的结果。

命令SDIFFSTORE resultkey key1 key2…可以将若干键的差集计算后存在resultkey里面，同理还有SINTERSTORE、SUNIONSTORE。

2、实例

1）要存储不能重名的字段，如用户名，当需要批量导入的时候，就可以使用此操作，因为重名的情况下sadd key会返回0，表示插入失败，则不允许进行导入。

2）博客系统给文章加标签，每个文章可以有多个标签，但是标签之间不能重复，则可以使用集合的方式。

3、其他命令

1）获取元素个数：SCARD key

2）获取集合随机一个元素：SRANDMEMBER key count，count默认是1，随机获取key集合中的count个元素，count为正数时获取的值互不相同，count为负数时获取的值可以相同。

由于redis存储key是采用hash的方式，因此这个随机的随机性不是那么好，当若干key的hash结果一样时，会存在同一个bucket里面，导致随机到的可能性降低。

3）弹出元素：SPOP key，由于集合无序，因此会随机弹出一个元素。

六、有序集合类型（Sorted Set）

此数据类型，在集合的基础上，为集合的每个元素关联一个分数，使得集合的结果可以进行排序。有序集合的每个元素仍要求不一样，但分数可以一样。

1、有序集合和列表的异同

1）相同之处

二者都有序，且都可以获取某一范围内的元素。

2）不同之处

a. 列表是双向链表，因此获取两边很快而获取中间很慢，很少用列表获取中间值；有序集合用的是散列表（hash）和跳跃表（skip list）实现，获取中间元素的速度比列表快，速度为O(logn)。

b. 列表不能简单的调整元素的位置，有序集合可以通过调整分数直接调整元素的位置。

c. 有序集合比较耗内存。

2、基本操作

1）增加元素：ZADD key score1 member1 score2 member2…，当对同一个member进行add时，会覆盖上一次的score。score支持浮点数，且+inf和-inf表示正负无穷大。

2）获取元素分数：ZGET key member

3）获取排序位置为某个范围的元素：ZRANGE key start stop [withscores]，获取key的分数从start至stop的全部元素，从小到大排序，获取的结果是若干个member的有序集合；当加上withscores时，获取的是member1 score1 member2 score2这样的集合。

其时间复杂度是O(log n+m)，n是有序集合元素个数，m是返回的元素个数。

当两个score一样，redis将member按照0<9<A<Z<a<z的方式进行排序，中文和其他符号按照编码方式进行排序。

ZREVRANGE将结果按照score从大到小排列。

4）获取score为某个范围的元素：ZRANGEBYSCORE key min max [withscores] [LIMIT offset count]，此获取的是包含min和max的，如果希望不包含某边，例如不含最小值，则在min前面加上英文括号(，另外，+-inf也可以用上，表示只比较大于或者小于。

5）增加某个元素的分数：ZINCRBY key increment member，如果member不存在，会赋值为0后再进行增加的操作。

3、实例

1）此功能可以实现按点击量对文章进行排序、实现对学生成绩排序等。

2）对时间排序也可以使用有序集合，只要将时间都转成unix时间戳，然后用时间戳当作score即可。

4、其他操作

1）元素数量：ZCARD key、指定分数范围内元素数量：ZCOUNT key min max，其中min和max的特性与ZRANGEBYSCORE相同。

2）删除元素：ZREM key member1 member2… 、按排名范围删除：ZREMRANGEBYRANK key start stop、按分数范围删除：ZREMRANGEBYSCORE key min max

3）获取元素排名：从小到大——ZRANK key member，从大到小——ZREVRANK key member

4）有序集合交集：ZINTERSTORE resultkey numkeys key1 key2… [WEIGHTS weight1 weight2…] [AGGREGATE SUM|MIN|MAX]

此方法将多个key的交集存在resultkey中，返回resultkey元素个数。

返回集中，相同元素由于被合并，其分数要变化，变化的分数由AGGREGATE确定，默认是sum，即键分数是每个参与计算的键的分数和，min和max则是最小、最大值。

当设置了weight，则每个分数会被乘以相应的weight后进行比较。

5）ZUNIONSTORE，类似ZINTERSTORE，是求两个有序集合的并集。

——written by linhxx

更多最新文章，欢迎关注微信公众号“决胜机器学习”，或扫描右边二维码。

博客园这边，我会定期批量发布文章，如果想要实时看到最新的文章，欢迎关注微信公众号"决胜机器学习"，里面有我最新的文章。linhxx