redis 对象

redis包含5种对象  字符串对象、列表对象、哈希对象、集合对象和有序集合对象

redis的对象系统实现了基于引用计数技术的内存回收机制、当程序不再使用某个对象的时候,这个对象所占的内存就会被自动释放Redis 通过引用计数实现了对象共享机制,多个数据库键共享同一个对象来节约内存。

Redis使用对象来表示数据库中的键和值,每次当我们在redis的数据库中新创建一个键值对时,我们至少会创建两个对象,一个对象用作键值对的键,另一个对象用作键值对的值(值对象 为上面的5种对象之一) 

Redis中的每个对象都由一个redisObject 结构表示,该结构中和保存数据有关的三个属性分别是type属性  encoding属性和ptr属性

redisObject 的数据结构为

对象type属性记录了对象的类型,这个属性是(REDIS_STRING,REDIS_LIST,REDIS_HASH,REDIS_SET,REDIS_ZSET)常量中的其中一个

对于Redis数据库保存的键值对来说,键总是一个字符串对象,而值则可以是字符串对象、列表对象、哈希对象、集合对象、或者有序集合对象的其中一种

对象的ptr指针指向对象的底层实现数据结构,而这些数据结构由对象的encoding属性决定

encoding属性记录了对象所使用的编码,也就是说这个对象使用了什么数据结构作为对象的底层实现这个属性值可以是如下常量的其中一个

每种类型的对象都至少使用了两种不同的编码

使用object encoding 命令可以查看一个数据库键的值对象的编码

不同编码的对象所对应的object encoding命令输出

通过encoding属性来设定对象所使用的编码,而不是为特定类型的对象关联一种固定的编码,极大地提升了redis的灵活性和效率,因为Redis可以根据不同的使用场景来为一个对象设置不同的编码,从而优化对象在某一场景下的效率

例如在列表对象包含的元素比较少时,Redis使用压缩列表作为列表对象的底层实现 因为压缩列表比双端链表更节约内存,并且在元素数量较少时在内存中以连续块方式保存的压缩列表比起双端链表可以更快被载入到缓存中

随着列表对象包含的元素越来越多,使用压缩列表来保存元素的优势逐渐消失对象就会将底层的实现从压缩列表转向双向链表

字符串对象

字符串对象的编码可以是int raw或者embstr 如果一个字符串对象保存的是整数值,并且这个整数值可以用long类型来表示,那么字符串对象会将整数值保存在字符串对象结构的ptr属性里面并将字符串对象的编码设置为int

如果字符串对象保存的是一个字符串值,并且这个值的长度大于32字节那么字符串对象将使用一个简单动态字符串SDS来保存这个字符串值,并将对象的编码设置为raw

如果字符串对象保存的是一个字符串值,并且这个字符串值的长度小于等于32字节那么字符串对象将使用embstr编码的方式来保存这个字符串值

embstr编码是专门用于保存短字符串的一种优化编码方式,这种编码和raw编码一样都使用redisObject结构和sdshdr结构来表示字符串对象,但是raw编码会调用两次内存分配函数来分别创建redisObject结构和sdshdr结构而embstr编码则通过调用一次内存

分配函数来分配一块连续的空间,空间中依次包含redisObject和sdshdr两个结构

embstr编码的字符串对象在执行命令时产生的效果和raw编码的字符串对象执行命令时产生的效果是相同的 使用embstr编码的字符串对象来保存短字符串有以下好处

1:embstr编码将创建字符串对象所需的内存分配次数从raw编码的两次降低为一次

2:释放embstr编码的字符串对象只需要调用一次内存释放函数,而释放raw编码的字符串对象需要调用两次内存释放函数

3:因为embstr编码的字符串对象的所有数据都保存在一块连续的内存里面,所以这种编码的字符串对象比起raw编码的字符串对象能够更好地利用缓存带来的优势

long double类型表示的浮点数是在Redis中作为字符串值来保存的,在需要的时候,程序会将保存在字符串对象里面的字符串值转换为浮点数值执行某些操作,然后再将执行操作所得的浮点数值转换回字符串值,继续保存在字符串对象里面

int编码的字符串对象和embstr编码的字符串对象在条件满足的情况下会被转换为raw编码的字符串对象

字符串命令的实现

列表对象

列表对象的编码可以是ziplist或者linkedlist

ziplist编码的列表对象使用压缩列表作为底层实现,每个压缩列表节点保存了一个列表元素例如执行rpush命令

那么服务器将创建一个列表对象作为numbers键的值  rpush numbers 1 “three” 5

linkedlist编码的列表对象使用双端链表作为底层实现,每个双端链表节点都保存了一个字符串对象,每个字符串对象都保存了一个列表元素

当列表对象可以同时满足以下两个条件时列表对象使用ziplist编码

1:列表对象保存的所有字符串元素的长度都小于64字节

2:列表对象保存的元素数量小于512个

如果不能满足这两个条件的列表对象需要使用linkedlist编码(对象的编码会从ziplist变为linkedlist)

哈希对象

哈希对象的编码可以是ziplist或者hashtable

ziplist编码的哈希对象使用压缩列表作为底层实现,每当有新的键值对要加入到哈希对象时,程序会先将保存了键的压缩列表节点

推到压缩列表表尾,然后再将保存了值的压缩列表节点推入到压缩列表表尾

1:保存了同一键值对的两个节点总是紧挨在一起,保存键的节点在前,保存值的节点在后

2:先添加到哈希对象中的键值对会被放在压缩列表的表头方向,而后来添加到哈希对象中的键值对会被放在压缩列表的表尾方向

另一方面hashtable编码的哈希对象使用字典作为底层实现

字典的每个键都是一个字符串对象,对象中保存了键值对的键

字典的每个值都是一个字符串对象,对象中保存了键值对的值

当  哈希对象可以同时满足以下两个条件时列表对象使用ziplist编码

1:哈希对象保存的所有字符串元素的长度都小于64字节

2:哈希对象保存的元素数量小于512个

如果哈希对象不能满足上面的条件 哈希对象需要使用hashtable编码

哈希命令的实现

集合对象

集合对象的编码可以是intset或者hashtable

intset 编码的集合对象使用整数集合作为底层实现,集合对象包含的所有元素都被保存在整数集合里面

hashtable编码的集合对象使用字典作为底层实现,字典的每个键都是一个字符串对象,每个字符串对象包含了一个集合元素,而字典的值则全部被设置为NULL

编码的转换

当集合对象可以同时满足以下两个条件时对象使用intset编码

1:集合对象保存的所有元素都是整数值

2:集合对象保存的元素数量不超过512个

不能满足这两个条件的集合对象需要使用hashtable编码

对于使用intset编码的集合对象来说,当使用inset编码所需的两个条件的任意一个不能被满足时,就会执行对象的编码转换操作,原本保存在整数集合中的所有

元素都会被转移并保存到字典里面,并且对象编码也会从intset变为hashtable

有序集合对象

有序集合对象的编码可以是ziplist或者skiplist

ziplist编码的压缩列表对象使用压缩列表作为底层实现,每个集合元素使用压缩列表作为底层实现,每个集合元素使用两个紧挨在一起的压缩列表节点来保存

第一个节点保存元素的成员(member)而第二个元素则保存元素的分值(score)压缩列表内的集合元素按分值从小到大进行排序,分值较小的元素被放置在

靠近表头的方向,而分值较大的元素则被放置在靠近表尾的方向

zset结构中的zsl跳跃表按分值从小到大保存了所有集合元素,每个跳跃节点都保存了一个集合元素,跳跃节点的object属性保存了元素的成员,而跳跃节点score属性保存了元素的分值

通过这个跳跃表,程序可以对有序集合进行范围型操作比如ZRANK,ZRANGE等命令

zset结构中的dict字典为有序集合创建了一个从成员到分值的映射,字典中的每个键值对都保存了一个集合元素,字典的键保存了元素的成员,而字典的值则保存了元素的分值。通过字典程序

可以用O(1)复杂度查找给定成员的分值 ZSCORE 命令就是根据这一特性实现的

有序集合每个元素的成员都是一个字符串对象,而每个元素的分值都是一个double类型的浮点数

编码的转换

当有序集合对象可以同时满足以下两个条件时,对象使用ziplist编码

1:有序集合保存的元素数量小于128个

2:有序集合保存的所有元素成员的长度都小于64字节

不能满足以上两个条件的有序集合对象将使用skiplist编码,对于使用ziplist编码的有序集合对象来说,当使用ziplist编码所需的两个条件中的任意一个不能满足时

就会执行对象的编码转换操作,原本保存在压缩列表里的所有集合元素都会被转移到zset结构里面,对象的编码也会从ziplist变为skiplist

 类型检查实现

在执行一个类型特定的命令之前,Redis会先检查输入键的类型是否为执行命令所需的类型,如果是的话,服务器就对键执行指定的命令,否则服务器拒绝执行命令,并向客户端返回一个类型错误。

对于LLEN命令来说,在执行llen命令之前,服务器会先检查输入数据库键的值对象是否为列表类型如果是的话服务器对键执行llen否则的话返回错误到客户端。

对一个键执行llen命令,那么服务器除了要确保执行命令是列表键之外,还需要根据键的值对象所使用的编码来选择正确的llen命令实现:

如果列表对象的编码为ziplist,那么说明列表对象的实现为压缩列表,程序将使用ziplistlen函数来返回列表的长度

如果列表对象的编码为linkedlist,那么说明列表对象的实现为双端链表,程序将使用listlength函数返回双端链表的长度。

内存回收

因为C语言不具备自动内存回收功能,所以redis在自己的对象系统中构建了一个引用计数技术实现内存回收机制,程序可以通过跟踪对象的引用计数信息,在适当的时候自动释放对象并进行内存回收。每个对象的引用计数信息由redisObject结构的refcount属性记录

对象的引用计数信息会随着对象的使用状态而不断变化

1:在创建一个新对象时,引用计数的值会被初始化为1

2:当对象被一个新程序使用时它的引用计数值会增1

3:当对象不再被一个程序使用时,它的引用计数值会被减1

4:当对象的引用计数值变为0时对象所占的内存会被释放

 对象的生命周期可以划分为创建对象、操作对象、释放对象三个阶段。

对象共享

除了实现引用计数内存回收机制外,对象的引用计数属性还带有对象共享的作用。在redis中,让多个键共享同一个值对象需要执行以下两个步骤

1;将数据库键的值指针指向一个现有的值对象

2;将被共享的值对象的引用计数增1

对象的空转时长

除了前面介绍过的type、encoding、ptr和refcount四个属性外,redisObject结构包含的最后一个属性为lru属性,该属性记录了对象最后一次被命令程序访问的时间

object idletime命令可以打印出给定键的空转时长,这一空转时长就是通过将当前时间减去键的值对象lru时间计算出的

原文地址:https://www.cnblogs.com/paulversion/p/8206080.html