redis中的数据结构和编码详解
来源:脚本之家
时间:2023-01-07 11:59:46 290浏览 收藏
本篇文章给大家分享《redis中的数据结构和编码详解》,覆盖了数据库的常见基础知识,其实一个语言的全部知识点一篇文章是不可能说完的,但希望通过这些问题,让读者对自己的掌握程度有一定的认识(B 数),从而弥补自己的不足,更好的掌握它。
redis中的数据结构和编码:
背景:
- 1>redis在内部使用redisObject结构体来定义存储的值对象。
- 2>每种类型都有至少两种内部编码,Redis会根据当前值的类型和长度来决定使用哪种编码实现。
- 3>编码类型转换在Redis写入数据时自动完成,这个转换过程是不可逆的,转换规则只能从小内存编码向大内存编码转换。
源码:
值对象redisObject:
typedef struct redisObject {
unsigned type:4; /* 对象类型 */
unsigned encoding:4; /* 内部编码 */
unsigned lru:LRU_BITS; /* lru time (relative to server.lruclock) */
int refcount; /* 引用计数器,内存回收机制就是基于该值实现的 */
void *ptr; /* 若要存储的是整数值则直接存储数据,否则表示指向数据的指针 */
} robj;
类型type:
说明:查看当前键的类型:type key
#define OBJ_STRING 0 /*字符串对象*/
#define OBJ_LIST 1 /*列表对象*/
#define OBJ_SET 2 /*集合对象*/
#define OBJ_ZSET 3 /*有序集合对象*/
#define OBJ_HASH 4 /*哈希对象*/
编码encoding;
说明:查看当前键的编码:object encoding key
#define OBJ_ENCODING_RAW 0 /*Raw representation 简单动态字符串*/
#define OBJ_ENCODING_INT 1 /*Encoded as integer long long类型整数*/
#define OBJ_ENCODING_HT 2 /* Encoded as hash table 字典*/
#define OBJ_ENCODING_ZIPMAP 3 /* Encoded as zipmap 压缩map*/
#define OBJ_ENCODING_LINKEDLIST 4 /* Encoded as regular linked list 双端链表*/
#define OBJ_ENCODING_ZIPLIST 5 /* Encoded as ziplist 压缩列表*/
#define OBJ_ENCODING_INTSET 6 /* Encoded as intset 整数集合*/
#define OBJ_ENCODING_SKIPLIST 7 /* Encoded as skiplist 跳跃表*/
#define OBJ_ENCODING_EMBSTR 8 /* Embedded sds string encoding embstr编码的简单动态字符串*/
#define OBJ_ENCODING_QUICKLIST 9 /* 基于压缩列表的双端列表实现的 快速表*/
最后被访问的时间lru:
概念:记录对象最后一次被访问的时间。
说明:
1>查看当前键的空闲时间(该命令不会更新lru字段);object idletime key 。可以通过scan + object idletime key 来收集长时间未被访问的数据,然后手动清理。
2>当配置了maxmemory和maxmemory-policy=volatile-lru或者allkeys-lru时,若内存超过了上限(maxmemory)后,则优先回收长时间没有被访问的数据,从而回收内存。
引用计数器refcount:
概念:记录当前对象被引用的次数,当refcount=0时,可以安全回收当前对象空间。
说明:获取当前对象引用:object refcount key
类型对应的编码:
字符串:
int:存放整形值的字符串。
embstr:存放字符的短字符串(大小不超过44个字节)。
raw:存放字符的长字符串(大小不超过44个字节)。
embstr和raw的比较:
raw调用2次内存分配函数,释放时当然也需要释放两次。
embstr调用1次内存分配函数,分配一块连续的内存,释放时只需释放一次。
列表(list):
压缩列表(ziplist):
结构:所有数据都是采用线性连续的内存结构(大致可类比数组),目的是为了减少内存的占用,追求空间和时间的平衡。
1>以O(1)时间复杂度入队和出队。
2>读写操作涉及复杂的指针移动,最坏时间复杂度为O(n2),故列表的元素不易太多。
3>新增删除操作涉及内存重新分配,加大了操作的复杂性。
优点:占用内存较少,且占用的是一块连续的内存,故加载的速度相对更快一些。
缺点:当元素的个数较大时,访问元素的时间较长。
应用:
适合存储小对象和长度有限(即使O(n2)的复杂度也不会太大)的数据。
当元素个数小于list-max-ziplist-entries(默认512) 且 所有元素值的大小都小于list-max-ziplist-value(默认64字节)时,使用ziplist作为列表的内部实现。
双端链表(linkedlist):
优点:元素的个数较多时,访问元素的时间比压缩列表更快一些。
缺点:因为是双向链表,故维护了前置指针、后置指针等结构,占用了更多的内存,且内存不是连续的,容易产生内存碎片。
说明:当无法满足ziplist的条件时,使用linkedlist作为列表的内部实现。
应用:当列表对象元素较多时,压缩列表就会转化为更适合存储大量元素的双端链表。
注意:只能小内存编码向大内存编码转换。(若当元素增删频繁时,数据向压缩编码转换是非常消耗CPU的,得不偿失)
快速列表(quicklist):
结构:一个双向链表,链表的每一个节点都是一个ziplist,故quicklist结合了双向链表和压缩列表的优点。
Redis3.2开始,列表采用quicklist进行编码。
哈希(hash):
压缩列表(ziplist):
应用:当元素个数小于hash-max-ziplist-entries(默认512) 且 所有元素value的大小都小于hash-max-ziplist-value(默认64字节)时,使用ziplist作为哈希的内部实现。
哈希表(hashtable):
优点:读写时间复杂度O(1)
缺点:占用内存较多。
应用:当无法满足ziplist的条件时,hashtable作为哈希的内部实现。
hash算法:与传统hash算法类似,根据key计算得到在哈希表中的位置,采用单链表解决冲突,达到加载因子时进行扩展,进而引发重哈希。
rehash:采用增量式重哈希:
概念:在扩容时不会一次性对所有的key进行rehash,而是将key的rehash操作分散延迟到其它操作(哈希表的查找、更新、删除)中。
优点:避免由于大量的key在同一时间段进行rehash操作导致服务短暂无响应的问题。
过程:在增量式的rehash过程中,会使用到两张哈希表:
查找:先从老表中查找,再从新表中查找,此外还会对一些key进行rehash操作。
新增:新增的键值对添加到新表中。
集合(set):
整数集合(intset):
结构:有序、不重复的整数集。
1>查找时间复杂度为O(logn)
2>插入时间复杂度为O(n)
优点:占用的内存远小于hashtable,
应用:当元素都是整数 且 元素个数小于set-max-intset-entries(默认512)时,使用intset作为集合的内部实现。
哈希表(hashtable):当无法满足intset的条件时,使用hashtable作为集合的内部实现。
有序集合(zset):
说明:redis给有序集合中的每个元素设置一个分数(score)作为排序的依据。
压缩列表(ziplist):
应用:当元素个数小于zset-max-ziplist-entries(默认128个) 且 每个元素的值都小于zset-max-ziplist-value(默认64字节)时,使用ziplist作为有序集合的内部实现。
跳跃表(skiplist):
结构:跳跃表通过在每个节点中(基于层和跨度等)维持多个指向其它节点的指针来实现快速访问。
查找时间复杂度平均O(logn)、最坏O(n)。
应用:当不满足ziplist条件时,使用skiplist作为内部实现。
内存优化:
场景:有海量key和value都比较小的数据,在redis中如何存储才更省内存。
原理:通过大幅减少key的数量来降低内存的消耗。
实现:在客户端通过分组将海量的key根据一定的策略映射到一组hash对象中,由于value较小,故hash类型的对象会使用占用内存较小的ziplist编码。
eg:如存在100万个键,可以映射到1000个hash中,每个hash保存1000个元素。
到这里,我们也就讲完了《redis中的数据结构和编码详解》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于redis的知识点!
-
132 收藏
-
143 收藏
-
417 收藏
-
401 收藏
-
150 收藏
-
342 收藏
-
361 收藏
-
159 收藏
-
164 收藏
-
221 收藏
-
156 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 立即学习 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 立即学习 507次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 立即学习 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 立即学习 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 立即学习 484次学习
-
- 端庄的大炮
- 细节满满,码起来,感谢楼主的这篇博文,我会继续支持!
- 2023-02-08 15:18:55
-
- 含糊的日记本
- 很有用,一直没懂这个问题,但其实工作中常常有遇到...不过今天到这,帮助很大,总算是懂了,感谢作者分享博文!
- 2023-02-03 07:17:10
-
- 漂亮的彩虹
- 这篇文章内容太及时了,太全面了,很棒,码住,关注作者大大了!希望作者大大能多写数据库相关的文章。
- 2023-01-29 15:08:31
-
- 粗犷的金针菇
- 太全面了,码住,感谢up主的这篇技术贴,我会继续支持!
- 2023-01-25 14:58:37
-
- 酷炫的大象
- 很棒,一直没懂这个问题,但其实工作中常常有遇到...不过今天到这,帮助很大,总算是懂了,感谢师傅分享技术贴!
- 2023-01-24 09:25:49
-
- 俊秀的鼠标
- 这篇文章真及时,太详细了,很棒,码起来,关注作者大大了!希望作者大大能多写数据库相关的文章。
- 2023-01-24 05:49:02
-
- 痴情的小鸽子
- 太给力了,一直没懂这个问题,但其实工作中常常有遇到...不过今天到这,帮助很大,总算是懂了,感谢up主分享技术文章!
- 2023-01-13 19:15:35
-
- 务实的泥猴桃
- 这篇技术贴真及时,太详细了,写的不错,mark,关注博主了!希望博主能多写数据库相关的文章。
- 2023-01-10 01:37:00