C语言【Redis设计和兑现】一:redis高性能SDS字符串实现分析

字符串在C语言中之蕴藏方


在C语言中,采用尺寸也N+1的字符数组来囤积一个长短为N的字符串,最后一个字符是空字符\0,表示字符串的终极。

以C语言中,增加或者减少字符串的尺寸还关系内存空间的重新分配,这是不行耗时的,对于一个当数据库的运用redis来说,直接动用这种方式会重影响性。C语言对字符串的操作过程如下:

 1. 若长字符串的长短的讲话,在操作前用通过重新分配内存来扩展存储该字符串底层数组的长短,否则会来缓冲区溢出。
 2. 一经缩减字符串长度的讲话,在操作前一样需重新分配内存释放多余的内存空间,不重分配内存虽然非会见一直导致程序崩溃,但是当这种操作多矣下,就会见有恢宏底空闲之内存空间而招致内存泄漏问题。

Redis字符串存储方案


SDS存储的结构体

struct sdshdr{
    int len;      //buf数组中已经使用的字节的数量,也就是SDS字符串长度
    int free;     //buf数组中未使用的字节的数量
    char buf[];   //字节数组,字符串就保存在这里面
};

redis通过定义结构体的措施,扩展了C语言底层字符串的通病,字符串长度的抱时间复杂度从本的O(N)变为了O(1),另一方面为堪经过free的动态改变减少内存的分红。欲强调一点底是buf数组不是储存的字符,而是二进制数组,因为C语言字符串中间是免可知出现空字符的,而二进制数据中深有或会见发空字符,所以C语言是二进制不安全之,而redis又是二进制安全,为了存储多种类型的数据,redis就直接将有数据作二进制来囤,这样就算足以储存媒体文件和字符串,所以SDS虽然吃简动态字符串,但是它同意只是用来保存字符串哦

buf数组动态分配策略

既然redis定义了一个结构体来描述一个SDS字符串,多下的几单变量肯定是起充分可怜作用的,其中一个挺重点之意就是促成对字符串的灵巧操作以尽量减少内存重新分配和回收操作。

redis的内存分配政策如下:

 1. 当SDS的len属性长度小于1MB时常,redis会分配与len相同长度的free空间。至于为何这么分配也,我认为是微像相同种植惯性预测。举个例子,比如一个丐向而只要10片钱,如果被您展望下一个丐会让你若有些,这个时我从未外的根据,当然就不得不冲达一个乞丐的表现来揆度下一个丐会被自己一旦10块啊~放到redis里面,上次之所以了len长度的半空中,那么下次次可能吗会见为此len长度的空间,所以redis就为卿预分配这么多之长空C语言。
 2. 不过当SDS的len属性长度超过1MB时常,这个时节我当因这种惯性预测来分配的说话就是生硌得不偿失了,比如修改后底SDS长度为100MB,那自己也懵的受您分配100MB空闲内存等您用么?万平等若下次用非了如此多矣,对于内存而言就是亏很发了。所以,redis是拿1MB设为一个风险值,没过风险值你用小本身不怕让您有些,过了的言辞那这风险值就是本身力所能及给你逼值,感觉老人家被零花钱吧是酱紫。。至于怎么是1MB,这个题材即和redis使用的场面有关了。

reids的内存回收策略如下:

 1. redis的内存回收利用惰性回收,即你把字符串变短了,那么余下的内存空间我先行不归还操作系统,先留在,万一就以如于以啊。短暂的有所资源,既可以充分利用资源,也堪无浪费资源。这是均等栽死完美之沉思。

归结,redis实现的强性能字符串的结果就是管N次字符串操作必会有N次内存重新分配变为人品最差时最多生N次重新分配。