《Redis源码学习札记》RDB
《Redis源码学习笔记》RDB
《Redis源码学习笔记》文章列表
由于图片较大,缩放较为模糊,请双击打开查看原图 ^_^
在主从复制过程中,我们提到过RDB文件,作为Redis持久化方式之一,RDB把数据库某一时刻的内容,也就是快照,以二进制的方式记录到文件,并且在下次启动的时候可以用来初始化Redis;
RDB最重要的两个过程是rdbSave和rdbLoad,下面我就这两个过程分别叙述;
rdbSave
在具体看rdbSave过程之前,我们先看下RDB文件格式:

我们可以简单思考下,RDB文件协议为什么会那样设计?
1. RDB文件以"REDIS"开头是为了区分普通文件,这样redis在加载的时候,读取前五个字节就可以判断该文件是否为一个合法的RDB文件;
2. 写明RDB文件版本是因为不同版本之间有一定差异性,根据版本号需要保持向下兼容;
3. 以数据库为单位,存入键值对,因为一个redis实例中,可以包含16个数据库,所以一定要标明该键值对属于哪个数据库,否则无法还原到相应位置;
4. 在写入键值对信息时,超时时间是可选的,标明值类型(value-type)是为了在加载的时候知道这是一个string,还是list或者hashtable;
rdbSave过程就是把redis每一个数据库中的键值对按照上面定义的格式写入文件,伪代码:
更多细节请看:rdb.c/rdbSave函数
触发rdbSave过程,主要有4种方式:
1. SAVE命令
2. BGSAVE命令
3. master接收到slave发来的sync命令
4. 定时save(配置文件中制定)
第一种情况,Redis保存RDB文件是在主进程中进行,所以在这其间,Redis无法响应客户端请求(再次强调:Redis是单线程Server);第二种情况,Redis fork出一个子进程,然后在子进程中进行rdbSave,因此也就不会阻塞主进程对客户端请求的处理;第三种情况和第四种情况同第二种情况,也是在子进程中进行;
rdbLoad
rdbload过程就比较简单了,它会按照RDB文件协议,把键值对还原到相应的数据库,伪代码:
触发rdbLoad过程,主要有两种方式:
1. Redis启动时候的初始化;
2. slave接收到master发来的RDB文件;
总结:
1. 了解RDB文件格式;
2. 了解rdbSave和rdbLoad过程以及触发条件;
《Redis源码学习笔记》文章列表
由于图片较大,缩放较为模糊,请双击打开查看原图 ^_^
在主从复制过程中,我们提到过RDB文件,作为Redis持久化方式之一,RDB把数据库某一时刻的内容,也就是快照,以二进制的方式记录到文件,并且在下次启动的时候可以用来初始化Redis;
RDB最重要的两个过程是rdbSave和rdbLoad,下面我就这两个过程分别叙述;
rdbSave
在具体看rdbSave过程之前,我们先看下RDB文件格式:
我们可以简单思考下,RDB文件协议为什么会那样设计?
1. RDB文件以"REDIS"开头是为了区分普通文件,这样redis在加载的时候,读取前五个字节就可以判断该文件是否为一个合法的RDB文件;
2. 写明RDB文件版本是因为不同版本之间有一定差异性,根据版本号需要保持向下兼容;
3. 以数据库为单位,存入键值对,因为一个redis实例中,可以包含16个数据库,所以一定要标明该键值对属于哪个数据库,否则无法还原到相应位置;
4. 在写入键值对信息时,超时时间是可选的,标明值类型(value-type)是为了在加载的时候知道这是一个string,还是list或者hashtable;
rdbSave过程就是把redis每一个数据库中的键值对按照上面定义的格式写入文件,伪代码:
def rdbSave(filename): # 创建临时文件,用于保存rdb数据 tempFile = createTempFile() rio = rioInitWithFile(tempFile) # ---------------------------------- # 1.保存RDB文件版本 rdbSaveVersion(rio, "REDIS" + REDIS_RDB_VERSION) # 2.保存redis所有数据库中的键值对 for db in redisServer.dbs: # 记录键值对所在数据库 rdbSaveSelectDB(rio, db.num) # 保存该数据库中所有键值对 for key, val in db.getKeyValuePairs(): expired_time = getExpiredTime(key) rdbSaveKeyValuePair(rio, key, val, expired_time) # 3.写入RDB文件结束符 rdbSaveEOF(rio, REDIS_RDB_OPCODE_EOF) # 4.写入校验和 rdbSaveCkSum(rio) # ---------------------------------- # 确认数据都被flush到磁盘 fsync() rename(tempFile, filename) def rdbSaveKeyValuePair(rio, key, val, expired_time): if expired_time != -1: # 过滤过期键 if expired_time < now_time: return rdbSaveMillisecondTime(rio, expired_time) # 保存值类型(list? string? hashtable?) rdbSaveValueType(rio, val) # 保存键 rdbSaveKey(rio, key) # 保存值 rdbSaveValue(rio, val)
更多细节请看:rdb.c/rdbSave函数
触发rdbSave过程,主要有4种方式:
1. SAVE命令
2. BGSAVE命令
3. master接收到slave发来的sync命令
4. 定时save(配置文件中制定)
第一种情况,Redis保存RDB文件是在主进程中进行,所以在这其间,Redis无法响应客户端请求(再次强调:Redis是单线程Server);第二种情况,Redis fork出一个子进程,然后在子进程中进行rdbSave,因此也就不会阻塞主进程对客户端请求的处理;第三种情况和第四种情况同第二种情况,也是在子进程中进行;
rdbLoad
rdbload过程就比较简单了,它会按照RDB文件协议,把键值对还原到相应的数据库,伪代码:
def rdbLoad(filename): rio = rioInitWithFile(filename); # 设置标记: # a. 服务器状态:rdb_loading = 1 # b. 载入时间:loading_start_time = now_time # c. 载入大小:loading_total_bytes = filename.size startLoading(rio) # ------------------------------------------ # 1.检查该文件是否为RDB文件(即文件开头前5个字符是否为"REDIS") if !checkRDBHeader(rio): redislog("error, Wrong signature trying to load DB from file") return # 2.检查当前RDB文件版本是否兼容(向下兼容) if !checkRDBVersion(rio): redislog("error, Can't handle RDB format version") return # 3.读取文件内容,加载键值对 while not end_of_file: # 每循环一千次就处理一下客户端请求 if loops % 1000 == 0: processClientRequest() key, val, expired_time, dbnum = rdbLoadKeyValuePair() # 过滤过期键 if expired_time != -1 and expired_time <= now_time: continue redisServer.db[dbnum].dict.add(key,value) if expired_time > now_time redisServer.db[dbnum].expires.add(key, expired_time) loops = loops + 1 # 4. 校验和 if (!checkCkSum()): return # ------------------------------------------ # 更新标记:rdb_loading = 0 stopLoading()
触发rdbLoad过程,主要有两种方式:
1. Redis启动时候的初始化;
2. slave接收到master发来的RDB文件;
总结:
1. 了解RDB文件格式;
2. 了解rdbSave和rdbLoad过程以及触发条件;