C++redis复制原理和利用

1.前言

说到分布式高可用,必然少不了复制,一来是为着做个冗余备份幸免数据丢失,二来还足以达到规定的标准疏散来提高品质的目标。基本架构:

C++ 1

下边用M表示Master(主服务器),S表示Slave(从服务器),话不多说,先敲代码

 

2.配置

slaveof 192.168.1.1 6379

在S端配置slaveof就可以达成复制了,意思是本人从192.168.1.1
6379那台M复制数据。注意第2次复制的时候S下面的数量会被掩盖。下边就在自小编的虚拟机上面实际操作一下,配置3台redis,6379是M,6380、6381是S

配置M

$ cp redis.conf redis_6379.conf
$ vi redis_6379.conf
bind 192.168.56.10 #修改ip为本机

配置S

$ cp redis_6379.conf redis_6380.conf
$ vi redis_6380.conf
#修改端口号和pid文件名
port 6380
pidfile /var/run/redis_6380.pid
slaveof 192.168.56.10 6379 #设定复制
#同样拷贝一份配置按照上面的步骤修改6381的配置
$ cp redis_6380.conf redis_6381.conf

启动

$ src/redis-server redis_6379.conf
$ src/redis-server redis_6380.conf
$ src/redis-server redis_6381.conf

测试复制

$ src/redis-cli -h 192.168.56.10 -p 6379
192.168.56.10:6379> set name pigfly
OK
192.168.56.10:6379> quit
$ src/redis-cli -h 192.168.56.10 -p 6380
192.168.56.10:6380> get name
"pigfly" #复制成功
192.168.56.10:6380> quit
$ src/redis-cli -h 192.168.56.10 -p 6379
192.168.56.10:6379> del name
(integer) 1
192.168.56.10:6379> quit
$ src/redis-cli -h 192.168.56.10 -p 6380
192.168.56.10:6380> get name
(nil) #删除同步成功

192.168.56.10:6380> set age 23
#注意S只读,这是默认配置,如果要S可写修改read-only=no
#一般来说不建议这样做,因为复制的时候会把数据覆盖
(error) READONLY You can't write against a read only slave.

192.168.56.10:6380> quit
$ src/redis-cli -h 192.168.56.10 -p 6379
192.168.56.10:6379> setex address 10 xxstreat
OK
192.168.56.10:6379> quit
$ src/redis-cli -h 192.168.56.10 -p 6380
192.168.56.10:6380> get address
(nil) #过期同步成功

 

3.原理

当M和S连接平常时,redis通过命令传播来一块数据,每当M执行二个写命令,就会把命令发送给S,S执行后,两者达到多少的一致性。当S第三回接二连三恐怕断线后重连M的时候,复制进程是那样子的:

C++ 2

这几个进度也能够称为是sync全量复制,每贰回复制,M执行bgsave把拥有数据打包成快速照相文件发给S,S再解包载入内部存款和储蓄器。

M执行bgsave消耗CPU、内部存款和储蓄器、磁盘I/O,传输进度消耗互联网带宽,即使S是首先次连接M,不可避免会履行上述操作,但如若S是断线重连的意况,就有点不划算了,因为S真正必要复制的数额是断线今后的,假使全量复制就太浪费财富和时间了,所以redis2.8后头的版本做了校订,加了psync增量复制,psync(part-sync)跟sync差其他是,psync只发送S真正须求的命令流,大大地拉长了打包和传导的功用,那么redis是怎么落到实处增量复制的吧?

replid, offset

各类M和S都有上面那多个属性,replid是M的绝无仅有标识。offset是命令流的字节数,简单的话,只要有写入命令(即使没有S),这一个offset就会追加

C++ 3

M维护着上海教室那样三个恒定长度、先进先出的种类来保存方今的命令流

C++ 4

上图正是增量复制的进度,假定S当前offset=offset_s,M当前offset=offset_m:

1.M判断replid是或不是和调谐的replid相等,尽管不等于,跳出执行全量复制

2.M检查offset_s是还是不是还在缓冲队列,若是是,发送从offset_s开始到offset_m的命令流,若是没有了,跳出执行全量复制

3.S实践命令流,更新offset_s = offset_m

 

复制的机制和特色:

当M和S连接卓越时,S定时请求M实行复制,M向S发送命令流来保持同步

redis暗中认可使用高品质的异步复制,S会异步向M确认收到的数额

当M和S由于网络难点依旧逾期导致断开连接,S会尝试再度连接,请求增量复制

不能增量复制时,执行全量复制

三个M得以有多个S

S也得以复制其他S

复制在M端是非阻塞的,约等于M向S复制的进度中,M的询问不受影响

复制在S端也大都以非阻塞的,伊始化同步的时候,S能够提供旧数据来使查询不受影响,载入数据的时候,S将会堵塞连接不提供查询服务(一点都非常大的数量也只须求短短几秒就伙同完了),旧数据将会被删去,新数据将会被载入

能够把耗时询问放到S上边来拉长主机的品质

能够运用复制来制止M持久化带来的花费,让三个S来持久化,但是相应防止M重启,因为M重启之后数据是空的,那时候若是同步的话S的数据也变为空了。就算是用redis的sentinel达成的高可用方案,也无须把持久化关了,说不定sentinel还没赶趟检查和测试到故障,M就已经宕机然后重启了。为了防止那种场地,建议M和S都打开持久化,上边就演示数据是什么丢失的:

  • A,B,C三台redis服务器,A是M,B和C是S
  • 因为有个别原因,A宕机了,它执行机关心保护启机制,这时候因为关闭了持久化,磁盘里是绝非备份数据的,内部存款和储蓄器里的数目也因为重启丢失了,所以重启之后数据总体丢了
  • B和C尝试同步,它们也不管A的数量是或不是空,照常同步过来了,所以B和C的数码也丢了

 

redis复制怎样处理过期的缓存?

  1. S不处理,而是等M处理过期后给S发送DEL命令
  2. 当M没有当即发送DEL命令,导致过期的缓存如故存在于S,S将会依照本身的逻辑时钟报告缓存已过期,并且安装为只读
  3. Lua脚本运营的时候,不实施缓存回收
  4. 假诺S变身为M,它立时本人执行缓存回收

 

行使Docker和NAT的地方,怎样安插?

应用端口转载和互联网地址转换的时候,redis复制要尤其小心,尤其是使用redis-sentiner,它是基于INFO命令来得到IP地址的,那种情景下能够配备IP端口映射,来让M获取到S正确的地址:

slave-announce-ip 5.5.5.5
slave-announce-port 1234

  

诸如此类M执行INFO命令看到S的IP就是炫耀过的:

# Replication
role:master
connected_slaves:1
slave0:ip=5.5.5.5,port=1234,state=online,offset=420,lag=1

  

INFO命令

透过info命令能够查看复制的参数和景况

$ src/redis-cli -h 192.168.56.10 -p 6381
192.168.56.10:6381> info
# Replication
role:master
connected_slaves:1
slave0:ip=192.168.56.10,port=6379,state=online,offset=644,lag=1
master_replid:b01608293384f8ea87b5bd0aabe081948f33a3dd
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:644
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:644

  

4.品质优化

1.调整缓冲队列的分寸来尽量达到增量复制而幸免全量复制,repl-backlog-size暗中认可1mb

 

5.参考资料

redis文档

redis实战

redis设计与贯彻