作用:redis replication -> 主从架构 -> 读写分离 -> 水平扩容支撑读高并发
如果主从复制过程中,网络连接断掉了,那么可以接着上次复制的地方,继续复制下去,而不是从头开始复制一份
master node会在内存中常见一个backlog,master和slave都会保存一个replica offset还有一个master id,offset就是保存在backlog中的。如果master和slave网络连接断掉了,slave会让master从上次的replica offset开始继续复制 但是如果没有找到对应的offset,那么就会执行一次resynchronization
master在内存中直接创建rdb,然后发送给slave,不会在自己本地落地磁盘了 redis.conf文件
repl-diskless-sync repl-diskless-sync-delay,等待一定时长再开始复制,因为要等更多slave重新连接过来slave不会过期key,只会等待master过期key。如果master过期了一个key,或者通过LRU淘汰了一个key,那么会模拟一条del命令发送给slave。
主从节点互相都会发送heartbeat信息 master默认每隔10秒发送一次heartbeat,salve node每隔1秒发送一个heartbeat
master每次接收到写命令之后,现在内部写入数据,然后异步发送给slave node
(1)master执行bgsave,在本地生成一份rdb快照文件 (2)master node将rdb快照文件发送给salve node,如果rdb复制时间超过60秒(repl-timeout),那么slave node就会认为复制失败,可以适当调节大这个参数 (3)对于千兆网卡的机器,一般每秒传输100MB,6G文件,很可能超过60s (4)master node在生成rdb时,会将所有新的写命令缓存在内存中,在salve node保存了rdb之后,再将新的写命令复制给salve node (5)client-output-buffer-limit slave 256MB 64MB 60,如果在复制期间,内存缓冲区持续消耗超过64MB,或者一次性超过256MB,那么停止复制,复制失败 (6)slave node接收到rdb之后,清空自己的旧数据,然后重新加载rdb到自己的内存中,同时基于旧的数据版本对外提供服务 (7)如果slave node开启了AOF,那么会立即执行BGREWRITEAOF,重写AOF
rdb生成、rdb通过网络拷贝、slave旧数据的清理、slave aof rewrite,很耗费时间
如果复制的数据量在4G~6G之间,那么很可能全量复制时间消耗到1分半到2分钟
(1)如果全量复制过程中,master-slave网络连接断掉,那么salve重新连接master时,会触发增量复制 (2)master直接从自己的backlog中获取部分丢失的数据,发送给slave node,默认backlog就是1MB (3)msater就是根据slave发送的psync中的offset来从backlog中获取数据的