[센티넬] 센티넬 레디 스 클러스터의 클러스터 레디 스

센티넬의 레디 스 클러스터

 

첫째, 마스터 - 슬레이브 복제 배경 문제

Redis마스터 사본이 노드 데이터의 마스터 노드에 동기화 할 수 있으며,이 노드로부터 이번에는 두 가지 기능을 갖는다 :

  • 마스터 노드가 다운되면, 상위 노드와 백업 마스터 노드는 언제든지 할 수있다.
  • 확장 기능은 마스터 노드, 마스터 노드 공유 압력 판독 값을 읽을 수 있습니다.

하지만 문제는 다음과 같습니다

  • 기본 노드가 상위 노드에서 다운되면, 다음 필요가 인위적으로 (새 마스터 주소로) 모든 응용 프로그램 측의 기본 노드 주소를 수정할 수 있지만 새 마스터 노드 복제에서 모든 명령

그래서이 문제 레디 스-감시가 해결됩니다

二, 레디 스 - 센티넬

레디 스 - 센티넬은 레디 스 관계자는, 고 가용성 솔루션을 권장 
마스터 자체 다운, 자체 레디 스 경우, 고 가용성 레디 스 마스터 - 슬레이브로 사용되거나 클라이언트가 전환에서 주요 기능을 달성하지 않았을 때. 

프로세스 레디 스 - 센티넬 독립 실행 형, 다중 마스터 - 슬레이브 클러스터 모니터링을위한 
자동 검색 마스터 다운 타임을 자동으로> 마스터 슬레이브 전환합니다.

세, 센티넬의 작품

두 번째 마스터, 슬레이브, 그리고 다른 예는 ping 명령을 알고 전송하는 센티넬 주파수 당 각 센티넬 
 

마지막 유효 응답 시간에서 인스턴스 (인스턴스) PING 명령을 다운 초과하는 경우 -after- 옵션이 지정 (밀리 초) 값은 다음 인스턴스는 주관적인 센티넬 오프라인으로 표시됩니다. 

마스터가 주관적 오프라인으로 표시되어 있으면,이 주파수의 모든 센티넬의 마스터를 모니터링 초에 한 번 확인 마스터 당 참으로 주관적인 오프라인 상태를 입력 할 수 있습니다. 

(지정된 값 프로필 이상)의 충분한 수의 지정된 시간 내에 확인 마스터 주관적 오프라인 상태로 진입했을 때 센티넬 마스터는 오프라인 대물 표시 될 

것이다 각 센티넬 일반적 매 10 , 슬레이브는 INFO 명령을 보낸다는 알려진 주파수로 모든 마스터 일단 초 

마스터 센티넬 목적은 오프라인으로 표시되는 경우, 주파수 센티넬 오프라인 마스터 슬레이브는 INFO 명령에서 입금 보낸다 10 초 시간 초당 한 번 

조립 라인에서왔다 마스터 센티넬 동의의 충분한 수없는 경우, 목적 오프라인 마스터 상태가 제거됩니다. 

PING 명령에 센티넬 반환에 마스터 유효 응답은, 마스터 주관적 오프라인 상태가 제거됩니다. 

주관적 및 객관적 오프라인 오프라인

주관적 오프라인 : 주관적 아래로, 오프라인 센티넬은 서버의 현재 인스턴스가 레디 스를 만든 결정 참조 SDOWN을 언급했다. 
목표 오프라인 객관적 다운 지칭 ODOWN은 센티넬 SDOWN 마스터 서버의 판정을 복수의 인스턴스를 지칭하고 SENTINEL하여 IS - 마스터 다운 - 부산물 교환 ADDR 명령, 상기 마스터 서버 유도 후 오프라인 판사, 다음 장애 조치를 엽니 다. 

적절한 SDOWN을 마스터와 슬레이브를 들어, 센티넬은 주인이이 주 서버의 조립 라인에서 센티넬 센티넬에게 밖으로 다른, 자동 장애 복구 작업을 선출 할 수 ODOWN를 입력 발견 한 것처럼. 

ODOWN의 경우에만, 레디 스 인스턴스에 슬레이브, 센티넬들이 조립 라인 전에 불필요한 협의로 결정된다 마스터에 적용, 그래서 슬레이브 센티넬은 ODOWN에 도달하지 않았다.
코드보기

넷째, 마스터 - 슬레이브 복제 아키텍처

다섯, 레디 스 센티넬 아키텍처

센티넬은 공정 레디 스이지만, 데이터, 단지 모니터링 레디 스를 저장하지 않습니다

여섯, 레디 스 명령

复制代码
공식 웹 사이트 주소 : HTTP : //redisdoc.com/ 

레디 스-CLI 정보 #보기 레디 스 데이터베이스 정보 

레디 스-CLI 정보를 복제 #보기 레디 스 권한 부여 정보 복사 

레디 스-CLI 정보 감시 번호의 레디 스보기 센티넬 정보
复制代码

세븐, 환경 구성

레디 스 센티넬 자동 주요 오류로 전환

复制代码
# 准备3个redis数据库实例
主库:端口6379
从库:端口6380
从库:端口6381

# 准备3个redis-sentinel哨兵
redis-server redis-6379.conf 
redis-server redis-6380.conf 
redis-server redis-6381.conf 

# 三个哨兵同时监测主库6379的运行状况,宕机后三个哨兵根据算法选择从库中的一个切换成主库
复制代码

redis数据库实例

生成数据文件夹

mkdir -p /var/redis/data/{6379,6380,6381}

主库6379配置文件redis-6379.conf 

port 6379
daemonize yes
logfile "6379.log"
dbfilename "dump-6379.rdb"
dir "/var/redis/data/6379"

从库6380配置文件redis-6380.conf 

port 6380
daemonize yes
logfile "6380.log"
dbfilename "dump-6380.rdb"
dir "/var/redis/data/6380" 
slaveof 127.0.0.1 6379   

从库6381配置文件redis-6381.conf 

port 6381
daemonize yes
logfile "6380.log"
dbfilename "dump-6380.rdb"
dir "/var/redis/data/6381" 
slaveof 127.0.0.1 6379   

分别启动三个redis数据库实例 

redis-server redis-6379.conf 
redis-server redis-6380.conf 
redis-server redis-6381.conf 

准备三个redis-sentinel哨兵的配置文件

创建配置文件

touch redis-sentinel-26379.conf
touch redis-sentinel-26380.conf
touch redis-sentinel-26381.conf

参数详解

port 26379  
dir /var/redis/data/26379
logfile "26379.log"

// 当前Sentinel节点监控 127.0.0.1:6379 这个主节点
// 2代表判断主节点失败至少需要2个Sentinel节点节点同意
// mymaster是主节点的别名
sentinel monitor s20master 127.0.0.1   6379  2

//每个Sentinel节点都要定期PING命令来判断Redis数据节点和其余Sentinel节点是否可达,如果超过30000毫秒30s且没有回复,则判定不可达
sentinel down-after-milliseconds s20master 30000

//当Sentinel节点集合对主节点故障判定达成一致时,Sentinel领导者节点会做故障转移操作,选出新的主节点,
原来的从节点会向新的主节点发起复制操作,限制每次向新的主节点发起复制操作的从节点个数为1
sentinel parallel-syncs s20master 1

//故障转移超时时间为180000毫秒
sentinel failover-timeout s20master 180000
//让哨兵在后台运行
daemonize yes
View Code

注意

如果主库中设置了密码,我们需要在哨兵配置文件中加上下面的参数:

1
2
3
protected - mode no
 
sentinel auth - pass

redis-sentinel-26379.conf

复制代码
port 26379  
dir /var/redis/data/26379
logfile "26379.log"
sentinel monitor s20master 127.0.0.1   6379  2
sentinel down-after-milliseconds s20master 30000
sentinel parallel-syncs s20master 1
sentinel failover-timeout s20master 180000
daemonize yes
复制代码

redis-sentinel-26380.conf

复制代码
port 26380  
dir /var/redis/data/26380
logfile "26380.log"
sentinel monitor s20master 127.0.0.1   6379  2
sentinel down-after-milliseconds s20master 30000
sentinel parallel-syncs s20master 1
sentinel failover-timeout s20master 180000
daemonize yes
复制代码

redis-sentinel-26380.conf

复制代码
port 26381
dir /var/redis/data/26381
logfile "26381.log"
sentinel monitor s20master 127.0.0.1   6379  2
sentinel down-after-milliseconds s20master 30000
sentinel parallel-syncs s20master 1
sentinel failover-timeout s20master 180000
daemonize yes
复制代码

分别运行三个哨兵进程

redis-sentinel redis-26379.conf 
redis-sentinel redis-26380.conf 
redis-sentinel redis-26381.conf 

# 保证sentinel的配置正确,否则,你在启动报错后,配置文件的内容会发生变化,这是个坑!!!!

检查redis的哨兵状态

redis-cli -p 26379 info sentinel
redis-cli -p 26380 info sentinel
redis-cli -p 26381 info sentinel
复制代码
sentinel_masters:1
sentinel_tilt:0
sentinel_running_scripts:0
sentinel_scripts_queue_length:0
sentinel_simulate_failure_flags:0
# 看到最后一条信息正确即成功了哨兵,哨兵主节点名字叫做s20master,状态ok,监控地址是127.0.0.0:6379,有两个从节点,3个哨兵
master0:name=s20master,status=ok,address=127.0.0.1:6379,slaves=2,sentinels=3
复制代码

八、redis高可用故障实验

大致思路

  • 杀掉主节点的redis进程6379端口,观察从节点是否会进行新的master选举,进行切换
  • 重新恢复旧的“master”节点,查看此时的redis身份

首先查看三个redis的进程状态

检查三个节点的复制身份状态

redis-cli -p 端口 info replication

【6379】

复制代码
[root@szx / 17:18:24]#redis-cli -p 6379 info replication
# Replication
role:master
connected_slaves:2  # 两个从库
slave0:ip=127.0.0.1,port=6380,state=online,offset=837877,lag=1
slave1:ip=127.0.0.1,port=6381,state=online,offset=838011,lag=0
master_replid:a4ecb61110814dc5b117db545c0c96c904990fc4
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:838011
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:838011
复制代码

【6380】

复制代码
[root@szx / 17:19:14]#redis-cli -p 6380 info replication
# Replication
role:slave
master_host:127.0.0.1   # 主库ip
master_port:6379     # 主库端口
master_link_status:up  # 状态正常
master_last_io_seconds_ago:1
master_sync_in_progress:0
slave_repl_offset:852447
slave_priority:100
slave_read_only:1
connected_slaves:0
master_replid:a4ecb61110814dc5b117db545c0c96c904990fc4
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:852447
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:852447
复制代码

【6381】

复制代码
[root@szx / 17:20:27]#redis-cli -p 6381 info replication
# Replication
role:slave
master_host:127.0.0.1
master_port:6379
master_link_status:up
master_last_io_seconds_ago:0
master_sync_in_progress:0
slave_repl_offset:874725
slave_priority:100
slave_read_only:1
connected_slaves:0
master_replid:a4ecb61110814dc5b117db545c0c96c904990fc4
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:874725
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:15
repl_backlog_histlen:874711
复制代码

此时,干掉master!!!然后等待其他两个节点是否能自动被哨兵sentienl,切换为master节点

查看剩余的6380和6381的节点身份

注意:重新启动6379redis服务

一、主从复制背景问题

Redis主从复制可将主节点数据同步给从节点,从节点此时有两个作用:

  • 一旦主节点宕机,从节点作为主节点的备份可以随时顶上来。
  • 扩展主节点的读能力,分担主节点读压力。

但是问题是:

  • 一旦主节点宕机,从节点上位,那么需要人为修改所有应用方的主节点地址(改为新的master地址),还需要命令所有从节点复制新的主节点

那么这个问题,redis-sentinel就可以解决了

二、Redis-Sentinel

Redis-Sentinel是redis官方推荐的高可用性解决方案,
当用redis作master-slave的高可用时,如果master本身宕机,redis本身或者客户端都没有实现主从切换的功能。

而redis-sentinel就是一个独立运行的进程,用于监控多个master-slave集群,
自动发现master宕机,进行自动切换slave > master。

三、Sentinel工作方式

每个Sentinel以每秒钟一次的频率向它所知的Master,Slave以及其他 Sentinel 实例发送一个 PING 命令
 

如果一个实例(instance)距离最后一次有效回复 PING 命令的时间超过 down-after-milliseconds 选项所指定的值, 则这个实例会被 Sentinel 标记为主观下线。

如果一个Master被标记为主观下线,则正在监视这个Master的所有 Sentinel 要以每秒一次的频率确认Master的确进入了主观下线状态。

当有足够数量的 Sentinel(大于等于配置文件指定的值)在指定的时间范围内确认Master的确进入了主观下线状态, 则Master会被标记为客观下线

在一般情况下, 每个 Sentinel 会以每 10 秒一次的频率向它已知的所有Master,Slave发送 INFO 命令

当Master被 Sentinel 标记为客观下线时,Sentinel 向下线的 Master 的所有 Slave 发送 INFO 命令的频率会从 10 秒一次改为每秒一次

若没有足够数量的 Sentinel 同意 Master 已经下线, Master 的客观下线状态就会被移除。

若 Master 重新向 Sentinel 的 PING 命令返回有效回复, Master 的主观下线状态就会被移除。

主观下线和客观下线

主观下线:Subjectively Down,简称 SDOWN,指的是当前 Sentinel 实例对某个redis服务器做出的下线判断。
客观下线:Objectively Down, 简称 ODOWN,指的是多个 Sentinel 实例在对Master Server做出 SDOWN 判断,并且通过 SENTINEL is-master-down-by-addr 命令互相交流之后,得出的Master Server下线判断,然后开启failover.

SDOWN适合于Master和Slave,只要一个 Sentinel 发现Master进入了ODOWN, 这个 Sentinel 就可能会被其他 Sentinel 推选出, 并对下线的主服务器执行自动故障迁移操作。

ODOWN只适用于Master,对于Slave的 Redis 实例,Sentinel 在将它们判断为下线前不需要进行协商, 所以Slave的 Sentinel 永远不会达到ODOWN。
View Code

四、主从复制架构

五、Redis Sentinel架构

Sentinel是redis的一个进程,但是不存储数据,只是监控redis

六、redis命令

复制代码
官网地址:http://redisdoc.com/

redis-cli info #查看redis数据库信息

redis-cli info replication #查看redis的复制授权信息

redis-cli info sentinel   #查看redis的哨兵信息
复制代码

七、环境配置

redis的哨兵,自动的主从故障切换

复制代码
# 准备3个redis数据库实例
主库:端口6379
从库:端口6380
从库:端口6381

# 准备3个redis-sentinel哨兵
redis-server redis-6379.conf 
redis-server redis-6380.conf 
redis-server redis-6381.conf 

# 三个哨兵同时监测主库6379的运行状况,宕机后三个哨兵根据算法选择从库中的一个切换成主库
复制代码

redis数据库实例

生成数据文件夹

mkdir -p /var/redis/data/{6379,6380,6381}

主库6379配置文件redis-6379.conf 

port 6379
daemonize yes
logfile "6379.log"
dbfilename "dump-6379.rdb"
dir "/var/redis/data/6379"

从库6380配置文件redis-6380.conf 

port 6380
daemonize yes
logfile "6380.log"
dbfilename "dump-6380.rdb"
dir "/var/redis/data/6380" 
slaveof 127.0.0.1 6379   

从库6381配置文件redis-6381.conf 

port 6381
daemonize yes
logfile "6380.log"
dbfilename "dump-6380.rdb"
dir "/var/redis/data/6381" 
slaveof 127.0.0.1 6379   

分别启动三个redis数据库实例 

redis-server redis-6379.conf 
redis-server redis-6380.conf 
redis-server redis-6381.conf 

准备三个redis-sentinel哨兵的配置文件

创建配置文件

touch redis-sentinel-26379.conf
touch redis-sentinel-26380.conf
touch redis-sentinel-26381.conf

参数详解

port 26379  
dir /var/redis/data/26379
logfile "26379.log"

// 当前Sentinel节点监控 127.0.0.1:6379 这个主节点
// 2代表判断主节点失败至少需要2个Sentinel节点节点同意
// mymaster是主节点的别名
sentinel monitor s20master 127.0.0.1   6379  2

//每个Sentinel节点都要定期PING命令来判断Redis数据节点和其余Sentinel节点是否可达,如果超过30000毫秒30s且没有回复,则判定不可达
sentinel down-after-milliseconds s20master 30000

//当Sentinel节点集合对主节点故障判定达成一致时,Sentinel领导者节点会做故障转移操作,选出新的主节点,
原来的从节点会向新的主节点发起复制操作,限制每次向新的主节点发起复制操作的从节点个数为1
sentinel parallel-syncs s20master 1

//故障转移超时时间为180000毫秒
sentinel failover-timeout s20master 180000
//让哨兵在后台运行
daemonize yes
View Code

注意

如果主库中设置了密码,我们需要在哨兵配置文件中加上下面的参数:

1
2
3
protected - mode no
 
sentinel auth - pass

redis-sentinel-26379.conf

复制代码
port 26379  
dir /var/redis/data/26379
logfile "26379.log"
sentinel monitor s20master 127.0.0.1   6379  2
sentinel down-after-milliseconds s20master 30000
sentinel parallel-syncs s20master 1
sentinel failover-timeout s20master 180000
daemonize yes
复制代码

redis-sentinel-26380.conf

复制代码
port 26380  
dir /var/redis/data/26380
logfile "26380.log"
sentinel monitor s20master 127.0.0.1   6379  2
sentinel down-after-milliseconds s20master 30000
sentinel parallel-syncs s20master 1
sentinel failover-timeout s20master 180000
daemonize yes
复制代码

redis-sentinel-26380.conf

复制代码
port 26381
dir /var/redis/data/26381
logfile "26381.log"
sentinel monitor s20master 127.0.0.1   6379  2
sentinel down-after-milliseconds s20master 30000
sentinel parallel-syncs s20master 1
sentinel failover-timeout s20master 180000
daemonize yes
复制代码

分别运行三个哨兵进程

redis-sentinel redis-26379.conf 
redis-sentinel redis-26380.conf 
redis-sentinel redis-26381.conf 

# 保证sentinel的配置正确,否则,你在启动报错后,配置文件的内容会发生变化,这是个坑!!!!

检查redis的哨兵状态

redis-cli -p 26379 info sentinel
redis-cli -p 26380 info sentinel
redis-cli -p 26381 info sentinel
复制代码
sentinel_masters:1
sentinel_tilt:0
sentinel_running_scripts:0
sentinel_scripts_queue_length:0
sentinel_simulate_failure_flags:0
# 看到最后一条信息正确即成功了哨兵,哨兵主节点名字叫做s20master,状态ok,监控地址是127.0.0.0:6379,有两个从节点,3个哨兵
master0:name=s20master,status=ok,address=127.0.0.1:6379,slaves=2,sentinels=3
复制代码

八、redis高可用故障实验

大致思路

  • 杀掉主节点的redis进程6379端口,观察从节点是否会进行新的master选举,进行切换
  • 重新恢复旧的“master”节点,查看此时的redis身份

首先查看三个redis的进程状态

检查三个节点的复制身份状态

redis-cli -p 端口 info replication

【6379】

复制代码
[root@szx / 17:18:24]#redis-cli -p 6379 info replication
# Replication
role:master
connected_slaves:2  # 两个从库
slave0:ip=127.0.0.1,port=6380,state=online,offset=837877,lag=1
slave1:ip=127.0.0.1,port=6381,state=online,offset=838011,lag=0
master_replid:a4ecb61110814dc5b117db545c0c96c904990fc4
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:838011
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:838011
复制代码

【6380】

复制代码
[root@szx / 17:19:14]#redis-cli -p 6380 info replication
# Replication
role:slave
master_host:127.0.0.1   # 主库ip
master_port:6379     # 主库端口
master_link_status:up  # 状态正常
master_last_io_seconds_ago:1
master_sync_in_progress:0
slave_repl_offset:852447
slave_priority:100
slave_read_only:1
connected_slaves:0
master_replid:a4ecb61110814dc5b117db545c0c96c904990fc4
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:852447
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:852447
复制代码

【6381】

复制代码
[root@szx / 17:20:27]#redis-cli -p 6381 info replication
# Replication
role:slave
master_host:127.0.0.1
master_port:6379
master_link_status:up
master_last_io_seconds_ago:0
master_sync_in_progress:0
slave_repl_offset:874725
slave_priority:100
slave_read_only:1
connected_slaves:0
master_replid:a4ecb61110814dc5b117db545c0c96c904990fc4
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:874725
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:15
repl_backlog_histlen:874711
复制代码

此时,干掉master!!!然后等待其他两个节点是否能自动被哨兵sentienl,切换为master节点

查看剩余的6380和6381的节点身份

注意:重新启动6379redis服务

추천

출처www.cnblogs.com/youxiu123/p/11493184.html