Redis中哨兵(Sentinel)模式的使用以及相关配置介绍


以下总结了关于Redis比较全面的知识笔记以及面试题,方便自己复习的同时希望对大家有所帮助。

序号 内容 链接地址
1 Redis的基础知识、单机版安装、数据类型介绍(老版本) https://blog.csdn.net/weixin_43246215/article/details/107474283
2 Redis常用命令、配置文件介绍、数据持久化方式、集群搭建 (老版本) https://blog.csdn.net/weixin_43246215/article/details/107947562
3 Redis的五种常用数据类型、三种特殊数据类型详解 https://blog.csdn.net/weixin_43246215/article/details/108041739
4 Redis基本的事务操作以及使用Redis实现乐观锁 https://blog.csdn.net/weixin_43246215/article/details/108045931
5 使用JedisAPI操作Redis以及Jedis实现Redis事务 https://blog.csdn.net/weixin_43246215/article/details/108067542
6 Redis的配置文件详解(中文) https://blog.csdn.net/weixin_43246215/article/details/108068245
7 Redis数据持久化的两种方式以及Redis实现订阅发布 https://blog.csdn.net/weixin_43246215/article/details/108068797
8 Redis的伪集群搭建以及主从复制原理 https://blog.csdn.net/weixin_43246215/article/details/108069472
9 Redis中哨兵(Sentinel)模式的使用以及相关配置介绍 https://blog.csdn.net/weixin_43246215/article/details/108088179
10 Redis中的缓存穿透、缓存击穿以及缓存雪崩(理论知识) https://blog.csdn.net/weixin_43246215/article/details/108089026
11 Spring整合Redis实现查询缓存以及同步缓存 待更新
12 SpringBoot整合Redis以及自定义Redis Template https://blog.csdn.net/weixin_43246215/article/details/108476328
13 Redis常见面试题 https://blog.csdn.net/weixin_43246215/article/details/108090095
14 待更新

概述

主从切换技术的方法是:当主服务器宕机后,需要手动把一台从服务器(Slave)切换为主服务器(Master),这就需要人工干预,费时费力,还会造成一段时间内服务不可用。

手动调节不是一种推荐的方式,更多的时候我们有限考虑哨兵(Sentinel)模式。Redis从2.8开始正式提供了Sentinel(哨兵)架构来解决这个问题。

哨兵模式相当于谋朝篡位的自动版,能够后台监控主机是否故障,如果故障了根据投票数自动将从库转换为主库。

单哨兵模式

哨兵模式是一种特殊的模式,首先Redis提供了哨兵的命令,哨兵是一个独立的进程,作为进程,它会独立运行,其原理就是哨兵通过发送命令,等到Redis服务器响应,从而监控运行的多个Redis实例。
在这里插入图片描述

哨兵的两个作用:

  • 通过发送命令,让Redis 服务器返回监控其运行状态,包括主服务器和从服务器。
  • 当哨兵检测到Master宕机时,会通过投票机制自动将Slave切换成Master,然后再通过发布订阅模式通知其它的从服务器,修改配置文件,让它们切换主机。

多哨兵模式

单个哨兵进程对Redis服务器进行监控时可能会出现一些问题(比如说哨兵挂掉),为此我们可以使用多个哨兵进行监控。各个哨兵之间还会进行监控,这样就形成了多哨兵模式。由于一个哨兵就需要一个进程,哨兵集群至少要三个哨兵才能保证健壮性,因此要配置多哨兵,起步就是6个进程。
在这里插入图片描述

多哨兵模式中,如果主机宕机了会怎么样?

假设主服务器宕机,哨兵1先检测到这个结果,但是系统并不会马上进行重新选举和filover过程,因为仅仅是哨兵1主观认为主服务器不可用,这个现象成为主观下线。当后面的哨兵也检测到主服务器连接不上了,并且数量达到一定值时(3个哨兵中两个哨兵检测主机不能使用了,那么就认为这个主机挂掉了),那么哨兵之间就会对从机中进行一次选举主机的投票,投票的结果由其中任意一个哨兵发起,然后进行failover(故障转移)操作,选举新主机成功后就将该从机切换成主机,之后就会通过发布订阅模式(所有的服务都被哨兵监控着),让各个哨兵把自己监控的从服务器实现切换主机,这个过程成为客观下线

测试单哨兵

集群还是之前使用的伪集群(一主二从,单机多服)

1、配置哨兵配置文件sentinel.conf

在Redis的bin目录下有一个redis.sentinel文件,这个文件用于启动哨兵的启动文件,接下来还需要一个哨兵的配置文件,我们需要自己去创建。
在bin目录下使用vim sentinel.conf去创建一个文件并且写入以下命令:

# sentinel  monitor 被监控的名称  host  port  1
sentinel monitor myredis  192.168.15.133  6379  1

后面的数字1表示的是:如果主机挂了,Slave投票看谁成为新主机,票数最多的就会成为主机,这个1就相当于一个是主机的标志。

注意:上面的配置是开启哨兵的最关键的配置,拼写不能写错了,如果写错了或者少写就会启动哨兵失败。

2、启动哨兵

配置好第一步的文件后,首先我们还是使用的一主二从的伪集群,79端口为主机,80、81端口为79的从机,并且三个服务器都启动并且连接上Redis,第四个用于启动命令测试。
在这里插入图片描述
第四个窗口中执行命令:./redis.sentinel sentinel.conf
在这里插入图片描述
执行启动哨兵之后就如上图所示,有相关端口26379,并且输出哪个是主节点,主节点下从机的个数,并且启动哨兵之后不断地监控着主机和从机,如果主机或者从机发生宕机了或者出问题了就会输出对应的信息,并且做相应的操作。

3、假设主机6379宕机(断开连接)了,哨兵会做一些什么操作?

如果主节点Master断开连接了,这个时候哨兵会通过投票机制从机中随机选择一个服务器。

  • 主机6379挂掉:
    在这里插入图片描述
  • 哨兵日志就会输出下列信息:
    在这里插入图片描述

当主机挂掉以后,哨兵会检测到该主机连接断开了,那么它会重新再去检测一下,如果还是断开连接的,那么就开始在从机中进行选举,选举出一个新的主机,接着进行故障转移fileover,上图测试中将从机6381选举成了主机,并且将其它服务器设置为新主机的从机,连断开的那个主机也设置成新主机的从机,从最后三行代码可以知道,如果这个时候主机连接上来了,那么它也会被设置为新主机的从机,这就是哨兵模式。

哨兵模式的优缺点

优点

  • 哨兵集群,基于主从复制模式,所有的主从配置的优点,它都有。
  • 主从可以切换,故障可以转移,系统的可用性就会更好。
  • 哨兵模式就是主从模式的升级版,从收到到自动,更加健壮。

缺点

  • Redis不好在线扩容,集群容量一旦达到上限,在线扩容就会十分麻烦。
  • 实现哨兵模式的配置比较麻烦,并且其中有很多选项。

哨兵模式配置文件中的全部配置

# Example   sentinel.conf
# 哨兵sentinel实例运行的端口   默认是26379,如果有哨兵集群,我们还需要配置每个哨兵端口
port 26379

#哨兵sentinel的工作目录
dir /tmp

下面这项是哨兵配置的重点

#哨兵 sentine1 监控的redis主节点的 ip port   
# master-name  ,可以自己命名的主节点名字 只能由字母A-Z、数字0-9、这三个字符"  .   -  _ "组成。
# quorum配置多少个sentine1哨兵统- -认为master主节点失联那么这时客观上认为主节点失联了
# sentine1 monitor <master-name> <ip> <redis-port> <quorum>
sentinel monitor mymaster   127.0.0.1   6379   2
#当在Redis实例中开启了requirepass foobared 授权密码这样所有连接kedis实例的客户端都要提供密码
#设置哨兵sentinel连接主从的密码注意必须为主从设置- - 样的验证密码
# sentine1 auth-pass <master-name> <password>
sentine1 auth-pass mymaster MySUPER--secret-0123passwOrd

#指定多少毫秒之后主节点没有应答哨兵sentine1 此时哨兵主观上认为主节点下线默认30秒
# sentinel down-after-mi 11i seconds <master-name> <mi 11iseconds>
sentine1 down-after-mi 11iseconds mymaster 30000

#这个配置项指定了在发生failover主备切换时最多可以有多少个slave同时对新的master进行同步,这个数字越小,完成fai lover所需的时间就越长,但是如果这个数字越大,就意味着越多的slave因为replication而 不可用。可以通过将这个值设为1来保证每次只有一个slave处于不能处理命令请求的状态。
# sentine1 paralle1-syncs <master-name> <numslaves>
sentine1 paralle1-syncs mymaster 1

#故障转移的超时时间failover-timeout 可以用在以下这些方面:
#1.同一个sentine1对同一 个master两次fai lover之间的间隔时间。
#2.当一个slave从一 个错误的master那里同步数据开始计算时间。直到s1ave被纠正为向正确的master那里同步数据时。
#3.当想要取消一个正在进行的failover所需要的时间。
#4.当进行failover时,配置所有s1aves指向新的master所需的最大时间。不过,即使过了这个超时,slaves 依然会被正确配置为指向master,但是就不按parallel-syncs所配置的规则来了
#默认三分钟
# sentine1 failover-timeout <master-name> <milliseconds>
sentine1 fai lover-ti meout mymaster 180000

# SCRIPTS EXECUTION
#配置当某一事件发生时所需要执行的脚本,可以通过脚本来通知管理员,例如当系统运行不正常时发邮件通知相关人员。
#对于脚本的运行结果有以下规则:
#若脚本执行后返回1,那么该脚本稍后将会被再次执行,重复次数目前默认为10
#若脚本执行后返回2,或者比2更高的一个返回值,脚本将不会重复执行。
#如果脚本在执行过程中由于收到系统中断信号被终止了,则同返回值为1时的行为相同。
#一个脚本的最大执行时间为60s,如果超过这个时间,脚本将会被-一个SIGKILL信号终止,之后重新执行。

#通知型脚本:当sentine1有任何警告级别的事件发生时(比如说redis实例的主观失效和客观失效等等),将会去调用这个脚本,这时这个脚本应该通过邮件,SMS等 方式去通知系统管理员关于系统不正常运行的信息。调用该脚本时,将传给脚本两个参数,一 个是事件的类型,一个是事件的描述。如果sentine1. conf配置文件中配置了这个脚本路径,那么必须保证这个脚本存在于这个路径,并且是可执行的,否则sentine1无法正常启动成功。
#通知脚本
# she11编程
# sentine1 notification-script <master-name> <script-path>
sentine1 notificati on-script mymaster /var/redis/notify. sh

#客户端重新配置主节点参数脚本
#当一个master由于failover而发生改变时,这个脚本将会被调用,通知相关的客户端关于master地址已经发生改变的信息。
#以下参数将会在调用脚本时传给脚本: 
# <master-name> <role> <state> <from-ip> <from-port> <to-ip> <to-port>
#目前<state>总是“failover",
# <role>是“Teader"或者"observer"中的-一个。
#参数from-ip, from-port, to-ip,to-port是用来和旧的master和新的master(即旧的s lave)通信的
#这个脚本应该是通用的,能被多次调用,不是针对性的。
# sentine1 client-reconfig-script <master-name> <script-path>
sentine1 client-reconfig-script mymaster /var/redis/reconfig.sh #一般都是由运维来配置!

猜你喜欢

转载自blog.csdn.net/weixin_43246215/article/details/108088179