分布式设计-哨兵

  • 作用
    • 监控redis服务器的运行状态, 可以进行自动故障转移(failover), 实现高可用
    • 与 数据库主从 配合使用的机制
  • 特点
    • 独立的进程, 每台redis服务器应该至少配置一个哨兵程序
    • 监控redis主服务器的运行状态
    • 出现故障后可以向管理员/其他程序发出通知
    • 针对故障,可以进行自动转移, 并向客户端提供新的访问地址

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

  • 流言协议
    • 当某个哨兵程序ping 发现监视的主服务器下线后(心跳检测), 会向监听该服务器的其他哨兵询问, 是否确认主服务器下线, 当 确认的哨兵数量 达到要求(配置文件中设置)后, 会确认主服务器下线(客观下线), 然后进入投票环节
  • 投票协议
    • 当确认主服务器客观下线后, 哨兵会通过 投票的方式 来授权其中一个哨兵主导故障转移处理
    • 只有在 大多数哨兵都参加投票 的前提下, 才会进行授权, 比如有5个哨兵, 则需要至少3个哨兵投票才可能授权
    • 目的是避免出现错误的故障迁移
  • 建议最低配置
    • 至少在3台服务器上分别启动至少一个哨兵
    • 如果只有一台, 则服务器宕机后, 将无法进行故障迁移
    • 如果只有两台, 一旦一个哨兵挂掉了, 则投票会失败
  • 相关配置 (sentinel.conf)
    bind 127.0.0.1  # 哨兵绑定的ip
    port 26381  # 哨兵监听的端口号, redis客户端需要访问哨兵的ip和端口号
    sentinel monitor mymaster 127.0.0.1 6380 2  # 设置哨兵  (主数据库别名 主数据库ip 主数据库端口 确认下线的最小哨兵数量)
    
    sentinel down-after-milliseconds mymaster 60000  # 服务器断线超时时长
    sentinel failover-timeout mymaster 180000  # 故障转移的超时时间
    sentinel parallel-syncs mymaster 1  # 执行故障转移时,最多几个从数据库可以同时同步主数据库数据(数量少会增加完成转移的时长; 数量多则正在同步的从数据库会因同步而无法提供数据查询功能)
  • 启动哨兵
    sudo redis-sentinel sentinel.conf
  • python通过哨兵访问redis
    • redis-py中就集成了哨兵功能

mysql官方没有提供故障转移方案, 需要用第三方的服务, 如 keepalive等

猜你喜欢

转载自www.cnblogs.com/oklizz/p/11414376.html