Hadoop-HA高可用工作机制，自动故障转移机制

其他 2020-08-04 10:16:53 阅读次数: 0

Hadoop-HA高可用工作机制，自动故障转移机制

文章目录

Hadoop-HA高可用工作机制，自动故障转移机制

1 HA概述
2 HDFS-HA工作机制

2.1 HDFS-HA工作要点
2.2 HDFS-HA自动故障转移工作机制

1 HA概述

（1）HA（High Availablity），即高可用。

（2）实现高可用最关键的策略是消除单点故障。HA严格来说应该分成各个组件的HA机制：HDFS的HA和YARN的HA。

（3）Hadoop2.0之前，在HDFS集群中NameNode存在单点故障（SPOF）。

（4）NameNode主要在以下两个方面影响HDFS集群

NameNode机器发生意外，如宕机，集群将无法使用，直到管理员重启
NameNode机器需要升级，包括软件、硬件升级，此时集群也将无法使用

HDFS HA功能通过NameNode的状态（Active / Standby）来实现在集群中的管理，如果出现故障，如机器崩溃或机器需要升级维护，这时可通过此种方式将另一台NameNode的状态改成Active即可。

2 HDFS-HA工作机制

通过多个NameNode消除单点故障

2.1 HDFS-HA工作要点

1）元数据管理方式需要改变

内存中各自保存一份元数据；
Edits日志只有Active状态的NameNode节点可以做写操作</font；
所有的NameNode都可以读取Edits；
共享的Edits放在一个共享存储中管理（qjournal和NFS两个主流实现）；

2）需要一个状态管理功能模块

实现了一个zkfailover，常驻在每一个namenode所在的节点，每一个zkfailover 负责监控自己所在NameNode节点，利用zk进行状态标识，当需要进行状态切换时，由zkfailover来负责切换，切换时需要防止brain split现象的发生。

3）必须保证两个NameNode之间能够ssh无密码登录

4）隔离（Fence），即同一时刻仅仅有一个NameNode对外提供服务

2.2 HDFS-HA自动故障转移工作机制

在这里插入图片描述
自动故障转移为HDFS部署增加了两个新组件：ZooKeeper和ZKFailoverController（ZKFC）进程。ZooKeeper是维护少量协调数据，通知客户端这些数据的改变，和监视客户端故障的高可用服务。HA的自动故障转移依赖于ZooKeeper的以下功能：

1．故障检测

集群中的每个NameNode在ZooKeeper中维护了一个会话，如果机器崩溃，ZooKeeper中的会话将终止，ZooKeeper通知另一个NameNode需要触发故障转移。

2．现役NameNode选择

ZooKeeper提供了一个简单的机制，用于唯一的选择一个节点为active状态。如果目前现役NameNode崩溃，另一个节点可能从ZooKeeper获得，特殊的排外锁，以表明它应该成为现役NameNode。
ZKFC是自动故障转移中的另一个新组件，是ZooKeeper的客户端，也监视和管理NameNode的状态。每个运行NameNode的主机也运行了一个ZKFC进程，ZKFC负责：

1）健康监测

ZKFC使用一个健康检查命令定期地ping与之在相同主机的NameNode，只要该NameNode及时地回复健康状态，ZKFC认为该节点是健康的。如果该节点崩溃，冻结或进入不健康状态，健康监测器标识该节点为非健康的。

2）ZooKeeper会话管理

当本地NameNode是健康的，ZKFC保持一个在ZooKeeper中打开的会话。如果本地NameNode处于active状态，ZKFC也保持一个特殊的znode锁，该锁使用了ZooKeeper对短暂节点的支持，如果会话终止，锁节点将自动删除。

3）基于ZooKeeper的选择

如果本地NameNode是健康的，且ZKFC发现没有其它的节点当前持有znode锁，它将为自己获取该锁。如果成功，则它已经赢得了选择，并负责运行故障转移进程以使它的本地NameNode为Active。

猜你喜欢

转载自blog.csdn.net/qq_32727095/article/details/107678571

Hadoop-HA高可用工作机制，自动故障转移机制

Hadoop-HA机制工作原理

HDFS-HA高可用工作机制

HA高可用自动故障转移（最新，最详）

Hadoop HA自动故障转移搭建

Hadoop(5)-HA（High Available）高可用性机制

HDFS高可用（HA)机制

HA高可用手动故障转移

大数据集群环境搭建之一 hadoop-ha高可用安装

Hadoop-HA高可用架构分布式环境搭建教程

Hadoop之旅（7）— HDFS HA Zookeeper自动故障转移

高可用HA的namenode运行机制

hadoop hdfs 高可用性安装测试 zookeeper 自动故障转移

hadoop高可用机制配置

hadoop的高可用机制和联邦机制

HDFS的高可用工作原理（HA）的最权威分析

Hadoop-HA

【Hadoop故障处理】高可用（HA）环境DataNode问题

Hadoop HA高可用

hadoop的高可用(HA)

MySQL高可用架构故障自动转移插件MHA

如何手动搭建Hadoop-HA（高可用）模式？（内含报错和解决方法）

Hadoop的HA机制

hadoop HA机制

【学习】hadoop HA机制

Hadoop的HA机制浅析

Hadoop的HA机制的配置

7、基于 HA 机制的 Mycat 高可用--mycat

redis高可用结构sentinel工作机制

【大数据Hadoop】HDFS-HA模式下ZKFC(DFSZKFailoverController)高可用主备切换机制

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)