Hadoop--HA架构详解 - 代码天地

Hadoop--HA架构详解

其他 2019-04-15 19:10:55 阅读次数: 0

一、HA架构工作背景

HDFS集群中的nameNode存在单点故障因素。对于只有一个nameNode工作的集群来说，一旦nameNode出现意外情况，会导致整个集群无法工作，直到nameNode重新启动。
为了解决上述问题，Hadoop给出了高容错，高可用的HA方案：一个HDFS集群至少存在两个nameNode，一个nameNode处在active（主）状态，其他nameNode处在standby（备）状态。一旦处于activate状态的nameNode发生意外，其他处于standby状态的nameNode立即抢占activate的临时节点，代替发生意外的nameNode继续对外提供服务，从而保证了整个HDFS集群处在正常工作状态。

二、主备数据同步

想要备nameNode接替主nameNode工作，那么必须保证备nameNode和主nameNode拥有相同的内存数据。
主nameNode主要有以下数据需要进行频繁同步：edits log（日志）、block列表信息以及DataNode心跳检测
2.1首先说日志的同步：
同步edits log数据是借助第三方JNN（ Journal Nodes ）提供的服务。客户端对主nameNode操作，主nameNode将edits log写到JNN集群，备nameNode从JNN集群上读取数据，同步内存数据。可是主nameNode发生意外，导致JNN集群上各服务器上的数据不一致怎么办呢？JNN集群最少有三台服务器，一旦JNN服务器上的数据不一致，立即进行投票选举，通过过半机制保证数据的一致性（即以多数为准），舍掉与多数不一致的数据，然后在将数据同步给舍掉数据的服务器，保证了数据的一致性。
2.2、介绍一下JNN
JNN的过半机制：
如果主nameNode向三台JNN写数据，只要保证过半JNN写成功，就返回成功， JNN根据过半机制，进行数据在三台JNN上同步。
最终一致性：最终三台JNN上的edits信息是一致的。
JNN上的edits只能有一台nameNode写信息，防止脑裂。
2.3、block列表的同步：
DataNode主动向各台nameNode发送block列表信息和心跳。从而保证了主备之间block的一致性。
2.4、合并文件
原来HDFS上的secondarynameNode的合并fsimages（镜像）与edits（日志）文件的工作，现在交给备nameNode进行，备用nameNode一小时合并一次并推送给主nameNode，在不满一小时的情况下，如果edits文件的操作达到100w,也要进行合并。

三、自动切换nameNode

主nameNode和备nameNode的切换时自动切换的，通过zookeeper集群来完成！

首先添加zookeeper集群，在每个nameNode上运行一个zkfc进程（zkfc是zookeeper的客户端）。zkfc要和zookeeper集群保持长连接和心跳。

在集群启动的时候，两个NameNode都处于standby状态，两个nameNode的各自的zkfc要向zookeeper集群抢占创建一个临时节点，该临时节点保存了主nameNode的信息，哪个zkfc创建成功，则哪个zkfc所在主机上的nameNode为主nameNode。

nameNode上的zkfc要监控主nameNode创建的临时节点，一旦主nameNode出现故障，zkfc将删除该临时节点（实际上是因为主nameNode上的zkfc不能和zookeeper集群保持心跳连接，临时节点消失），临时节点消失，则备nameNode上的zkfc要向zookeeper集群抢占创建临时节点，如果创建成功，备nameNode升级为主nameNode。
在备份nameNode升级为主nameNode之前，要和原来的nameNode通信，确保原来的nameNode已经不能提供服务。如果原来的nameNode是由于网络延迟等原因导致的临时节点消失（也就是说还能提供服务），则杀死原来的nameNode。

最后我想说的是，这服务器之间的竞争太他妈激烈了！！！！！

猜你喜欢

转载自blog.csdn.net/weixin_43462670/article/details/89172603

Hadoop--HA架构详解

Hadoop--HA(高可用)

Hadoop HA架构剖析

Hadoop HA 架构

Hadoop HA架构搭建

hadoop ha原理详解

Hadoop HA 是什么？架构？

hadoop + zookeeper HA架构搭建

Hadoop HA——hdfs haadmin 详解

hadoop hdfs + yarn HA 详解

配置hadoop的HA架构的集群种类

部署Hadoop环境（三）HA架构与部署

Hadoop 高可用性HA架构

Hadoop HA 架构图概述

Hadoop之YARN HA架构剖析

Hadoop之HDFS HA架构剖析

Hadoop2.7.1 HA安装部署详解

Hadoop - HDFS - MapReduce - YARN - HA详解

Hadoop详解（五）：HDFS HA 和 Federation

Hadoop HA 高可用（重点详解）

【Hadoop】Hadoop体系架构详解

Hadoop HA

hadoop的HA

Hadoop——HA

大数据Hadoop的HA高可用架构集群部署

hadoop yarn HA 高可用架构简易集群配置

Hadoop高级之HDFS&YARN HA架构剖析

Hadoop基础（四） --- HA介绍，HA架构，部署HA，Set Rack Aware 设定机架感知，distcp， archive，数据校验和

Hadoop 2.0 HA高可用集群配置详解

Hadoop 2.6.0 HA高可用集群配置详解

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)