HDFS-HA 集群搭建

当前 HDFS 集群的规划

hadoop102 hadoop103 hadoop104
NameNode Secondarynamenode
DataNode DataNode DataNode

HA 的主要目的是消除 namenode 的单点故障,需要将 hdfs 集群规划成以下模样

hadoop102 hadoop103 hadoop104
NameNode NameNode NameNode
DataNode DataNode DataNode

HDFS-HA 核心问题

1,怎么保证三台 namenode 的数据一致
(1)Fsimage:让一台 nn 生成数据,让其他机器 nn 同步
(2)Edits:需要引进新的模块 JournalNode 来保证 edtis 的文件的数据一致性

2,怎么让同时只有一台 nn 是 active(活跃的),其他所有是 standby(备用的)
(1)手动分配
(2)自动分配

3,2nn 在 ha 架构中并不存在,定期合并 fsimage 和 edtis 的活谁来干
(1)由 standby 的 nn 来干

4,如果 nn 真的发生了问题,怎么让其他的 nn 上位干活
(1)手动故障转移
(2)自动故障转移

猜你喜欢

转载自blog.csdn.net/weixin_45417821/article/details/121269038