大数据实战项目之新闻话题分析学习笔记（六）——Zookeeper分布式集群部署 - 代码天地

大数据实战项目之新闻话题分析学习笔记（六）——Zookeeper分布式集群部署

编程语言 2019-02-23 13:35:48 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/Shrynh/article/details/87889542

文章目录

第7章：hadoop2.x HA架构与部署

hdfs-HA架构原理介绍
hdfs-HA详细配置
基于Zookeeper的HA配置
hdfs-HA服务启动及自动故障转移测试
yarn-HA架构原理介绍
yarn-HA详细配置
yarn-HA服务启动及自动故障转移测试

第7章：hadoop2.x HA架构与部署

包括两方面内容：hdfs、yarn。

hdfs配置中主要是namenode：因为负责存储数据存储的元数据。
yarn配置中主要是resourcemanager：集群资源的管理和任务调度的节点。

hdfs-HA架构原理介绍

在这里插入图片描述

备注：

Namenode主要两部分：Fslmage（源数据整理，会根据Edits定期更新）、Edits（数据记录）
namenode相当于字典索引，如果namenode挂掉，则不能对外提供hdfs服务。
standby节点会通过JournalNode节点（来自Active记录的日志）备份日志。
Zookeeper上启动观察者模式，观察namenode的状态以及是否实施故障转移。
JournalNode是保证Edits日志的完整性（有副本数，同datanode）、保证另一台namenode实时获取日志信息。这个节点服务是轻量级的，所以可以放在namenode或者datanode或者其他的节点服务器上。
activeNamenode和standbyNamenode实时保持同步，并且也都会接受来自datanode的心跳报告。

hdfs-HA详细配置

HDFS-HA

机器1	机器2	机器3
namenode	namenode
datanode	datanode	datanode
journalnode	journalnode	journalnode
Zookeeper	Zookeeper	Zookeeper
zkfc	zkfc

详细参考官方网站配置：
http://hadoop.apache.org/docs/r2.5.2/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html
在这里插入图片描述

基于Zookeeper的HA配置

hdfs-HA服务启动及自动故障转移测试

在这里插入图片描述

在这里插入图片描述

特别注意：
在重新格式化namenode时必须先启动journalnode，因为journalnode用于记录HA日志。不然会报错。

HA测试：

测试手动HA：
将namenode1进程kill掉，之后standby节点变为active状态，hdfs也可以访问。

yarn-HA架构原理介绍

在这里插入图片描述备注：
yarn-ha实际上要比hdfs-ha实现上要简单一点：在yarn-ha中，只需要RM向Zookeeper写它的状态就好（不需要配置内部的journalnode服务节点）

yarn-HA详细配置

RM-HA

机器1	机器2	机器3
resourcemanager	resourcemanager
nodemanager	nodemanager	nodemanager

在这里插入图片描述

(备注：不像hdfs-ha一样，需要额外启动一个自动故障转移进程zkfc，因为它是把类似的功能弄到自身的一个线程里去了)

yarn-HA服务启动及自动故障转移测试

步骤：
1.启动两个resourcemanager进程
2.启动三个nodemanager进程
3.测试mapreduce wordcount程序

在跑map任务的时候，将active RM节点的RM进程干掉
在这里插入图片描述由图可见，RM服务由RM1转移到RM2了。所以验证HA自动故障转移成功

备注：

如果运行之后，手动输入standby的RM的地址，会自动跳转到active节点的RM地址

说明：
此系列文章为网课学习时所记录的笔记，希望给同为小白的学习者贡献一点帮助吧，如有理解错误之处，还请大佬指出。学习不就是不断纠错不断成长的过程嘛~

猜你喜欢

转载自blog.csdn.net/Shrynh/article/details/87889542

大数据实战项目之新闻话题分析学习笔记（六）——Zookeeper分布式集群部署

大数据实战项目之新闻话题分析学习笔记（五）——Zookeeper分布式集群部署

大数据实战项目之新闻话题分析学习笔记（七）——Zookeeper分布式集群部署

大数据实战项目之新闻话题分析学习笔记（四）——hadoop2.X分布式集群部署

大数据实战项目之新闻话题分析学习笔记（三）——Linux环境准备与配置

大数据实战项目之新闻话题分析学习笔记（九）

大数据实战项目之新闻话题分析学习笔记（八）

大数据实战项目之新闻话题分析学习笔记（二）——企业项目案例需求分析

大数据实战项目之新闻话题分析学习笔记（一）——实战前hadoop2.X必修课

新闻网大数据实时分析可视化系统项目——3、Hadoop2.X分布式集群部署

【大数据】分布式集群部署

大数据学习笔记——Hadoop高可用完全分布式模式完整部署教程(包含zookeeper)

新闻网大数据实时分析可视化系统项目——17、Spark2.X分布式弹性数据集

SpringCloud学习笔记023---分布式集群之_Windows下搭建zookeeper服务器

Linux Centos7 环境搭建Docker部署Zookeeper分布式集群服务实战

大数据系列之Hadoop分布式集群部署

【若泽大数据实战第九天】Yarn伪分布式部署及log日志分析

分布式之Zookeeper一(分布式锁与Zookeeper集群)

Redis分布式集群实战（六）——codis集群的搭建

大数据Zookeeper系列之Zookeeper分布式协调服务部署

【大数据实战项目六】数据实体提取与数据扩充

大数据项目实战之新闻话题统计分析

大数据项目实战之新闻话题的实时统计分析

【大数据实战项目八】使用机器学习算法进行预测分析并进行网上部署

大数据技术学习笔记之网站流量日志分析项目：网站业务分析数据实现5

【大数据学习】之YARN伪分布式部署

Hadoop大数据学习----Zookeeper分布式

新闻网大数据实时分析可视化系统项目——5、Hadoop2.X HA架构与部署

大数据平台hadoop分布式集群搭建(单机、集群、基于zookeeper高可用)

分布式进阶六之集群控制管理

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)