Hadoop理论概念学习（部分） - 代码天地

Hadoop理论概念学习（部分）

其他 2020-02-22 10:30:38 阅读次数: 0

1、MapRedece从读取数据开始到将最终结果写入HDFS经过哪些步骤?
第一步:inputformat进行数据读读取,将数据发送给split
第二步:split 将数据进行切分,发送给RecordReader
第三步:RR将数据按照行再次切分,将切分好的数据组装成key(行首偏移量),value(每行的数据) 发送给map
第四步:map 进行自定义逻辑的书写,将数据传给Shuffle
第五步:Shuffle中的Partition 将数据key的哈希值与ReduceTask数量取余,余几就分到哪个区
第六步:Shuffle中的Sort 将数据按照一定规则进行排序
第七步:Shuffle中的Combine 将数据在map端先进行局部聚合,这样做的好处数节省了网络带宽的消耗,效率更高
第八步:Shuffle中的Group 将数据相同的key变成一个key,将这个key的Value拼装成一个Value的list
第九步:Reduce 进行自定义计算逻辑的书写,将结果发送给OutputFormat
第十步:OutPutFormat 将结果数据输出保存到HDFS上

2、Hadoop 的组成部分有哪些模块？
HDFS 分布式文件存储系统
管理者：NameNode
工作者：DataNode
辅助者：SecondayNameNode
MapReduce 分布式离线计算框架
Yarn Hadoop资源调度器
管理者：ResourceManager
工作者：NodeManager

3、请阐述一下Hbase详细架构？
Client：
访问数据的入口，包含访问hbase的API接口,维护着一些cache来加快对hbase的访问
Zookeeper：
1.zookeeper的选举机制保证任何时候，集群中只有一个master
2.实时监控Region Server的状态，将Region server的上线和下线信息实时通知给Master
3.存储Hb

猜你喜欢

转载自blog.csdn.net/dlc_996/article/details/103811474

Hadoop理论概念学习（部分）

Hadoop概念学习系列之Hadoop、Spark学习路线

Hadoop HBase概念学习系列之物理视图

概念学习

线程的概念学习

前端概念学习

Elasticsearch概念学习

学习：STL概念学习

Hadoop概念学习系列之Hadoop、Spark学习路线（很值得推荐）

软件测试-概念学习

方法基础概念学习

kubernetes 基础概念学习

Linux的命令概念学习

Dubbo--概念学习

Zookeeper--概念学习

MongoDB--概念学习

RESTful--概念学习

《海思 - 概念学习》

软件测试概念学习

C#概念学习

概念学习自学笔记

Kafka 基础概念学习

Hadoop Hive概念学习系列之hive的数据压缩（七）

多线程学习一、概念学习

SpringCloud学习相关概念学习（一）

Hadoop概念学习系列之Java调用Shell命令和脚本，致力于hadoop/spark集群

Hadoop概念学习系列之Hadoop集群动态增加新节点或删除已有某节点及复制策略导向

Scala 基本概念学习

本体基本概念学习记录

servletFilter概念学习以及简单案例

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)