HADOOP的mapReduce流程解析 - 代码天地

HADOOP的mapReduce流程解析

其他 2019-05-08 02:06:50 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/W609392362/article/details/79547417

1、首先第一个启动的是MRAppMasterk进程，它根据提交的job信息，计算出需要启动mapTask实例的数量，然后向集群申请对应的机器启动相应数量的maptask进程。

2、mapTask负责map阶段的数据处理。mapTask进程启动之后，根据给定的数据切片范围进行处理。

主要流程如下：i)根据客户定义的inputformat来获取RecodReader读取数据，形成输入KV对。

ii)将KV对传给用户定义的map方法，做逻辑运算，然后将计算后输出的KV对缓存。

iii)将缓存中KV对，按K分区排序后不断溢写到磁盘上。

监控到map阶段数据处理完。启动在配置文件中设置好数量的reduceTask.

3、MRAPPMaster监控到所有的mapTask进程完成后，根据用户指定的参数启动对应的reduceTask数量。并告知reduceTask应从集群哪些机器获取Map阶段输出的数据。

4、reduceTask获取map阶段数据的数据，然后根据K重新进行归并排序，按照相同的K为一组。调用用户定义的Reduce进行逻辑处理，处理完后调用用户定义的outputformat将数据输出到外部存储。

猜你喜欢

转载自blog.csdn.net/W609392362/article/details/79547417

HADOOP的mapReduce流程解析

Hadoop MapReduce Job提交流程解析

hadoop2.0之mapReduce启动运行全流程解析

hadoop_MapReduce_流程

Hadoop Mapreduce运行流程

hadoop mapreduce流程

Hadoop的MapReduce流程

Hadoop-MapReduce-详细分析MapReduce工作流程，源码解析-连载中

MapReduce执行流程解析

hadoop mapreduce作业流程概论

Hadoop — MapReduce原理解析

Hadoop之MapReduce的OutputFormat解析

Hadoop之MapReduce的Combiner解析

Hadoop之MapReduce的排序解析

Hadoop的MapReduce工作机制解析

Hadoop之MapReduce的Join解析

重温Hadoop（2）-- MapReduce流程及partition

Hadoop的MapReduce执行流程图

Hadoop MapReduce Job 提交流程

Hadoop中mapreduce中的shuffle执行流程

大数据-hadoop-MapReduce计算流程

Hadoop 之 MapReduce （InputFormat 和 MapReduce工作流程）

Hadoop学习三十四：Hadoop-MapReduce Job本地运行流程

Hadoop 之 MapReduce -- Hadoop 序列化及案例解析

Hadoop-MapReduce-从0-1深度解析Job、MapTask、Shuffle、ReduceTask工作流程，全过程源码深度解析

Hadoop MapReduce工作详细流程（Partitioner/SortComparator/GroupingComparator）

Hadoop分布式下的MapReduce流程及HDFS简单使用

Hadoop-Mapreduce的框架组成和运行流程

【Hadoop学习之MapReduce】_19MR工作流程

hadoop之从数据流向角度分析MapReduce流程

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)