MapReduce各个执行阶段 - 代码天地

MapReduce各个执行阶段

其他 2018-12-03 09:11:12 阅读次数: 0

这里写图片描述

（1）MapReduce框架使用InputFormat模块做Map前的预处理，比如验证输入的格式是否符合输入定义；然后，将输入文件切分为逻辑上的多个InputSplit，InputSplit是MapReduce对文件进行处理和运算的输入单位，只是一个逻辑概念，每个InputSplit并没有对文件进行实际切割，只是记录了要处理的数据的位置和长度。

（2）因为InputSplit是逻辑切分而非物理切分，所以还需通过RecordReader根据InputSplit中的信息来处理InputSplit中的具体记录，加载数据并转换为适合Map任务读取的键值对，输入给Map任务。

（3）Map任务会根据用户自定义的映射规则，输出一系列的<key,value>作为中间结果。

（4）为了让Reduce可以并行处理Map的结果，需要对Map的输出进行一定的分区（partition）、排序（sort）、合并（combine）、归并（merge）等操作，得到<key,value>形式的中间结果，再交给对应的Reduce进行处理，这个过程称为shuffle。从无序的<key,value>到有序的<key,value-list>，这个过程用Shuffle来称呼是非常形象的。

（5）Reduce以一系列<key,value-list>中间结果为输入，执行用户定义的逻辑，输出结果给OutputFormat模块。

（6）OutpFormat模块会验证输出目录是否已经存在以及输出结果类型是否符合配置文件中的配置类型，如果都满足，就输出Reduce的结果到分布式文件系统。

摘自《大数据技术原理与应用》

猜你喜欢

转载自blog.csdn.net/u012580143/article/details/84615621

MapReduce各个执行阶段

MapReduce中各个阶段的分析

线程的执行流程及各个阶段的状态

Netty server端执行的各个阶段源码简单分析

事件的各个阶段

类加载各个阶段

Android系统手机开机画面各个阶段代码执行流程分析（Part2）

Android系统手机开机画面各个阶段代码执行流程分析（Part1）

mapreduce map阶段

mapreduce reduce阶段

MapReduce_input阶段

Hadoop MapReduce各阶段执行过程以及Python代码实现简单的WordCount程序

执行阶段

大数据学习的各个阶段

Fragment各个阶段状态理解

学习算法的各个阶段的总结

各个阶段的 Python 学习路线？

MapReduce的Map阶段的指定Combiner

mapreduce shuffle 阶段的逻辑分析

MapReduce执行流程

MapReduce执行过程

关于MapReduce 执行卡住

MapReduce执行WordCount操作

MapReduce执行流程Shuffle

mapreduce yran执行详情

MapReduce的执行流程

MapReduce的原理及执行过程

mapreduce执行的大致流程

MapReduce执行流程详解

Mapreduce的执行流程思路

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)