MapReduce算法的执行过程是怎样的？ - 代码天地

MapReduce算法的执行过程是怎样的？

其他 2020-04-19 20:06:02 阅读次数: 0

MapReduce算法的执行过程是怎样的？

( 1) MapReduce框架使用InputFormat模块做Map前的预处理，比如验证输人的格式是否符合输入定义;然后，将输人文件切分为逻辑上的多个InputSplit, InputSplit是MapReduce对文件进行处理和运算的输人单位，只是一个逻辑概念，每个InputSplit并没有对文件进行实际切割，只是记录了要处理的数据的位置和长度。

( 2)因为InputSplit 是逻辑切分而非物理切分，所以还需要通过RecordReader (RR)根据InputSplit中的信息来处理InputSplit中的具体记录，加载数据并转换为适合Map任务读取的键值对，输人给Map任务。

(3) Map任务会根据用户自定义的映射规则，输出一-系列的<key,value>作为中间结果。

(4 )为了让Reduce可以并行处理Map的结果，需要对Map的输出进行一定的分区( Portition )、排序(Sort)、合并( Combine)、归并( Merge )等操作，得到<key,value-lis>)形式的中间结果，再交给对应的Reduce 进行处理，这个过程称为Shuffle。从无序的<key,value>到有序的, 这个过程用Shufle (洗牌)来称呼是非常形象的。自时:0hoe

(5) Reduce以一系列<key,value-list>中间结果作为输入，执行用户定义的逻辑，输出结果给OutputFormat模块。

(6) OutputFormat模块会验证输出目录是否已经存在以及输出结果类型是否符合配置文件中的配置类型，如果都满足，就输出Reduce的结果到分布式文件系统。

itlanmao

发布了19 篇原创文章 · 获赞 19 · 访问量 1585

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_45558363/article/details/105533891

MapReduce算法的执行过程是怎样的？

MapReduce执行过程

MapReduce的原理及执行过程

MapReduce的原理及执行过程 MapReduce简介

MapReduce在yarn中的执行过程

MapReduce执行过程分析【问题】

MapReduce的原理及执行过程 Combiner

Mapreduce执行任务过程

WordCount的理解与MapReduce的执行过程

Hadoop MapReduce Job执行过程源码跟踪

详细解析MapReduce的原理和执行过程

Hadoop mapreduce执行过程涉及api

Hadoop学习之Mapreduce执行过程详解

MapReduce执行流程和Shuffle过程

Hadoop-MapReduce执行的全过程

MapReduce的运行原理 MapReduce的原理及执行过程 Combiner

怎样理解new命令的执行过程

hadoop中mapreduce作业执行过程分析--local模式

了解MapReduce之Partition分区的概念与执行过程（附例子）

MapReduce执行过程中的数据流程：

Hadoop执行MapReduce作业的过程-案例-计算pi的值

深入理解MapReduce的原理和执行过程

简述 Diff 算法的执行过程

MapReduce过程

MapReduce 过程

决策树算法的执行过程分析

Hadoop MapReduce各阶段执行过程以及Python代码实现简单的WordCount程序

MapReduce执行流程

关于MapReduce 执行卡住

MapReduce执行流程Shuffle

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)