【MR】从wordcount看MapReduce的工作机制 - 代码天地

【MR】从wordcount看MapReduce的工作机制

其他 2020-08-04 21:10:53 阅读次数: 0

MapReduce的工作机制

在这里插入图片描述

物理实体
参与MapReduce作业执行涉及4个独立的实体：

客户端（client）：编写mapreduce程序，配置job，提交job，这就是程序员完成的工作；
JobTracker：初始化job，分配job，与TaskTracker通信，协调整个作业的执行；
TaskTracker：保持与JobTracker的通信（定时发送心跳），在分配的数据片段上执行Map或Reduce任务，TaskTracker和JobTracker的不同有个很重要的方面，就是在执行任务时候TaskTracker可以有n多个，JobTracker则只会有一个
Hdfs：保存作业的数据、配置信息等等，最后的结果也是保存在hdfs上面

逻辑实体

input split: 发生在map计算前，每个split对应一个map。split与hdfs的块大小有关
map: 由程序员实现，一般map操作都是本地化操作也就是在数据存储节点上进行，输入键值对：(k1, v1)，输出键值对：(k2, v2)。
combiner: 可选，本地化reduce操作，让写入磁盘的数据尽可能少
shuffle：map输出到reduce输入的过渡过程。输出放在环形缓冲区（内存），当达到环形缓冲区阈值时，写入溢出文件spill（磁盘），最后合并。接着进行Partitioner操作，一个Partition对应一个reduce
reduce: 由程序员实现，最后结果存储在hdfs上。输入键值对：(k3, iterable-v3) ，输出键值对（k4, v4）

参考文章：https://blog.csdn.net/mucaoyx/article/details/82078226
《WordCount背后的MapReduce原理全面详解》

猜你喜欢

转载自blog.csdn.net/weixin_38776330/article/details/107638497

【MR】从wordcount看MapReduce的工作机制

从WordCount了解MapReduce的运行机制

mapreduce的工作机制

Hadoop MapReduce工作机制

MapReduce工作机制

MapReduce工作机制详解

Hadoop MapReduce 的工作机制

MapReduce 工作机制

二、MapReduce工作机制

【Hadoop】：MapReduce的工作机制

Hadoop Mapreduce 工作机制

MapReduce案例-wordcount-准备工作

MapReduce的Wordcount

MapReduce——WordCount

MapReduce WordCount

Hadoop的MapReduce的工作机制剖析

MapReduce在YARN上的的工作机制

大数据-MapReduce工作机制

Hadoop的MapReduce工作机制解析

【Hadoop学习之MapReduce】_16MR之WordCount案例实操

WordCount案例--mapreduce编写（mr类型、map方法、reduce方法、Job方法）详细注解

【Hadoop学习之MapReduce】_19MR工作流程

mr WordCount示例编写

【Mapreduce】Mapreduce实例——WordCount

MapReduce1的工作机制和过程

【转载】Mapreduce 整个工作机制图

MapReduce原理之ReduceTask工作机制

MapReduce 原理之 MapTask工作机制

第7章 MapReduce的工作机制

MapReduce框架原理-MapTask工作机制

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)