Hadoop_ MR JOB 中排序发生在那几个阶段？ - 代码天地

Hadoop_ MR JOB 中排序发生在那几个阶段？

其他 2020-04-13 19:09:47 阅读次数: 0

原文地址：

https://blog.csdn.net/qq_42246689/article/details/84590215

这是一道面试题，由于博主没有怎么写过 MR JOB . 最近在复习所学的知识，刚好整理到排序问题了。

1.map最后阶段进行partition分区，一般使用job.setPartitionerClass设置的类，如果没有自定义Key的hashCode()方法进行分区。在map阶段写出到环形缓冲区，在环形缓冲区溢写时会进行一次排序，每个分区内部调用job.setSortComparatorClass设置的key的比较函数类进行排序，如果没有则使用Key的实现的compareTo方法。

2.在归并每一个maptask的环形缓冲区的所有溢写文件的时候也会再次进行排序

3.当reduce接收到所有map传输过来的数据之后，对每一个分区的数据进行merge并排序，调用job.setSortComparatorClass设置的key比较函数类对所有数据对排序，如果没有则使用Key的实现的compareTo方法。

4.紧接着使用job.setGroupingComparatorClass设置的分组函数类，进行分组，同一个Key的value放在一个迭代器里面。如果未指定GroupingComparatorClass则则使用Key的实现的compareTo方法来对其分组。

Hadoop1.0中不可避免 hadoop2.0中可以关闭，将reduce task设置为0。

发布了519 篇原创文章 · 获赞 1146 · 访问量 283万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/u010003835/article/details/105301236

Hadoop_ MR JOB 中排序发生在那几个阶段？

hadoop之MR Job案例

Hadoop_MapReduce 运行流程 - MR job 运行的5个阶段

hadoop-MR-排序

hadoop mr 全局排序

hadoop mr 辅助排序

hadoop mr程序出现The constructor Job(Configuration, String) is deprecated

Hadoop----MR(Map与Job的联系源码)----(源码篇二)

Hadoop---MR的Job提交源码---(源码篇一)

Hadoop【MR的分区、排序、分组】

Livy submit mr、spark job

MR Job运行数据：

hadoop mr

【Hadoop-2.7 源码系列】0-WordCount 解析及整个MR Job的执行流程介绍

Mapreduce(MR)设置多个job的任务运行

job on hadoop

hadoop_环境配置

Hadoop_简介_01

Hadoop——MR执行环境

hadoop-MR

Hadoop_MR

1-hadoop、mr

Hadoop的MR小例子

hadoop的组件mr

Hadoop MR 分区(partition)和全排序(WritableComparable)

MR (key,value)排序, hadoop.Spark.sql的join操作

Yarn的工作机制，以及MR Job提交运行过程

Hadoop_知识点

hadoop_随笔二_参数

hadoop_导图简介

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)