Hadoop 之 MapReduce - 代码天地

Hadoop 之 MapReduce

其他 2018-12-31 01:05:48 阅读次数: 0

MapReduce 过程细节分析

1/ map阶段结果<key, value>传递给reduce阶段时, 默认是按照key中ASCII 排序的，若key 被构造成bean，则需要制定bean的compareTo方法，此时bean对应的class需要实现writableComparable接口。

2/ reduce阶段，将map阶段结果<key, value>进行处理，默认ReduceTasks的数量为1。若将map结果进行分组处理，则需要告知分组的方法，即写一个class要extends Partitioner , 并override getPartitioner 方法，还需定义ReduceTask 数量。

设置reduce的任务并发数为6，应该跟分组的数量保持一致
job.setNumReduceTasks(6);

设置Task 数量大于6，任务可以执行，多余的任务不能分配到数据而已

设置Task 数量小于6，任务不可以执行，数据分配不到预定的任务中因此报错！

设置Task 数量等于1，任务可以执行，所有的数据均分到第一个任务中。

3/ map task 的并发数使用切边split的数量决定的，有多少个切片就有多少个map task，切片是一个逻辑概念，是指文件数据的偏移量范围，切片的具体大小根据所处理的文件大小来调整。若文件很小，一个split对应多个block，若文件较大，则一个split对应一个block。

猜你喜欢

转载自blog.csdn.net/py_tamir/article/details/84075123

Hadoop理论之MapReduce

hadoop基础之mapreduce

Hadoop 之 MapReduce原理

初学Hadoop之MapReduce

hadoop之MapReduce

Hadoop之MapReduce实战

Hadoop 之 MapReduce

Hadoop系列之-MapReduce

Hadoop之MapReduce简介

Hadoop之MapReduce基础

Hadoop学习之Mapreduce

Hadoop之MapReduce概述

hadoop之mapreduce详解

【Hadoop核心之MapReduce介绍】

spring hadoop之mapreduce batch

Hadoop组件之-MapReduce(InputFormat)

Hadoop入门之HDFS与MapReduce

Hadoop之MapReduce运行原理

Hadoop学习之Mapreduce安装

Hadoop 之深入探索MapReduce

Hadoop核心组件之MapReduce

hadoop mapreduce之坑、优化

Hadoop之MapReduce工作原理

hadoop之MapReduce详解【转】

浅谈：Hadoop基础之MapReduce

Hadoop之MapReduce的Combiner解析

Hadoop之MapReduce的OutputFormat解析

Hadoop之MapReduce的排序解析

Hadoop之MapReduce的Partition分区

Hadoop之MapReduce作业优化

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)