mapreduce的类型与格式 - 代码天地

mapreduce的类型与格式

编程语言 2018-05-10 11:15:08 阅读次数: 0

1：默认的mapreduce作业

hadoop在不指定mapper和reducer就运行mapreduce，只设置输入路径和输出路径，可以使用默认设置运行mapreduce作业

默认的输入格式是TextInputFormat

默认的mapper是Mapper类

默认的partitioner是hashpartitioner

默认的reducer是Reducer

默认情况下，只有一个reducer

没有设置map任务的数量，原因是该数量等于输入文件被划分成的分块数，取决于输入文件的大小以及文件块的大小

reducer的个数在本地作业运行器上运行时，只支持0个或1个reducer,reducer最优个数与集群中可用的reducer任务槽数相关。通常将reducer数比总槽数稍微少一些，使用更多reducer

2：默认的Streaming作业

必须提供一个mapper，默认的mapper的输入格式是TextInputFormat产生的是LongWritable类型的键和Text类型的值，而Streaming的输出键和值都是Text类型

3：输入格式

输入分片与记录：一个输入分片就是一个有单个map操作来处理的输入块，每一个map操作只处理一个输入分片。

每个分片被划分为若干个记录，每条记录就是一个键/值对，map一个接一个地处理记录。在数据库的场景中，一个输入分片对应于一个表上的若个行，而一条记录对应到一行。

主要包括文本输入，二进制输入，多个输入，数据库输入

4：输出格式与输入格式类似

猜你喜欢

转载自kayak2015.iteye.com/blog/2247439

mapreduce的类型与格式

Hadoop MapReduce 的类型与格式（MapReduce Types and Formats）

《Hadoop权威指南》——第七章MapReduce的类型与格式

MapReduce的类型和格式

基本数据类型与格式化输出

SpringMVC-类型转化与格式化

MySQL - 日期时间类型与格式化

一、数据类型与格式化输出

认识IPv6---寻址模式与地址类型与格式

Hadoop MapReduce的类型和格式

ansible的安装与格式

JSON对象与格式

视频的容器与格式

时间的标准与格式

mysql复制类型与格式简析 mysql数据库管理员

python学习笔记—类型检查与格式化字符串

PKI标准与格式规范

分区与格式化

Oracle技巧----乱码与格式

【论文】论文中的参考文献：国标GB/T 7714-2015文献类型与格式

Linux分区与格式化

linux中的分区与格式化

挂载硬盘与格式化磁盘

系统分区与格式化

matplotlib命令与格式：标题(title)

关于时间戳与格式日期的转换

Python迭代器与格式化

TCP协议原理与格式初探

磁盘分区与格式化

字符串与格式化

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)