Hadoop入门(8)--从分片输入到Map - 代码天地

Hadoop入门(8)--从分片输入到Map

其他 2018-08-09 10:06:15 阅读次数: 0

输入文件保存在Block中
这里写图片描述
Hadoop2中默认的Block大小为128M

分片输入

假设存储420M的文件
第四块就只存储了36M
这里写图片描述
若还有其他文件

这样就被分成了五份，分片数量为5，地址都会保存在NameNode中

但是NameNode的内存是有限的，所以这样对HDFS带来性能问题
所有HDFS适合存放大文件，
对于大量小文件，可以采用压缩、合并小文件的优化策略
例如：设置文件输入类型为CombineFileInputFormat格式

节点Map任务的个数

两个文件 1、2
这里写图片描述
根据大小分为四块，启动四个map任务

也就是说同时有四个Map线程在执行任务

节点Map任务的个数

在实际情况下，map任务的个数是受多个条件制约的，一般一个DataNode的map任务数量控制在10-100比较合适。
调节Map任务的个数

增加map个数，可增大mapred,map.tasks
减少map个数，可增大mapred.min.split.size
若要减少map个数，但是有很多小文件，可以将小文件合并成大文件，在使用准则2

猜你喜欢

转载自blog.csdn.net/weixin_39381833/article/details/81278339

Hadoop入门(8)--从分片输入到Map

Hadoop基础【1.3】多路径输入指定Map 自定义输入分片

Hadoop Map-Reduce入门学习

Hadoop入门(9)--Map-Shuffle-Reduce

hadoop之数据分片（split）详解以及map数量控制

【MapReduce详解及源码解析（一）】——分片输入、Mapper及Map端Shuffle过程

hadoop在文件分片blocksize

hadoop split 分片

MapReduce的输入分片与记录

Go从入门到实战——Map（笔记）

《Golang从入门到跑路》之map的初识

hadoop 使用map合并小文件到SequenceFile

Hadoop从入门到放弃系列------MapReduce

大数据Hadoop基础入门到精通

Hadoop从入门到进阶 HDFS（一）

【大数据开发】Hadoop入门到精通

大数据hadoop从入门到精通之hadoop家族产品

Hadoop学习总结之三：Map-Reduce入门(转)

Hadoop学习总结之三：Map-Reduce入门

Hadoop 学习总结之三：Map-Reduce入门（转载）

入门Hadoop---Map/Reduce，Yarn是什么？

python入门8 输入输出

MapReduce-输入分片与记录

Hadoop从入门到进阶 Hive安装与入门（五）

Hadoop分块与分片介绍及分片和分块大小相同的原因

视频教程:hadoop基础及演练 hadoop视频教程 hadoop从入门到精通的学习

K8S从入门到放弃

Mybatis从入门到精通——selectKey标签（8）

【MyBatis从入门到入土】8 - 缓存

k8s 从入门到精通

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)