Hadoop基础教程03

其他 2018-11-23 16:41:14 阅读次数: 0

第3章理解MapReduce

3.1 键值对

3.1.1 具体含义

3.1.2 为什么采用键/值数据

3.1.3 MapReduce作为一系列键/值变换

3.2 MapReduce的Hadoop Java API

3.3 编写MapReduce程序

3.4 实践环节：设置classpath

3.5 实践环节：实现WordCount

3.6 实践环节：构建JAR文件

3.7 实践环节：在本地Hadoop集群运行WordCount

3.8 实践环节：在EMR上运行WordCount

3.8.1 0.20之前版本的Java MapReduce API

3.8.2 Hadoop提供的mapper和reducer实现

3.9 实践环节：WordCount的简易方法

3.10 查看WordCount的运行全貌

3.10.1 启动

3.10.2 将输入分块

3.10.3 任务分配

3.10.4 任务启动

3.10.5 不断监视JobTracker

3.10.6 mapper的输入

3.10.7 mapper的执行

3.10.8 mapper的输出和reducer的输入

3.10.9 分块

3.10.10 可选分块函数

3.10.11 reducer类的输入

3.10.12 reducer类的执行

3.10.13 reducer类的输出

3.10.14 关机

3.10.15 这就是MapReduce的全部

3.10.16 也许缺了biner

3.11 实践环节：使用biner编写WordCount

3.12 实践环节：更正使用biner的WordCount

3.13 Hadoop专有数据类型

3.13.1 Writable和Writable-Comparable接口

3.13.2 wrapper类介绍

3.14 实践环节：使用Writable包装类

3.15 输入/输出

3.15.1 文件、split和记录

3.15.2 InputFormat和RecordReader

3.15.3 Hadoop提供的InputFormat

3.15.4 Hadoop提供的RecordReader

3.15.5 OutputFormat和Record-Writer

3.15.6 Hadoop提供的OutputFormat

3.15.7 别忘了Sequence files

3.16 小结

猜你喜欢

转载自www.cnblogs.com/songdongdong6/p/10008348.html

Hadoop基础教程03

Hadoop基础教程

试读《Hadoop基础教程》

《Hadoop基础教程》试读

Hadoop基础教程02

《Hadoop基础教程》之初识Hadoop

Activiti基础教程--03（HelloWorld)

postman基础教程-03断言

《Hadoop基础教程》读后感

Hadoop，大数据时代的利剑！——试读《Hadoop基础教程》

《Hadoop基础教程》之初识Hadoop(转载)

Hadoop新手篇：hadoop入门基础教程

Bootstrap3基础教程 03 导航栏

04： OpenGL ES 基础教程03 纹理

GStreamer基础教程03 - 媒体类型与Pad

JAVA基础教程day03--运算符

Hadoop基础教程笔记第一章

Hadoop基础教程-第2章 Hadoop快速入门（2.4 Hadoop单机运行）

Hadoop基础教程-第2章 Hadoop快速入门（2.3 Hadoop单机配置）

Hadoop基础教程-第2章 Hadoop快速入门（2.2 Hadoop下载与安装）

Hadoop基础教程-第2章 Hadoop快速入门（2.1 Hadoop简介）

【Hadoop基础教程】1、Hadoop之服务器基础环境搭建（转）

Hadoop基础教程-第10章 HBase：Hadoop数据库（10.5 HBase Shell）（草稿）

Hadoop基础教程-第10章 HBase：Hadoop数据库（10.1 NoSQL介绍）（草稿）

Hadoop基础教程-第2章 Hadoop快速入门（2.5 WordContent简单应用）

【Hadoop基础教程】3、Hadoop之伪分布式环境搭建(转)

【Hadoop基础教程】2、Hadoop之单机模式搭建（转）

【Hadoop基础教程】4、Hadoop之完全分布式环境搭建

Hadoop基础教程-第11章 Hive：SQL on Hadoop（11.1 Hive 介绍）（草稿）

Hadoop基础教程-第10章 HBase：Hadoop数据库（10.7 HBase 批量导入）

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)