hadoop目录导图

一、安装

1.1、安装hadoop

1.2、启动中出现的问题

1.3、调试中出现的问题

1、Hadoop格式化HDFS报错java.net.UnknownHostException: centos64
2、hadoop-分布式安装及报错分析
3、SSH 无密码login
4、Hadoop II Windows下安装hadoop2.6.0-eclipse-plugin插件
5、hadoop2.x常用端口、定义方法及默认端口

1.4、简单案例WordCount

二、原理的介绍

HDFS原理及操作

2.1、MapReduce原理

InputSplit介绍
InputFormat-mapper的前期操作

  • inputFormat 负责创建inputSplit并且将他们拆分成键值对(records)

统计topN

  • 自定义分区(partition), 排序(sort), 分组(group)
  • reduce处理数据是分组进行处理。

MapReduce原理 mapper, reducer,shuffler之一
MapReduce原理 mapper, reducer,shuffler之二
MapReduce原理 mapper, reducer,shuffler之三

2.2、hadoop实现join方法

Eclipse项目复制出现问题及设置hadoop配置问题

猜你喜欢

转载自blog.csdn.net/wuxintdrh/article/details/80795725