Hadoop下WordCount开发实战(附源码)

首先安装Eclipse和hadoop的插件,打开eclipse后看到项目侧会看到DFS

开启Hadoop,单击右下角的如下图中的小象

编辑DFS的连接配置信息


点击finish

右击DFS刷新,会看到hdfs下的目录:


++++++++++++++++++++++++++++++++++++++++++++++++++++

右击File新建项目:

输入项目名WordCount

将所安装的hadoop下的share中的common,hdfs,mapreduce,yarn下的jar包(不是lib下的)都拷贝到一个文件 中 ,选择Specify Hadoop library location 选择刚刚的文件路经。

然后右击项目名,选择Build Path,导入刚刚文件中的jar包(也可以将刚刚的jar包做成自己的library)

然后分别按下图新建类:

Map程序


Reduce程序


主程序:

然后点击如图所示:

接着点击Java Application回生成WordCount项目,安图填写


注意hdfs的/hadoopdata/input中要有上传的文件

上传命令:

然后点击run,刷新DFS就会看到新的输出文件:

完毕!源码解读见:https://blog.csdn.net/c275046758/article/details/47069881

猜你喜欢

转载自blog.csdn.net/qq_25948717/article/details/81031676