Hadoop小试牛刀(第2课)

前言:

在第1课,我们已经成功安装了Hadoop,下面来测试一下Hadoop统计分析数据的功能。

1、在/home/sa/file下面分别创建 file1.txt 和 file2.txt 两个文件

file1.txt 的内容:

What's your name
My name is Li Ming

file2.txt的内容:

How are you
My dear friend

2、我们启动Hadoop后,在HDFS数据库中创建目录/input2

cd ~/hadoop
bin/hadoop fs -mkdir /input2

3、将file1.txt和file2.txt文件保存到HDFS数据库中

bin/hadoop fs -put ~/file/file*.txt /input2/

4、查看HDFS数据库中是否已经存在file1.txt、file2.txt

bin/hadoop fs -ls /input2

5、运行包命令“hadoop jar  ×××.jar“,执行WordCount程序,来分析统计数据

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0.jar wordcount /input2/ /output2/wordcount1

6、分析统计完成后,来查看一下输出目录中的所有结果:

bin/hadoop fs -cat /output2/wordcount1/*

猜你喜欢

转载自blog.csdn.net/qq15577969/article/details/80200565