(一)hadoop之安装

  • 安装JDK和设置环境变量
    参考:https://blog.csdn.net/weixin_38312719/article/details/89052062

  • 下载hadoop
    wget http://mirrors.shu.edu.cn/apache/hadoop/common/hadoop-2.7.7/hadoop-2.7.7.tar.gz

  • 解压
    tar -xzvf hadoop-2.7.7.tar.gz
    在这里插入图片描述
    安装完成

  • 使用hadoop自带的案例进行演示(检索一个文件夹下所有文件中某个字符串出现的次数)
    在这里插入图片描述
    在这里插入图片描述
    在testdata目录下新建test_01_input目录,用于存放我们需要检索的数据源
    在这里插入图片描述
    在这里插入图片描述
    编辑a.txt,输入一些数据
    在这里插入图片描述
    回到hadoop家目录下,输入上面命令 检索‘wuxinxin’出现的次数,运行结果保存在testdata/test_01_output目录下
    在这里插入图片描述
    在这里插入图片描述
    可以看到会自动创建指定的结果目录,在test_01_output目录下,part-r-0000文件中存放了结果,出现的次数是两次,正确

猜你喜欢

转载自blog.csdn.net/weixin_38312719/article/details/89142096