伪分布式的搭建（启动HDFS并运行MapReduce程序）

其他 2018-12-08 08:50:57 阅读次数: 0

如果前一章测试成功，那么恭喜你，你已经可以开始新的篇章了（但是如果测试不成功，请务必搭建测试成功后再看此篇章）

伪分布式的搭建（启动HDFS并运行MapReduce程序）

1、启动HDFS并运行MapReduce程序

1.1配置伪分布式集群

1.1.1 **配置hadoop-env.sh**
1.1.2**配置core-site.xml**
1.1.3 **配置hdfs-site.xml**

1.2启动集群

1.2.1切换到当前目录
1.2.2格式化NameNode
1.2.3启动NameNode（执行成功后可执行JPS看是否启动成功）
1.2.4启动DataNode
1.2.5注意的一些事项

1.3查看集群

1.3.1web端查看HDFS文件系统

1.4操作集群

1.4.1切换到当前目录
1.4.2在HDFS文件系统上创建一个input文件夹
1.4.3将测试文件内容上传到文件系统上
1.4.4查看上传的文件是否正确
1.4.5运行MapReduce程序
1.4.6查看输出结果
1.4.7 将测试文件内容下载到本地
1.4.8删除输出结果

1、启动HDFS并运行MapReduce程序

1.1配置伪分布式集群

1.1.1 配置hadoop-env.sh

切换到当前目录中：
在这里插入图片描述
修改hadoop-env.sh的JAVA_HOME 路径：vim hadoop-env.sh
添加如下内容：

1.1.2配置core-site.xml

执行命令：vim core-site.xml
文件加入如下文本：

<!-- 指定HDFS中NameNode的地址 -->
<property>
<name>fs.defaultFS</name>
    <value>hdfs://hadoop101:9000</value>
</property>

<!-- 指定Hadoop运行时产生文件的存储目录 -->
<property>
	<name>hadoop.tmp.dir</name>
	<value>/opt/module/hadoop-2.7.2/data/tmp</value>
</property>

1.1.3 配置hdfs-site.xml

执行命令：vim hdfs-site.xml

<!-- 指定HDFS副本的数量 -->
<property>
	<name>dfs.replication</name>
	<value>1</value>
</property>

1.2启动集群

1.2.1切换到当前目录

在这里插入图片描述

1.2.2格式化NameNode

执行命令：bin/hdfs namenode -format
在这里插入图片描述

1.2.3启动NameNode（执行成功后可执行JPS看是否启动成功）

执行命令：sbin/hadoop-daemon.sh start namenode
在这里插入图片描述

1.2.4启动DataNode

执行命令：sbin/hadoop-daemon.sh start datanode
在这里插入图片描述

1.2.5注意的一些事项

1.格式化NameNode，会产生新的集群id,导致NameNode和DataNode的集群id不一致，集群找不到已往数据，而导致集群启动异常。
所以，再次格式NameNode时，一定要先删除data数据和log日志，然后再格式化NameNode。（当然也还有其他办法，但是这个是最直接了当的！！！）
2.JPS执行无效
原因：全局变量hadoop、java没有生效，需要source /etc/profile文件。

1.3查看集群

1.3.1web端查看HDFS文件系统

浏览器中查看：http://Linux ip地址:50070/dfshealth.html#tab-overview
在这里插入图片描述
如果不能查看，看如下帖子处理：http://www.cnblogs.com/zlslch/p/6604189.html

1.4操作集群

1.4.1切换到当前目录

在这里插入图片描述

1.4.2在HDFS文件系统上创建一个input文件夹

执行命令：bin/hdfs dfs -mkdir -p /user/lsl/input
在这里插入图片描述

1.4.3将测试文件内容上传到文件系统上

执行命令：bin/hdfs dfs -put wcinput/wc.input /user/lsl/input/

1.4.4查看上传的文件是否正确

1.执行命令：bin/hdfs dfs -ls /user/lsl/input/
在这里插入图片描述
2.执行命令：bin/hdfs dfs -cat /user/lsl/input/wc.input

3.也可在浏览器上查看

1.4.5运行MapReduce程序

执行命令：bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /user/lsl/input/ /user/lsl/output

1.4.6查看输出结果

1.执行命令：bin/hdfs dfs -cat /user/lsl/output/*
在这里插入图片描述
2.在浏览器上查看

1.4.7 将测试文件内容下载到本地

执行命令：hdfs dfs -get /user/lsl/output/part-r-00000 ./wcoutput/
在这里插入图片描述

1.4.8删除输出结果

1.执行命令：hdfs dfs -rm -r /user/lsl/output
在这里插入图片描述
2.查看：

版权声明：本博客为记录本人自学感悟，转载需注明出处！
https://me.csdn.net/qq_39657909

猜你喜欢

转载自blog.csdn.net/qq_39657909/article/details/84868975

伪分布式的搭建（启动HDFS并运行MapReduce程序）

hadoop伪分布式运行模式---启动HDFS并运行MapReduce程序

伪分布式的搭建（YARN上运行MapReduce 程序）

hadoop运行模式（伪分布式）——启动HDFS并运行Mapreduce

伪分布式运行Hadoop实例之HDFS运行MapReduce程序

hadoop伪分布式运行模式---启动YARN并运行MapReduce程序

Hadoop的运行模式（伪分布式）——启动YARN并且运行MapReduce程序

hadoop伪分布式之启动HDFS并运行MR程序（WordCount）

HDFS伪分布式环境搭建

搭建hdfs伪分布式模式

hadoop框架搭建：HDFS伪分布式搭建，HDFS完全分布式搭建

HDFS环境搭建—伪分布式搭建

从头开始的HDFS伪分布式环境的搭建

CentOS下HDFS伪分布式搭建

hadoop-hdfs-伪分布式环境搭建-使用

HDFS伪分布式环境搭建记录

HDFS-完全分布式搭建（从伪分布到完全分布式）

HDFS伪分布式模式和完全分布式的搭建

Hadoop-HDFS的伪分布式和完全分布式集群搭建

Centos7搭建Hadoop 2.X伪分布式环境并运行wordcount MapReduce示例

Hadoop（第一天，概念，搭建hadoop环境，在hdfs下运行伪分布式）

Hadoop的HDFS和MapReduce的安装（三台伪分布式集群）

伪分布式搭建

Hadoop伪分布式部署(HDFS)

Hadoop伪分布式一（HDFS）

hdfs伪分布式集成yarn

伪分布式下调用hdfs

使用本地hadoop运行伪分布式程序

伪分布式yarn上运行mr程序

伪分布式运行Hadoop实例之yarn运行MapReduce实例

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)