Hadoop-伪分布式运行模式（二） - 代码天地

Hadoop-伪分布式运行模式（二）

其他 2021-03-06 10:50:54 阅读次数: 0

配置集群
启动集群
集群操作

上一篇总结了启动 HDFS 并运行 MapReduce 程序。这一篇主要记录启动 YARN 并运行 MapReduce 程序

配置集群

配置：etc/hadoop/yarn-env.sh。配置 JAVA_HOME 路径
```
export JAVA_HOME=/opt/module/jdk1.8.0_144
```

配置：etc/hadoop/yarn-site.xml

<!-- Reducer获取数据的方式 -->
<property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
</property>

<!-- 指定YARN的ResourceManager的地址 -->
<property>
    <name>yarn.resourcemanager.hostname</name>
    <value>0.0.0.0</value>
</property>

配置：etc/hadoop/mapred-env.sh。配置 JAVA_HOME 路径
```
export JAVA_HOME=/opt/module/jdk1.8.0_144
```

配置：etc/hadoop/mapred-site.xml。这个文件是对 mapred-site.xml.template 重命名得到的

<!-- 指定MR运行在YARN上 -->
<property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
</property>

启动集群

启动之前必须保证 NameNode 和 DataNode 已经启动

启动 ResourceManager

[root@hadoop02 hadoop-2.7.2]# sbin/yarn-daemon.sh start resourcemanager

启动 NodeManager

[root@hadoop02 hadoop-2.7.2]# sbin/yarn-daemon.sh start nodemanager

查看集群是否启动成功

[root@hadoop02 hadoop-2.7.2]# jps
12080 DataNode
13170 NodeManager
13285 Jps
12919 ResourceManager
11976 NameNode

集群操作

在 Web 浏览器查看集群。注意，和 50070 那个端口是不一样的，这个是专门查看 MapReduce 程序运行状况的。记得在服务器上开放 8088 端口
```
http://hadoop02:8088/cluster
```

删除文件系统上的 output 文件夹，如果有的话。

[root@hadoop02 hadoop-2.7.2]# bin/hdfs dfs -rm -r /user/yain/output

执行 MapReduce 程序

[root@hadoop02 hadoop-2.7.2]# bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /user/yain/input /user/yain/output

查看执行成功

[root@hadoop02 hadoop-2.7.2]# bin/hdfs dfs -cat /user/yain/output/p*

http://hadoop02:50070/explorer.html#/user/yain/output

http://hadoop02:8088/cluster

如果您觉得这篇文章对您有帮助，欢迎为我的 github项目点一个⭐

猜你喜欢

转载自blog.csdn.net/Apple_Coco/article/details/106646105

Hadoop-伪分布式运行模式（二）

Hadoop-伪分布式运行模式（三）

Hadoop-伪分布式运行模式（一）

Hadoop-完全分布式运行模式（二）

Hadoop-伪分布式搭建

Hadoop-完全分布式运行模式（一）

Hadoop运行模式之伪分布式运行模式

CentOS 7+Hadoop-2.7.2的hadoop环境搭建（二）伪分布式运行模式

hadoop伪分布式运行模式---配置日志的聚集

hadoop-从单节点伪分布式扩展为多节点分布式

Hadoop-超详细集群搭建，本地运行模式，完全分布式运行模式-连载中

Hadoop-配置伪分布模式

Hadoop伪分布式运行实例

Hadoop伪分布式模式安装

hadoop之伪分布式模式

Hadoop伪分布式模式搭建

Hadoop 伪分布式模式安装

Hadoop的伪分布式模式

Hadoop三种运行模式（单机模式、伪分布式模式、全分布式集群模式）

啃掉Hadoop系列笔记(04)-Hadoop运行模式之伪分布式模式

伪分布式运行模式

【二】hadoop伪分布式配置

5.大数据学习之旅——hadoop-简介及伪分布式安装

CentOS7伪分布式安装hadoop-取经第一关

hadoop伪分布式运行模式---启动YARN并运行MapReduce程序

hadoop伪分布式运行模式---启动HDFS并运行MapReduce程序

Hadoop的运行模式（伪分布式）——启动YARN并且运行MapReduce程序

hadoop运行模式（伪分布式）——启动HDFS并运行Mapreduce

Hadoop运行模式之本地模式和伪分布式

Hadoop学习笔记_4：运行模式之伪分布式模式

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)