Hadoop完全分布式环境搭建之安装配置Hadoop

在开始本文之前,请先确保所有的系统环境已配置完成,以及关闭linux防火墙:

Linux Centos永久关闭防火墙

Hadoop完全分布式环境搭建之生成ssh秘钥并配置

并再重申一遍,我的架构:一节点作为namenode/jobtracker,另外两节点作为datanode/tasktracker


好了,开始!

1.去官网的镜像网站下载稳定版本的Hadoop,输入http://mirrors.hust.edu.cn/apache/hadoop/common/

考虑到诸位此时和我时间不同,所以请自行查找最新的稳定版本Hadoop,也就是stable文件夹中的内容

(我是用的是旧版1.0.1去入门学习hadoop,附上资源:http://archive.apache.org/dist/hadoop/core/)


我们准备下载hadoop-1.2.1.tar.gz,右键点击,复制超链接!


2.打开一个linux虚拟机节点即可,登陆完毕


指令:

wget http://archive.apache.org/dist/hadoop/core/hadoop-1.2.1/hadoop-1.2.1.tar.gz

等待下载完成即可


3.解压

先查看一下有无hadoop-1.2.1.tar.gz文件,然后输入


指令:

tar xzvf hadoop-1.2.1.tar.gz

等待解压完即可


4.进入./hadoop-1.2.1/conf (我们的核心配置文件都在这)



4.首先配置环境,即hadoop-env.sh


指令:

vim hadoop-env.sh


将JAVA_HOME前的#号去掉(注释),改为我们的jdk位置,也就是环境变量JAVA_HOME的值,我这里是

/usr/lib/jvm/jdk1.6.0_45

5.配置core-site.xml


指令:

vim core-site.xml


添加:

<!-- namenode位置 -->
<property>
  <name>fs.default.name</name>
  <value>hdfs://master:9000</value>
</property>
<!-- hadoop的临时文件夹 -->
<property>
  <name>hadoop.tmp.dir</name>
  <value>/home/xqz/hadoop/tmp</value>
</property>

按esc输入:wq保存退出


6.配置hdfs-site.xml

指令:

vim hdfs-site.xml


添加:

<!-- 集群数据副本数 -->
<property>
  <name>dfs.replication</name>
  <value>2</value>
</property>
<!--
  <!-- NameNode元数据的存储位置 -->
  <property>
    <name>dfs.name.dir</name>
    <value>/home/xqz/hadoop/name</value>
  </property>
  <!-- DataNode的数据存储位置 -->
  <property>
    <name>dfs.data.dir</name>
    <value>/home/xqz/hadoop/data</value>
  </property>
-->

按esc输入:wq保存退出

dfs.replication:数据保存几份,因为我只有两个datanode,所以保存两份


7.配置mapred-site.xml


指令:

vim mapred-site.xml


添加:

<property>
  <name>mapred.job.tracker</name>
  <value>master:9001</value>
</property>

按esc输入:wq保存退出


8.配置masters


指令:

vim masters


改为master,也就是我作为master/namenode/jobtracker(仅仅是我自己的架构)的主机名



9.配置slaves


指令:

vim slaves


添加两个slave/datanode/tasktracker的节点主机名


10.想其余节点复制hadoop


指令:

 
 
scp -r hadoop-1.2.1 xqz@slave1:~/hadoop-1.2.1/
scp -r hadoop-1.2.1 xqz@slave2:~/hadoop-1.2.1/

11.格式化HDFS,即生成整个HDFS的结构

请先移动当前位置到hadoop-1.2.1


指令:

bin/hadoop namenode -format

12.启动hadoop


指令:

bin/start-all.sh

关闭命令是:

bin/stop-all.sh

13.查看集群状态


指令:

hadoop dfsadmin -report

注意!

如果不能使用hadoop,请在/etc/profile中增加环境变量:


增加:

export HADOOP_DEV_HOME=/home/xqz/hadoop- 1.2 . 1
export PATH=$PATH:$HADOOP_DEV_HOME/bin
export PATH=$PATH:$HADOOP_DEV_HOME/sbin
export HADOOP_MAPARED_HOME=${HADOOP_DEV_HOME}
export HADOOP_COMMON_HOME=${HADOOP_DEV_HOME}
export HADOOP_HDFS_HOME=${HADOOP_DEV_HOME}
export YARN_HOME=${HADOOP_DEV_HOME}
export HADOOP_CONF_DIR=${HADOOP_DEV_HOME}/conf

并输入指令:

source /etc/profile

使环境变量生效


大功告成!

猜你喜欢

转载自blog.csdn.net/xqz583722585/article/details/80299223