Hadoop 在虚拟机上进行 HDFS 环境搭建--（第一篇）

一、准备条件

1.四台Linux虚拟机(1台NameNode节点，1台Secondary节点（Secondary和其中1台DataNode共用），外加2台DataNode)

2.下载Hadoop版本，本例使用Hadoop-2.5.2版本

二、安装Java JDK

最好安装，JDK 1.7 因为JDK 1.7的兼容性最好

#安装JDK
rpm -ivh jdk-7u79-linux-x64.rpm

#配置环境变量
vi /root/.bash_profile


JAVA_HOME=/usr/java/jdk1.7.0_79
PATH=$PATH:$JAVA_HOME/bin
export HADOOP_HOME=/usr/local/hadoop-2.5.1
PATH=$PATH:$HADOOP_HOME/bin
#HADOOP_HOME  是后面要用到的，为了方便提前写进来

配置完成以后，通过 java -version可以查看是否安装成功

三、配置hosts文件

vi /etc/hosts
#在该文件中建入
192.168.171.15 node5
192.168.171.16 node6
192.168.171.17 node7
192.168.171.18 node8

四、安装SSH 设置免密码登录

#创建密钥（一定要在NameNode节点上）：
ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
#将密钥添加到公钥：
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

然后将公钥添加到其他节点的authorized_keys上：

$ scp ~/.ssh/id_dsa.pub root@node6:/opt
$ scp ~/.ssh/id_dsa.pub root@node7:/opt
$ scp ~/.ssh/id_dsa.pub root@node8:/opt
#然后分别登录这三台虚拟机，将公钥覆盖到公钥中
$ cat /opt/id_dsa.pub >> ~/.ssh/authorized_keys

如果在进行上述操作的时候报：

-bash: /root/.ssh/authorized_keys: No such file or directory的错误，则需要先在该节点上创建一下本地公钥，然后再把主节点上的公钥添加到该节点上，具体操作看上方NameNode操作；

配置完成以后使用nameNode 分别：ssh node6 ; ssh node7 ssh node8 ；如果在登录的时候没有显示要输入密码则说明成功了；（在ssh 登录一个节点以后，需要先退出然后才能再登录，使用exit退出）；

五、安装Hadoop

1.解压hadoop-2.5.1 并移动到/usr/local/hadoop-2.5.1

$ tar -zxvf hadoop-2.5.1.tar.gz
$ mv hadoop-2.5.1 /usr/local

2.配置Hadoop配置文件

$ cd /usr/local/hadoop-2.5.1/etc/hadoop/
$ vim hadoop-env.sh
 #写入
   export JAVA_HOME=/usr/java/latest

$ vim etc/hadoop/core-site.xml
#写入，配置NameNode的读写入口点和目录
<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://node5:9000</value>
    </property>
  <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/hadoop</value>
    </property>
</configuration>

$ vim etc/hadoop/hdfs-site.xml
#写入，配置Secondry
<configuration>
   <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>node6:50090</value>
    </property>
    <property>
        <name>dfs.namenode.secondary.https-address</name>
        <value>node6:50091</value>
    </property>
</configuration>

配置DataNode节点：

$ vim etc/hadoop/slaves
#写入 配置dataNode
node6
node7
node8

$ vim etc/hadoop/masters
#写入，配置HDFS的secondry节点
node6

配置完成后将所有的配置文件在其他节点上覆盖一下：

scp -r hadoop/ root@node8:/usr/local/hadoop-2.5.1/etc/hadoop/
scp -r hadoop/ root@node6:/usr/local/hadoop-2.5.1/etc/hadoop/
scp -r hadoop/ root@node7:/usr/local/hadoop-2.5.1/etc/hadoop/

关闭防火墙，并同步时间：

$ service iptables stop
$ ntpdate s2c.time.edu.cn

3.格式化并初始化

$ bin/hdfs namenode -format

4.启动并访问

$ sbin/start-dfs.sh
#这是关闭命令
$ sbin/stop-dfs.sh

访问 nodeName:http://node5:50070/ http://node6:50070/ 如果能看到以下界面就说明成功了：

七、在HDFS上创建上传文件

$ hdfs dfsadmin #查看帮助
$ hdfs dfs -mkdir /test   #创建HDFS的根目录
$ hdfs dfs -ls /  #查看hdfs的目录
$ hdfs dfs -put /root/**  /test/  #上传文件到hdfs
$ hdfs dfs chmod  -777 /test  #放开hdfs的权限
$ hdfs dfs -help ls #查看命令帮助

Dream__people

发布了33 篇原创文章 · 获赞 2 · 访问量 2924

私信关注

Hadoop 在虚拟机上进行 HDFS 环境搭建--（第一篇）

猜你喜欢