在虚拟机CentOS7中安装Oozie(安装前提环境搭建:jdk+hadoop+pig)

安装环境搭建:

  • 安装虚拟机VMware-workstation-full-12.5.7.20721.exe,以管理员身份运行,自行定义安装位置,安装过程参考软件安装管家公众号
  • CentOS的安装:https://jingyan.baidu.com/album/0eb457e5d7b28403f0a90577.html?picindex=3,,安装过程中将虚拟磁盘拆分成多个文件(M),根据需要进行软件选择,自定义安装位置,开始安装时配置root用户密码,用户名和用户权限。出现如下报错:

        解决方法:https://blog.csdn.net/qq_33468857/article/details/90346550

JDK的安装 :https://blog.csdn.net/dhr201499/article/details/81626466

  • 手动下载jdk1.8安装包,并解压到/usr/local/
  •  配置环境变量vim /etc/profile,在文件末尾添加如下环境变量并生效,即可安装成功:

Hadoop的安装和启动: https://www.jianshu.com/p/e925137b2aa2,hadoop未启动起来,一个一个启动能方便发现问题

  • 查看ip地址:ifconfig
  • 修改hostname:vim /etc/hostname
  • 注意需要把所有的hadoopserver改成自己的名字 
  • 关闭防火墙:systemctl stop firewall;systemctl disable firewalld
  • 启动./sbin/yarn-daemon.sh start resourcemanager;./sbin/hadoop-daemon.sh start datanode;./sbin/hadoop-daemon.sh start namenode
  • tail -100f logs;tail -100f logs/yarn-root-resourcemanager-bigdata.cmcc.com.out
  • 成功后有四个文件可以启动起来,也可以登录进去网页http://192.168.42.161:8088/cluster
  • 总结hadoop的启动:
[hadoop@bigdata ~]$ su root
[root@bigdata hadoop]# ssh localhost
[root@bigdata ~]#ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
[root@bigdata ~]#cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
[root@bigdata ~]#chmod 0600 ~/.ssh/authorized_keys
[root@bigdata ~]#ssh localhost
[root@bigdata ~]#hdfs namenode -format
[root@bigdata ~]#start-dfs.sh
[root@bigdata ~]#jps
[root@bigdata ~]#start-yarn.sh
[root@bigdata ~]#jps

 PIG的安装:https://blog.csdn.net/weixin_34074740/article/details/91505214

 Maven的安装:https://blog.csdn.net/qq_28410283/article/details/81837151

Oozie的安装: 

  • 修改maven的仓库设置cd /usr/local/maven中conf下的settings.xml文件(必须要这步操作,否则Oozie编译报错)
  • 手动下载并解压Oozie至/usr/local/oozie5.1.0,修改环境变量vim /etc/profile,修改oozie.pom文件中对应的hadoop版本号,执行source /etc/proflie

  • 官方提供的只是源码,需要自己去编译生成打包的文件,编译过程如下,在bin目录下执行mkdistro.sh -DskipTests -Puber进行编译,在distro/target目录下面会得到一个编译好的名Oozie-5.1.0-distro.tar.gz包,此时将之前下载的源码包删除或者修改名字。

  1. 添加环境变量;
  2. 修改conf中oozie-site.xml文件,修改版本名称,hadoop对应的目录,没有spark,需将其删掉
  3. 在oozie下创建libext文件夹,将hadoop中的包和ext-2.2.zip(oozie客户端插件)复制到libext中,在hadoop配置文件hdfs-site.xml追加oozie代理用户

 Oozie的部署:

  • mysql的安装和配置,授权于oozie,并创建oozie数据库,创建成功的话,会生成一个oozie.sql文件,并将mysql的jar包放到oozie的lib目录下;

  • oozie环境变量的配置;
  • 启动Oozie,注意启动之前先启动hadoop
  • 上传Ooize目录下的yarn.Tar.gz文件到HDFS ,只上传一次bin/oozie-setup.sh sharelib create -fs hdfs://localhost:8088 -locallib oozie-sharelib-oozie版本号-yarn.tar.gz
  •  创建oozie.sql文件并打包项目生成war包,bin/ooziedb.sh create -sqfile oozie -sqlfile oozie.sql -run  bin/oozie-setup.sh prepare-war

  • 成功启动后会出现BootStrap进程,在浏览器中可以查看Oozie,端口号是:11000

  • Oozie验证启动成功状态,执行oozie admin -oozie http://192.168.7.88:11000/oozie -status

 Oozie遇到的问题

  • Q:安装完成后进不去用户登录界面,显示如下:

        A: 输入【1】,按Enter键阅读许可协议,

            输入【2】,按Enter键接受许可协议,

            输入【q】,按Enter键退出,

            输入【yes】,按Enter键确定,

            重启之后即可进入图形登录界即可

  • Q:用命令直接安装jdk,无法找到几个安装包

        A: 下载压缩包,进行手动安装

  • Q:安装jdk,解压报错

        A: su root进入进行解压

  • Q: hadoop安装报错,Error: JAVA_HOME is not set and could not be found

        A: 添加JavaHome 路径export JAVA_HOME=/usr/java/jdk1.6.0_45

  • Q: hadoop安装成功后启动报错

        A: 关闭防火墙systemctl stop firewall,再次启动hadoop

  • Q: hadoop不能将全部文件启动起来

        A: 关闭hadoop,并进行单独启动

             ./sbin/yarn-daemon.sh start resourcemanager;

             ./sbin/hadoop-daemon.sh start datanode;

             ./sbin/hadoop-daemon.sh start namenode

  • Q: 运行mvn -version正确,但mvn报错,依赖包下不下来

        A: 修改maven的仓库设置cd /usr/local/maven中conf下的settings.xml文件​​,操作如下:

  • Q: oozie中oozie-site.xml文件配置问题

        A:添加部分代理,将对应版本及端口号都对应上​​​​​​​

  • Q: 缺少部分jar包

        A:手动下载jar包,注意:添加jar包后需要打成war包,否则启动oozie会报错​​​​​​​

  • Q: Oozie启动不起来

        A:启动oozie前需要将hadoop启动起来,并且需要启动JobHistorySever进程,在bin目录下执行Mr-jobhistory- daemon.sh start historysever​​​​​​​

发布了111 篇原创文章 · 获赞 57 · 访问量 6万+

猜你喜欢

转载自blog.csdn.net/qq_38358499/article/details/99415156