hadoop及spark集群搭建后续 - 代码天地

hadoop及spark集群搭建后续

其他 2018-11-25 20:59:49 阅读次数: 0

问题1：查看 jps，里面只有HQuorumPeer，没有 HRegionServer

查看logs，master rejected startup because clock is out of sync

原因：几台机器时间对不上

解决方法：将有问题机器的时间校正

date -s xx:xx:xx

然后重启regionserver

hbase-daemon.sh --config /usr/local/hbase/hbase-conf start regionserver

问题2：Spark webUI打不开

原因1：spark ui的默认端口是4040，然后被占用了就会顺序取+1的端口，当开了多个spark程序之后，当端口号加到了4045，在chrome浏览器里面就打不开了。会返回一个UNSAFE PORT的错误信息，
其实这是浏览器禁用了你访问这个端口，程序其实是正常运行的。因此建议手工指定spark.ui.port=4046在spark-defaults.conf配置文件中，
如果4046被占用了，就从4046开始往后+1，跳过4045这个端口，避免看不到spark ui界面的困扰。

原因2：sparksubmit进程没有运行，当sparksubmit停在运行时，4040端口也就关闭了

问题3：hadoop找不到外接磁盘阵列

原因：利用df命令检查linux服务器的文件系统的磁盘空间占用情况

系统显示文件系统/dev/sdb3已经挂到系统上了，在/home目录下

修改worker的配置文件vim hdfs-site.xml

<property>
    <name>dfs.datanode.data.dir</name>
    <value>file:/usr/local/hadoop-2.7.3/tmp/dfs/data,file:/mnt/dfs/data</value>
</property>

然后再关闭datanode

bin/hadoop-daemon.sh stop datanode

启动datanode

hadoop-daemon.sh start datanode
最后在master节点上更新节点

hdfs dfsadmin -refreshNodes

yarn rmadmin -refreshNodes

利用hadoop dfsadmin -report查看集群状况，检查节点容量是否更新

问题4：python3操作hbase报错

anaconda3/lib/python3.5/site-packages/hbase/Hbase.py except IOError, io:SyntaxError:invalid syntax

问题原因：python3与hbase语法不兼容

解决办法：首先要下载python3的Hbase文件,替换Hbase文件/anaconda3/lib/python3.5/site-packages/hbase/Hbase.py和ttypes.py
下载地址为:https://github.com/626626cdllp/infrastructure/tree/master/hbase

参考文献：

http://keren.iteye.com/blog/1613033

https://cloud.tencent.com/developer/article/1049221

https://blog.csdn.net/luanpeng825485697/article/details/81048468

猜你喜欢

转载自blog.csdn.net/intersting/article/details/83930424

hadoop及spark集群搭建后续

Hadoop、Spark 集群环境搭建

hadoop-spark集群搭建

hadoop&spark集群搭建

hadoop+spark集群搭建

基于Hadoop的Spark集群搭建

Hadoop、Spark 集群环境搭建问题汇总

Spark 1.5、Hadoop 2.7 集群环境搭建

hadoop、zookeeper、hbase、spark集群环境搭建

Hadoop及spark集群搭建踩过的坑

Docker 搭建Spark_hadoop集群

VM+CentOS+Hadoop+Spark集群搭建

Spark-- docker + spark +hadoop进行搭建本机的伪集群

基于Vmware Workstation上的hadoop集群搭建Spark集群

安装Spark+hadoop，spark、hadoop分布式集群搭建...(亲自搭建过！！)

搭建Hadoop2.6.0+Spark1.1.0集群环境

CentOS Linux中搭建Hadoop和Spark集群详解

spark+hadoop集群搭建-虚拟机

hadoop + spark+ hive 集群搭建(apache版本)

Hadoop+Spark分布式集群环境搭建

Hadoop+Spark+Zookeeper高可用集群搭建（五）

Ubuntu 18.04下搭建单机Hadoop和Spark集群环境

基于docker搭建hadoop+spark+hive+hbase集群的过程

AWS EC2 搭建 Hadoop 和 Spark 集群

spark_hadoop集群搭建自动化脚本

Hadoop与Spark的集群复制

Spark Hadoop 环境搭建

hadoop 下 spark 搭建

四、Hadoop搭建Spark

Spark2.2.0集群搭建部署之【HADOOP集群篇】

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)