使用cloudera manager重启集群后部分节点无法启动问题解决

    博主遇到过使用cloudera manager重启集群后出现多个节点所有功能均无法连接,对该主机功能进行单点启动时并无报错信息,因为查询不到报错信息,就无法针对性的进行修复,所以进行多次测试定位到问题原因:

    常见单节点无法启动导致原因为cm连接异常,命令传输超时,并且日志中无报错,此时应重启该节点cm agent应用

    cm重启方法:找到cm存放路径(如安装路径不同和安装版本不同,需按照实际修改)

    例:

/opt/cm-5.3.2/etc/init.d/cloudera-scm-agent status       查看状态
/opt/cm-5.3.2/etc/init.d/cloudera-scm-agent restart       重启命令

    因cm版本不同重启方法有差别,也可使用以下命令进行重启

sudo service cloudera-scm-agent restart

    如启动后查看状态为:cloudera-scm-agent dead but pid file exists

    一般为9000端口占用所致,具体可查看cm agent日志来查看问题原因(如安装路径不同和安装版本不同,需按照实际修改):

/opt/cm-5.3.2/log/cloudera-scm-agent/cloudera-scm-agent.log

    杀死该端口方法:

kill -9 $(sudo netstat -tlnp | grep :9000 | awk '{print $7}' | awk -F '/' '{print $1}')


猜你喜欢

转载自blog.csdn.net/zcb_data/article/details/80510461
今日推荐