关于cdh环境中zookeeper启动失败NodeManager内存溢出无法链接等的问题

在此记录一下

1、zookeeper一直启动失败:

看你的事物目录配置的是什么

解决方法:删除掉/var/lib/zookeeper/version-2 为0kb的有问题文件,问题解决

2、NodeManager内存溢出无法链接等的问题

 

注意几点:

1、这里不能超过物理内存的80%

2、这里不能设置无限制大小,按容器内存设置,后续有问题可随时调整

最重要的问题,跟踪日志发现:

 会读取恢复目录下的文件,一旦里面文件有异常就会一直卡死在这里,所以解决办法:

删除掉 /var/lib/hadoop-yarn/yarn-nm-recovery/yarn-nm-state ,删除掉这个yarn-nm-state文件夹及文件,问题解决。

猜你喜欢

转载自blog.csdn.net/jylonger/article/details/131302738