K8S集群中Pod资源处于Error状态排查思路
1.Pod资源处于Error状态的原因
Error状态是CrashLoopBackOff状态之前的一个错误状态,Pod资源处于Error状态的原因可能有以下几种:
- 依赖的存储卷Configmap、Secret、PV、PVC、StorageClass等等不存在,就会导致Pod处于Error状态。
- Pod资源中容器的实际的资源使用率超过了定义资源时设置的资源配额大小,就会导致Pod处于Error状态。
- 当Pod资源中的容器没有权限操作集群中的资源时,例如Jenkins要进行更新,但是没有对目标端的操作权限,此时就会导致Pod处于Error状态。
2.Pod资源处于Error状态的排查思路
1)排查Pod的状态
kubectl get pod
2)查看Pod运行的详细日志从中获取线索
kubectl describe pod <pod_name>
3)排查容器运行的日志获取关键信息
kubectl logs -f <pod_name>
4)排查Kubelet日志以及Node节点系统日志从中获取关键信息
journalctl -u kubelet -f
tail -f /var/log/messages