【导读】本文对容器和kubernetes容器云的日常巡检工作进行了整理,希望通过第三方开源工具和日志巡检的方式,提供排查方法和排查思路、典型案例,帮助大家学会尽快发现问题,排查问题,解决问题。
1 Docker容器日常巡检
通过以下方式进行检查:
1.1 docker/podman ps查看容器状态
Docker/podman ps -a 查看容器状态STATUS:
Exited(0):表示容器正常退出
Exited(其他数字):容器异常退出,需要通过log 查看原因
Up:容器在运行状态
Up(Paused):容器暂停
Up(healthy):容器监听健康
Up(unhealthy):容器监听异常
1.2 健康检查—HealthCheck
一些参数需要docker 17.05以上支持
1.2.1 通过docker run或者dockerfile添加健康检查
例如:
docker run --name=nginx --health-cmd="curl --silent --fail localhost/ || exit 1" --health-inter-val=30s --health-retries=3 --health-timeout=10s --start-period