通过shell脚本监测服务器集群的运行状态并触发邮件告警

监测服务器集群的运行状态并触发邮件告警

在生产环境中常常突发服务器集群宕机导致服务无法正常运行,使用shell脚本实时监控服务器集群的运行状态并在监测到服务器宕机后第一时间发送邮件告警告知运维人员进行及时处理

一,安装邮件客户端

yum -y install sendmail

yum -y install mailx

1.1 配置邮件mail.rc

set from=**@qq.com

set [email protected]

set smtp=smtp.qq.com

set smtp-auth-password=your-password

set stmp-auth=login

1.2 参数说明

  • from: 对方收到邮件时显示的发件人
  • smtp: 指定第三方发送邮件的 smtp 服务器地址
  • smtp-auth-user: 第三方发邮件的用户名
  • smtp-auth-password: 用户名对应密码(邮箱授权码)
  • smtp-auth: SMTP 的认证方式。默认是 LOGIN,也可改为 CRAM-MD5 或 PLAIN 方式

二,编写监测shell脚本ping_server.sh

#!/bin/bash
Date=`date -d "today" +"%Y-%m-%dT%H-%M-%S"`
#echo "根据当前时间创建日志文件"
mkdir -p /log/Ping/ping_server
touch /log/Ping/${Date}_ping_server.log
ip_list="192.168.10.100 192.168.10.101 192.168.10.102 192.168.10.103 192.168.10.104 "
for ip in ${ip_list}
  do
     ping -c 1 $ip &>/dev/null
     a=$?
     sleep 2
     ping -c 1 $ip &>/dev/null
     b=$?
     sleep 2
     ping -c 1 $ip &>/dev/null
     c=$?                                     #三次循环中有一次ping通及通
     sleep 2
     DATE=$(date +%F" "%H:%M)
     if [ $a -ne 0 -a $b -ne 0 -a $c -ne 0 ];then
         echo -e "Date : $DATE\nHost : $ip\nProblem : Ping is failed."
         echo -e "Date : $DATE\nHost : $ip\nProblem : Ping is failed 该服务器运行状态异常,请及时排查" >> /log/Ping/${Date}_ping_server.log
     #else
     #    echo "$ip ping is successful."
     fi
done
if [ -s /log/Ping/${Date}_unnormal.log ];then
  echo "不为空,发送邮件"
  #/usr/bin/mail -s " Server Status " *******@qq.com  < /log/Ping/${Date}_ping_server.log
  /usr/bin/mail -s " Server Status " ******@qq.com  < /log/Ping/${Date}_ping_server.log
else
  echo "为空,不发送邮件"
fi

三,脚本执行结果所示

测试一条邮件告警如下:

四,crontab添加定时任务

4.1 安装crontab服务

分别执行下边两个命令进行安装
yum -y install vixie-cron
yum -y install crontabs

安装完成,通过以下命令开启、关闭定时任务,以及查看crontab的状态

service crond start     #启动服务
service crond stop       #关闭服务
service crond restart   #重启服务
service crond reload   #重新载入配置
service crond status   #查看crontab服务状态

4.2 添加crontab定时任务列表

输入命令:crontab -e

把定时任务脚本添加进去

2 * * * * ./data/ping_server.sh     # 每两分钟执行一次ping_server.sh脚本来检测服务器状态

猜你喜欢

转载自blog.csdn.net/qq_52497256/article/details/128937574