软件应用宕机解决方案

主从多台nginx,其中有一台出现宕机,怎样处理?

实现nginx+keepalived

keepalived 常用命令

service keepalived start
service keepalived stop

启动主备的nginx和keepalived
如果其中的主nginx宕机,使用keepalived中的keepalived.conf对nginx监控
自动切换服务器节点,
两台keeplived的虚拟ip一致的,如果主keeplived挂了,会把虚拟ip分配给从服务器
配置nginx主备自动重启
第三步:对配置文件进行修改:vim /etc/keepalived/keepalived.conf

keepalived.conf配置文件说明:
(一)Master 主

! Configuration File for keepalived

global_defs {
   router_id bhz005 ##标识节点的字符串,通常为hostname
}

keepalived 会定时执行脚本并且对脚本的执行结果进行分析,动态调整vrrp_instance的优先级。这里的权重weight 是与下面的优先级priority有关,如果执行了一次检查脚本成功,则权重会-20,也就是由100 - 20 变成了80,Master 的优先级为80 就低于了Backup的优先级90,那么会进行自动的主备切换。
如果脚本执行结果为0并且weight配置的值大于0,则优先级会相应增加。
如果脚本执行结果不为0 并且weight配置的值小于0,则优先级会相应减少。

vrrp_script chk_nginx {
    script "/etc/keepalived/nginx_check.sh" ##执行脚本位置
    interval 2 ##检测时间间隔
    weight -20 ## 如果条件成立则权重减20(-20)
}

定义虚拟路由 VI_1为自定义标识。

vrrp_instance VI_1 {
state MASTER   ## 主节点为MASTER,备份节点为BACKUP
    ## 绑定虚拟IP的网络接口(网卡),与本机IP地址所在的网络接口相同(我这里是eth6)
interface eth6  
virtual_router_id 172  ## 虚拟路由ID号
    mcast_src_ip 192.168.1.172  ## 本机ip地址
    priority 100  ##优先级配置(0-254的值)
    Nopreempt  ## 
    advert_int 1 ## 组播信息发送间隔,俩个节点必须配置一致,默认1s
    authentication {  
        auth_type PASS
        auth_pass bhz ## 真实生产环境下对密码进行匹配
    }

    track_script {
        chk_nginx
    }

    virtual_ipaddress {
        192.168.1.170 ## 虚拟ip(vip),可以指定多个
    }
}

(二)Backup 从

! Configuration File for keepalived

global_defs {
   router_id bhz006
}

vrrp_script chk_nginx {
    script "/etc/keepalived/nginx_check.sh"
    interval 2
    weight -20
}

vrrp_instance VI_1 {
    state BACKUP
    interface eth7
    virtual_router_id 173
    mcast_src_ip 192.168.1.173
    priority 90 ##优先级配置
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass bhz
    }

    track_script {
        chk_nginx
    }

    virtual_ipaddress {
        192.168.1.170
    }
}

(三)nginx_check.sh 脚本:

#!/bin/bash
A=`ps -C nginx –no-header |wc -l`
if [ $A -eq 0 ];then
    /usr/local/nginx/sbin/nginx
    sleep 2
    if [ `ps -C nginx --no-header |wc -l` -eq 0 ];then
        killall keepalived
    fi
fi

(四)我们需要把master的keepalived配置文件 copy到master机器(172)的 /etc/keepalived/ 文件夹下,在把backup的keepalived配置文件copy到backup机器(173)的 /etc/keepalived/ 文件夹下,最后把nginx_check.sh脚本分别copy到两台机器的 /etc/keepalived/文件夹下。
(五)nginx_check.sh脚本授权。赋予可执行权限:chmod +x /etc/keepalived/nginx_check.sh
(六)启动2台机器的nginx之后。我们启动两台机器的keepalived

  /usr/local/nginx/sbin/nginx
  service keepalived start
  ps -ef | grep nginx 
  ps -ef | grep keepalived

可以进行测试,首先看一下俩台机器的ip a 命令下 都会出现一个虚拟ip,我们可以停掉 一个机器的keepalived,然后测试,命令:service keepalived stop。结果发现当前停掉的机器已经不可用,keepalived会自动切换到另一台机器上。

Nginx解决ddos流量攻击?

#限制IP的每秒请求次数
limit_req_zone $binary_remote_addr zone=one:10m rate=1r/s;
#限制同一个IP同一时间内创建连接次数
limit_conn_zone $binary_remote_addr zone=addr:10m;

采用nginx——keeplived(多台)

tomcat宕机?(多台)

proxy_connect_timeout 1; 连接时间
proxy_read_timeout 1; 该指令设置与代理服务器的读超时时间。它决定了nginx会等待多长时间来获得请求的响应。
proxy_send_timeout 1;这个指定设置了发送请求给upstream服务器的超时时间。

tomcat宕机?(单台的话)

需要写一个shell.sh脚本进行监控
#!/bin/sh
获取tomcat进程ID/usr/local/tomcat
TomcatID=$(ps -ef |grep tomcat |grep -w ‘tomcat’|grep -v ‘grep’|awk ‘{print KaTeX parse error: Expected 'EOF', got '}' at position 2: 2}̲') tomcat启动程序(这…(date +’%F %H:%M:%S’)]"
if [[ KaTeX parse error: Expected 'EOF', got '#' at position 18: …mcatID ]];then #̲ 这里判断TOMCAT进程是否…TomcatID,继续检测页面…"

检测是否启动成功(成功的话页面会返回状态"200")??

TomcatServiceCode=$(curl -I -m 10 -o /dev/null -s -w %{http_code} $WebUrl)
if [ T o m c a t S e r v i c e C o d e − e q 200 ] ; t h e n e c h o " [ i n f o ] 页 面 返 回 码 为 TomcatServiceCode -eq 200 ];then echo "[info]页面返回码为 TomcatServiceCodeeq200];thenecho"[info]TomcatServiceCode,tomcat启动成功,测试页面正常…"
else
echo “[error]tomcat页面出错,请注意…状态码为 T o m c a t S e r v i c e C o d e , 错 误 日 志 已 输 出 到 TomcatServiceCode,错误日志已输出到 TomcatServiceCode,GetPageInfo”
echo “[error]页面访问出错,开始重启tomcat”
kill -9 $TomcatID# 杀掉原tomcat进程
sleep 3
rm -rf $TomcatCache # 清理tomcat缓存
S t a r t T o m c a t f i e l s e e c h o " [ e r r o r ] t o m c a t 进 程 不 存 在 ! t o m c a t 开 始 自 动 重 启 . . . " e c h o " [ i n f o ] StartTomcat fi else echo "[error]tomcat进程不存在!tomcat开始自动重启..." echo "[info] StartTomcatfielseecho"[error]tomcat!tomcat..."echo"[info]StartTomcat,请稍候…"
#rm -rf $TomcatCache
$StartTomcat
fi
echo “------------------------------”??
}

猜你喜欢

转载自blog.csdn.net/YHM_MM/article/details/105018693