上一篇我们使用Keepalived的HA功能,实现MySQL主从复制的自动故障切换。它的工作原理是:初始将MySQL的主从两个主机赋予不同的优先级别,当Keepalived启动时,会将VIP绑定到高优先级的主库上。在Keepalived中调用自定义脚本check_run,每分钟检查一次本机MySQL的服务器状态,如果MySQL不可用,则杀掉本机的keepalived进程。Keepalived每秒钟会检查一次本机的keepalived进程,如果进程不存在,则将VIP绑定到另一台机器上,如果这台机器原来是从库,则同时调用master.sh脚本执行从库切换为主库的操作。
本篇我们将做另一个实验,利用Keepalived的IPVS功能,调用LVS实现MySQL双主复制的读写负载均衡,同时保证负载均衡器和MySQL的高可用性。实验环境如图1所示。
LVS由ipvs和ipvsadm两部分组成:
在客户端看来,LVS就是一个真实的应用服务器。客户端向LVS发送请求信息,LVS接收数据报文至内核空间,工作在input链上的ipvs模块会判断用户请求是不是定义的后端服务器,如果用户请求的就是定义的后端集群服务,数据报文传送到input链上时,input链会强行将数据报文转发给postrouting,postrouting将数据报文传送给后端真实服务器。LVS的特点在于超强的分流功能,但它只能负责调度流量的去向,没有办法实现在业务层分流负载。
LVS可以独立使用,但更普遍的做法是与Keepalived一起使用。LVS提供负载均衡,Keepalived提供健康检查,故障转移,提高系统的可用性。Keepalived中的LVS配置包括虚拟主机组(Virtual Server Group)和虚拟主机(Virtual Server)。这些配置会传递给ipvsadm作为参数。采用这样的架构以后,很容易对现有系统进行扩展,在后端添加或者减少realserver后,只需要更改Keepalived配置文件中的LVS部分即可。
172.16.1.124:Keepalived + LVS Master
172.16.1.125:Keepalived + LVS Slave
172.16.1.126:MySQL Replication Master
172.16.1.127:MySQL Replication Master
172.16.1.127:VIP
在本环境中的RealServer就是两台MySQL服务器,LVS和RealServer分别使用两台主机。当LVS架构中的Director Server和RealServer工作在同一台机器上时,需要注意SYN_RECV问题,即会出现两台director无限循环转发请求的情况。对该问题的讨论参见“ 怎么样让LVS和realserver工作在同一台机器上”。
在172.16.1.126和172.16.1.127上配置MySQL双主复制,详细步骤从略。与主从复制相比,双主复制需要注意以下三个参数的设置:
本例中没有配置virtual_server_group。该配置段是可选的,目的是为了让一台RealServer的某个Service可以属于多个Virtual Server,并且只做一次健康检查。下面重点说明virtual server段的配置。
在172.16.1.124和172.16.1.125上执行以下命令:
结果分别如图6、7所示,可以看到VIP已经成功绑定到172.16.1.124。
此时查看LVS集群状态,可以看到集群下有两个RealServer,调度算法,权重等信息。ActiveConn代表当前RealServer的活跃连接数。
MySQL客户端使用VIP连接数据库,并查看所连接的数据库服务器ID。可以看到,每次执行依次连接到172.16.1.126和172.16.1.127的MySQL,证明是轮询策略产生的结果。
停止master上的keepalived服务,在172.16.1.124上执行以下命令:
此时连接MySQL,负载均衡不受影响。
5. 模拟mysqld crash
在172.16.1.126上执行以下命令:
本篇我们将做另一个实验,利用Keepalived的IPVS功能,调用LVS实现MySQL双主复制的读写负载均衡,同时保证负载均衡器和MySQL的高可用性。实验环境如图1所示。
图1
一、Keepalived和LVS简介
1. Keepalived简介
参见“ 使用Keepalived实现MySQL主从高可用”。2. LVS简介
LVS(Linux Virtual Server)是一个高可用性虚拟的服务器集群系统。本项目在1998年5月由章文嵩博士成立,是中国国内最早出现的自由软件项目之一。LVS主要用于多服务器的负载均衡,作用于网络层。LVS构建的服务器集群系统中,前端的负载均衡层被称为Director Server,后端提供服务的服务器组层被称为Real Server。通过下图可以大致了解LVS的基础架构。
图2
LVS由ipvs和ipvsadm两部分组成:
- ipvs:ipvs是工作在内核空间netfilter的input链上的框架,通过用户空间工具进行管理,其中是真正生效实现调度的代码。
- ipvsadm:ipvsadm负责为ipvs内核框架编写规则,是管理配置内核中ipvs程序的用户空间的管理工具。
图3
在客户端看来,LVS就是一个真实的应用服务器。客户端向LVS发送请求信息,LVS接收数据报文至内核空间,工作在input链上的ipvs模块会判断用户请求是不是定义的后端服务器,如果用户请求的就是定义的后端集群服务,数据报文传送到input链上时,input链会强行将数据报文转发给postrouting,postrouting将数据报文传送给后端真实服务器。LVS的特点在于超强的分流功能,但它只能负责调度流量的去向,没有办法实现在业务层分流负载。
LVS可以独立使用,但更普遍的做法是与Keepalived一起使用。LVS提供负载均衡,Keepalived提供健康检查,故障转移,提高系统的可用性。Keepalived中的LVS配置包括虚拟主机组(Virtual Server Group)和虚拟主机(Virtual Server)。这些配置会传递给ipvsadm作为参数。采用这样的架构以后,很容易对现有系统进行扩展,在后端添加或者减少realserver后,只需要更改Keepalived配置文件中的LVS部分即可。
二、安装配置
环境:172.16.1.124:Keepalived + LVS Master
172.16.1.125:Keepalived + LVS Slave
172.16.1.126:MySQL Replication Master
172.16.1.127:MySQL Replication Master
172.16.1.127:VIP
在本环境中的RealServer就是两台MySQL服务器,LVS和RealServer分别使用两台主机。当LVS架构中的Director Server和RealServer工作在同一台机器上时,需要注意SYN_RECV问题,即会出现两台director无限循环转发请求的情况。对该问题的讨论参见“ 怎么样让LVS和realserver工作在同一台机器上”。
在172.16.1.126和172.16.1.127上配置MySQL双主复制,详细步骤从略。与主从复制相比,双主复制需要注意以下三个参数的设置:
- log_slave_updates:要设置为true,将复制事件写入本机binlog。一台服务器既做主库又做从库时此选项必须要开启。
- auto_increment_offset和auto_increment_increment:为避免自增列冲突,需要设置这两个参数,例如在双主复制中,可以配置如下:
# masterA自增长ID auto_increment_offset = 1 auto_increment_increment = 2 #奇数ID # masterB自增加ID auto_increment_offset = 2 auto_increment_increment = 2 #偶数ID
1. 下载安装LVS
在172.16.1.124和172.16.1.125上用root用户执行以下命令:yum -y install ipvsadm
2. 下载安装Keepalived
在172.16.1.124和172.16.1.125上安装Keepalived,详细步骤参见“ 使用Keepalived实现MySQL主从高可用”。3. Keepalived配置
172.16.1.124初始为keepalived的master,其上的keepalived配置文件如下:[root@hdp1~]#more /etc/keepalived/keepalived.conf
global_defs {
router_id LVS_DEVEL
}
vrrp_sync_group VG1 {
group {
VI_1
}
}
vrrp_instance VI_1 {
state BACKUP
interface ens32
virtual_router_id 51
priority 100
advert_int 1
nopreempt
authentication {
auth_type PASS
auth_pass 1234
}
virtual_ipaddress {
172.16.1.100
}
}
virtual_server 172.16.1.100 3306 { # 定义虚拟服务器,地址与上面的virtual_ipaddress相同
delay_loop 3 # 健康检查时间间隔,3秒
lb_algo rr # 负载均衡调度算法:rr|wrr|lc|wlc|sh|dh|lblc
lb_kind DR # 负载均衡转发规则:NAT|DR|TUN
# persistence_timeout 5 # 会话保持时间5秒,动态服务建议开启
protocol TCP # 转发协议protocol,一般有tcp和udp两种
#后端真实服务器,有几台就设置几个
real_server 172.16.1.126 3306 {
weight 1 # 权重越大负载分越大,0表示失效
TCP_CHECK {
connect_timeout 3
nb_get_retry 3
delay_before_retry 3
connect_port 3306
}
}
real_server 172.16.1.127 3306 {
weight 1
TCP_CHECK {
connect_timeout 3
nb_get_retry 3
delay_before_retry 3
connect_port 3306
}
}
}
[root@hdp1~]#
172.16.1.125初始为keepalived的slave,其上的keepalived配置文件如下:
[root@hdp2~]#more /etc/keepalived/keepalived.conf
global_defs {
router_id LVS_DEVEL
}
vrrp_sync_group VG1 {
group {
VI_1
}
}
vrrp_instance VI_1 {
state BACKUP
interface ens32
virtual_router_id 51
priority 90
advert_int 1
nopreempt
authentication {
auth_type PASS
auth_pass 1234
}
virtual_ipaddress {
172.16.1.100
}
}
virtual_server 172.16.1.100 3306 { # 定义虚拟服务器,地址与上面的virtual_ipaddress相同
delay_loop 3 # 健康检查时间间隔,3秒
lb_algo rr # 负载均衡调度算法:rr|wrr|lc|wlc|sh|dh|lblc
lb_kind DR # 负载均衡转发规则:NAT|DR|TUN
# persistence_timeout 5 # 会话保持时间5秒,动态服务建议开启
protocol TCP # 转发协议protocol,一般有tcp和udp两种
#后端真实服务器,有几台就设置几个
real_server 172.16.1.126 3306 {
weight 1 # 权重越大负载分越大,0表示失效
TCP_CHECK {
connect_timeout 3
nb_get_retry 3
delay_before_retry 3
connect_port 3306
}
}
real_server 172.16.1.127 3306 {
weight 1
TCP_CHECK {
connect_timeout 3
nb_get_retry 3
delay_before_retry 3
connect_port 3306
}
}
}
[root@hdp2~]#
master与slave的keepalived配置文件中只有priority设置不同,master为100,slave为90,其它全一样。配置文件是以块形式组织的,每个块都在{}包围的范围内,#和!开头的行都是注释。global_defs、vrrp_sync_group、vrrp_instance部分的配置说明参见“
使用Keepalived实现MySQL主从高可用”。
本例中没有配置virtual_server_group。该配置段是可选的,目的是为了让一台RealServer的某个Service可以属于多个Virtual Server,并且只做一次健康检查。下面重点说明virtual server段的配置。
- virtual_server:设置一个虚拟服务器,指定其虚拟IP和虚拟端口。
- delay_loop:指定服务轮询的时间间隔,单位是秒。
- lb_algo:指定LVS的调度算法,本例指定为rr,即轮询。关于LVS所支持调度算法的说明,参见http://www.cnblogs.com/anay/p/9260306.html#_label7。
- lb_kind:指定LVS转发模式,本例设置为DR,这也是大多数生产环境的配置。关于LVS所支持转发模式的说明,参见http://www.cnblogs.com/anay/p/9260306.html#_label3。
- persistence_timeout:指定以秒为单位的会话保持时间,这里做了注释,意为不保持,目的是为了方便查看后面测试rr负载均衡算法的效果。生产环境建议开启该参数。
- protocol:指定转发协议使用TCP还是UDP。
- real_server:每台RealServer都需要一个real_server配置项,执行真实服务器的IP和端口。本例指定两个MySQL库的服务器地址和端口。
- weight:指定RealServer权重,默认为1,0为失效。
- TCP_CHECK:指定健康检查方式为TCP。支持HTTP_GET、SSL_GET、TCP_CHECK、SMTP_CHECK、MISC_CHECK、HTTP_GET、SSL_GET等检查方式,每种方式包含自己的参数。
- connect_timeout:定义连接超时时间,单位是秒。
- nb_get_retry:指定重连次数。
- delay_before_retry:指定重连的时间间隔,单位是秒。
- connect_port:指定健康检查的端口。
5. 在RealServer的回环地址上绑定VIP
这步操作是LVS的DR转发模式所需要的。在172.16.1.126和172.16.1.127上执行下面的命令:/sbin/ifconfig lo:0 172.16.1.100 netmask 255.255.255.255 up
该命令在回环地址上绑定VIP,设定掩码,目的是与LVS服务器上自身的IP保持通信。命令执行后172.16.1.126和172.16.1.127上的IP地址分别如图4、5所示。
图4
图5
三、测试
1. 分别在master上和slave上启动keepalived进程。在172.16.1.124和172.16.1.125上执行以下命令:
/etc/init.d/keepalived start
2. 查看master和slave上的VIP
结果分别如图6、7所示,可以看到VIP已经成功绑定到172.16.1.124。
图6
图7
此时查看LVS集群状态,可以看到集群下有两个RealServer,调度算法,权重等信息。ActiveConn代表当前RealServer的活跃连接数。
[root@hdp1~]#ipvsadm -Ln
IP Virtual Server version 1.2.1 (size=4096)
Prot LocalAddress:Port Scheduler Flags
-> RemoteAddress:Port Forward Weight ActiveConn InActConn
TCP 172.16.1.100:3306 rr
-> 172.16.1.126:3306 Route 1 0 0
-> 172.16.1.127:3306 Route 1 0 0
[root@hdp1~]#
3. 验证LVS负载均衡转发策略
MySQL客户端使用VIP连接数据库,并查看所连接的数据库服务器ID。可以看到,每次执行依次连接到172.16.1.126和172.16.1.127的MySQL,证明是轮询策略产生的结果。
C:\WINDOWS\system32>mysql -uwxy -p123456 -h172.16.1.100 -e "show variables like 'server_id'"
mysql: [Warning] Using a password on the command line interface can be insecure.
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| server_id | 126 |
+---------------+-------+
C:\WINDOWS\system32>mysql -uwxy -p123456 -h172.16.1.100 -e "show variables like 'server_id'"
mysql: [Warning] Using a password on the command line interface can be insecure.
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| server_id | 127 |
+---------------+-------+
C:\WINDOWS\system32>mysql -uwxy -p123456 -h172.16.1.100 -e "show variables like 'server_id'"
mysql: [Warning] Using a password on the command line interface can be insecure.
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| server_id | 126 |
+---------------+-------+
C:\WINDOWS\system32>mysql -uwxy -p123456 -h172.16.1.100 -e "show variables like 'server_id'"
mysql: [Warning] Using a password on the command line interface can be insecure.
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| server_id | 127 |
+---------------+-------+
4. 模拟LVS的master失效
停止master上的keepalived服务,在172.16.1.124上执行以下命令:
/etc/init.d/keepalived stop
再次查看172.16.1.124、172.16.1.125绑定的VIP分别如图8、9所示。可以看到VIP已经漂移到172.16.1.125上,它成为了新的master。
图8
图9
此时连接MySQL,负载均衡不受影响。
C:\WINDOWS\system32>mysql -uwxy -p123456 -h172.16.1.100 -e "show variables like 'server_id'"
mysql: [Warning] Using a password on the command line interface can be insecure.
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| server_id | 127 |
+---------------+-------+
C:\WINDOWS\system32>mysql -uwxy -p123456 -h172.16.1.100 -e "show variables like 'server_id'"
mysql: [Warning] Using a password on the command line interface can be insecure.
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| server_id | 126 |
+---------------+-------+
C:\WINDOWS\system32>mysql -uwxy -p123456 -h172.16.1.100 -e "show variables like 'server_id'"
mysql: [Warning] Using a password on the command line interface can be insecure.
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| server_id | 127 |
+---------------+-------+
C:\WINDOWS\system32>mysql -uwxy -p123456 -h172.16.1.100 -e "show variables like 'server_id'"
mysql: [Warning] Using a password on the command line interface can be insecure.
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| server_id | 126 |
+---------------+-------+
此时再次启动172.16.1.124上keepalived服务,它已经变为slave,而且并不会去抢占master,这是由nopreempt参数决定的。
5. 模拟mysqld crash
在172.16.1.126上执行以下命令:
pkill -9 mysqld
此时,LVS检测到了172.16.1.126上的MySQL Server宕机,集群自动剔除了故障节点。此时集群中只有一个RealServer的地址,即172.16.1.127:3306。
[root@hdp1~]#ipvsadm -Ln
IP Virtual Server version 1.2.1 (size=4096)
Prot LocalAddress:Port Scheduler Flags
-> RemoteAddress:Port Forward Weight ActiveConn InActConn
TCP 172.16.1.100:3306 rr
-> 172.16.1.127:3306 Route 1 0 0
[root@hdp1~]#
此时连接MySQL,可以看到应用不受影响,但只连接到一台MySQL服务器。
C:\WINDOWS\system32>mysql -uwxy -p123456 -h172.16.1.100 -e "show variables like 'server_id'"
mysql: [Warning] Using a password on the command line interface can be insecure.
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| server_id | 127 |
+---------------+-------+
C:\WINDOWS\system32>mysql -uwxy -p123456 -h172.16.1.100 -e "show variables like 'server_id'"
mysql: [Warning] Using a password on the command line interface can be insecure.
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| server_id | 127 |
+---------------+-------+
C:\WINDOWS\system32>mysql -uwxy -p123456 -h172.16.1.100 -e "show variables like 'server_id'"
mysql: [Warning] Using a password on the command line interface can be insecure.
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| server_id | 127 |
+---------------+-------+
C:\WINDOWS\system32>mysql -uwxy -p123456 -h172.16.1.100 -e "show variables like 'server_id'"
mysql: [Warning] Using a password on the command line interface can be insecure.
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| server_id | 127 |
+---------------+-------+
重新启动172.16.1.126上的MySQL后,LVS自动将故障节点自动加入集群。
[root@hdp1~]#ipvsadm -Ln
IP Virtual Server version 1.2.1 (size=4096)
Prot LocalAddress:Port Scheduler Flags
-> RemoteAddress:Port Forward Weight ActiveConn InActConn
TCP 172.16.1.100:3306 rr
-> 172.16.1.126:3306 Route 1 0 0
-> 172.16.1.127:3306 Route 1 0 0
[root@hdp1~]#
四、总结
- 之所以要使用MySQL双主复制而不是主从复制,是因为本方案中并没有涉及读写分离,而是在两个等价的MySQL服务器之间做读写负载均衡。
- 本例中除了简单配置外,没有任何自定义的脚本。
- Keepalived利用VRRP实现了LVS的HA,避免了LVS服务器的单点故障,出现故障时可以自动切换到正常的节点。
- LVS服务器提供了负载均衡的作用,将用户请求分发到多个RealServer。同时,一台RealServer故障并不会影响整个集群,因为LVS会检测RealServer的状态,并据此自动添加或删除集群中的RealServer服务。
- 如本例的配置,需要考虑单台MySQL服务器的负载最好不要超过50%,否则一旦某台MySQL服务器故障,可能出现另一台正常MySQL不堪重负的情况。