数据库读写分离是很多公司绕不过去的一个发展阶段,从单体数据库,到主备模式,再到读写分离,分库分表。每一个阶段都能为我们解决一些问题,但也带来了新的挑战。本篇文章我们就主要研究一下数据库读写分离及其带来的问题如何解决。
1 数据库架构的发展历程
首先简单介绍一下数据库架构的发展历程,基本就是单体、主备、读写分离、分库分表,下面我们分别进行介绍。
1.1 单体架构
业务发展初期,数据库的压力相对较小,这时候使用单独一个库就可以。
引出的问题:如果数据库出现故障,我们的业务就不能使用,只能说是停机重启修复故障。
1.2 主备架构
由于单体带出的问题,这时候我们就需要加一个备用库,紧急情况可以用备库顶上,相当于加一个替补队员。
通过MySQL自带的主从同步机制,就可以放我们的替补队员上线。
当正式队员(主库)发生故障,我们就可以人工让其下线,让替补队员(备库)顶上。
引出的问题:随着业务大规模爆发,主库的压力过大,我们就想让备库承担起更大的责任来。
1.3 读写分离架构
读写分离架构本质也就是主备架构,与主备架构没有本质区别,就是在主备架构的基础上,增加一层对读写请求的处理,使其能够更大程度上利用备用库为我们分担一些读的压力。
读写分离架构,需要在中间加一层控制读写请求的路由
1.4 分库分表
分库分表的本质上是切分数据,是由于数据量级的提升,不对数据切分会严重影响数据库读写性能。
甚至是如果不切分,磁盘、内存、CPU无法承载这样的压力,数据库随时在奔溃的边缘。
分库分表与前三者是有本质区别的,分库分表后每一个库分片都可以采取以上三种方式的任意一种,可以是单体分片,也可以是主备分片,也可以是做了读写分离的分片。
分库分表和前三者中的一种是共生的关系。
不知道如何进行分库分表设计的可以读我之前的这篇文章《收好这份武林秘籍,让你分库分表再无烦恼》
2 读写分离设计方案
主从复制是MySQL数据库自带的功能,但是想要做读写分离就需要我们自己做一些工作配合MySQL主从同步配合使用。可选择的方案有很多。
2.1 代理
在应用程序和数据库之间增加代理层,代理层接收应用程序对数据库的请求,根据不同请求类型转发到不同的实例,实现读写分离的同时还可以实现负载均衡(读请求按照负载均衡的规则传入各个从节点)。
代理也就是借助中间件的方式,控制不同类型请求,进入不同的数据库。
目前常用的mysql的读写分离中间件有:
-
MySQL-Proxy
MySQL自己的一个开源项目,通过其自带的Lua脚本进行SQL判断
-
Atlas
Qihoo 360,在mysql-proxy 0.8.2版本的基础上,对其进行了优化,增加了一些新的功能特性。
-
MyCat
-
MaxScale
MariaDB 开发
-
Amoeba
阿里开发
-
...
2.2 应用内路由
在程序中进行控制,我们利用持久层框架的拦截器实现,动态路由不同数据源。
利用Sharding-JDBC也可以实现
实现思路:
- 配置多数据源
- 设置默认的数据源,配置数据源的切换策略
- 拦截进入数据库的请求,根据业务需求设置走哪个数据源。
3 读写分离造成的读延迟怎么办?
凡是采用读写分离架构,就会有同步延迟问题,我们只能想办法去克服这个问题。
3.1 数据同步写入从库
主从复制模式,一般都是异步写数据到从库,当然这个异步也可以设置为同步,只有当从库写完成,主库上的写请求才能返回。
这种方案是最佳单也是最有效的一种,但也是性能最差的一种,尤其是有大量从库的情况下,严重影响请求效率。
3.2 缓存(中间件)路由法
写请求时缓存记录一个key,这个key的失效时间设置为主从同步的延时,读请求的时候先去缓存中确认是否存在key,如果key存在说明发生了写请求,数据未同步到从库,这时走主库即可,若不存在这个key,直接走从库的查询即可。
中间件应该也是可以判断是否同步完成,与使用缓存记录类似。
这种方案最大的弊端是引入了缓存,系统复杂度上升。
3.3 选择性强制读主库
对于一些特殊的业务场景,采用强制读主库。
弊端,需要把每一个这种情况都找出来,设置成强制走主库。
3.4 等GTID 方案
MySQL 在执行完事务后,会将该事务的 GTID 会给客户端,然后客户端可以使用该命令去要执行读操作的从库中执行,等待该 GTID,等待成功后,再执行读操作;如果等待超时,则去主库执行读操作,或者再换一个从库执行上述流程。
MariaDB 的 MaxScale 就是使用该方案,MaxScale 是 MariaDB 开发的一个数据库智能代理服务(也支持 MySQL),允许根据数据库 SQL 语句将请求转向目标一个到多个服务器,可设定各种复杂程度的转向规则。
3.5 以不变应万变
有延迟就有延迟,对数据强一致性要求不高的场景可以放任不管。