什么是事务
什么是事务?举个生活中的例子,你去小卖铺买东西,“一手交钱,一手交货”,就是一个事务的例子,交钱和交货必须全部成功,事务才算成功,任一活动失败,事务将撤销所有已成功的活动。
明白上述例子,我们再来看,事务的含义,
事务可以看做是一次大的活动,它有不同的小活动组成,这些活动要么全部成功,要么全部失败。
本地事务
在计算机系统中,更多的是通过关系型数据库来控制事务,这是利用数据库本身的事务特性事项的,因此叫数据库事务,由于应用主要靠关系型数据库来控制事务,而数据库和应用通常在同一个服务器,所以基于关系型数据库的事务,又叫做本地事务。
数据库事务的四大特性ACID:
A(automic):原子性,构成事务的所有操作,要么都执行完成,要么全部不执行,不可能出现部分成功部分失败的情况。
C(consistency):一致性,在事务执行前后,数据库的一致性结束没有被破坏。比如张三向李四转100元,转账前和转账后的数据是正确状态这叫一致性,如果出现张三转出100元,而李四账户没有增加100元这就出现了数据错误,就没有达到一致性。
I(Isolation):隔离性,数据库中事务一般都是并发的,隔离性是指并发中的两个事务的执行互不干扰,一个事务不能看到其他事务运行过程的中间状态。通过配置事务隔离级别,可以避免脏读、重复读等问题。
D(Durability):持久性,事务完成之后,该事务对数据的更改会被持久化到数据库,且不会被回滚。
数据库事务在实现时,会将一次事务设计的所有操作全部纳入到一个不可分割的执行单元,该执行单元中的所有操作,要么都成功,要么都失败,只要其中任一操作执行失败,都将导致整个事务的回滚。
分布式事务
随着互联网快速发展,软件系统由原来的单体应用转变为分布式应用,下图描述了单体应用向微服务的演变:
分布式系统会把一个应用系统拆分成可独立部署的多个服务,因此需要服务与服务之间远程协作才能完成事务操作,这种分布式系统环境下由不同的服务之间通过网络远程协作完成事务称之为分布式事务,例如用户注册送积分事务、创建订单减库存事务、银行转账事务都是分布式事务。
我们知道本地事务依赖数据库本身提供的事务特性来实现,因此以下逻辑可以控制本地事务:
begin transaction;
// 本地数据库操作:张三减少金额
// 本地数据库操作:李四增加金额
commit transaction;
但在分布式环境下,会变成下边这样:
begin transaction;
// 本地数据库:张三减少金额
// 远程调用:让李四增加金额
commit transaction;
可以设想,当远程调用让李四增加金额成功了,由于网络问题,远程调用并没有返回,此时本地事务提交失败,就回滚了张三减少金额的操作,此时李四和张三的数据就不一致了。
因此在分布式架构的基础上,传统数据库事务就无法使用了,张三和李四的账户不在一个数据库中,甚至不在一个应用系统里,实现转账事务需要通过远程调用,由于网络问题就会导致分布式事务问题。
分布式事务产生的场景
1.典型的场景就是微服务架构:
微服务之间通过远程调用完成事务操作
比如:订单微服务和库存微服务,下单的同时订单微服务请求库存微服务减库存。
2.单体系统访问多个数据库实例
当单体系统需要访问多个数据库实例时就会产生分布式事务
比如用户信息和订单信息分别在两个MySQL实例存储,用户管理系统删除用户信息,需要删除用户信息及用户的订单信息,由于数据分布在不同的实例,需要通过不同的数据库链接去操作数据,此时产生分布式事务。
简言之,跨数据库实例产生分布式事务。
3.多服务访问同一数据库实例
比如订单微服务和库存微服务即使访问同一数据库也会产生分布式事务,原因就是跨JVM进程,两个微服务持有了不同的数据库链接进行数据库操作,此时产生分布式事务。
分布式基础理论CAP
CAP分别是consistency、Availability、Partiton tolerance三个词语的缩写,分别表示一致性、可用性、分区容忍性。
结合电商系统中业务长江来理解:
整体执行流程如下:
1.商品服务请求主数据库写入商品信息(添加、修改、删除商品)
2.主数据库向商品服务响应写入成功
3.商品服务请求从数据库读取商品信息
consistency:一致性是指写操作后的读操作可以读取到最新的数据状态,当数据分布在多个节点上,从任意节点读取到数据都是最新的。
上图中,商品信息的读写要满足一致性就要实现如下目标:
1.商品服务写入主数据库成功,则向从数据库查询新数据也成功。
2.商品服务写入主数据库失败,则向从数据库查询新数据也失败。
如何实现一致性?
1.写入主数据库后要将数据同步到从数据库。
2.写入到主数据库后,在向从数据库同步期间要将从数据库锁定,待同步完成后再释放锁,以免在新数据写入成功后,向从数据库查询到旧的数据。
分布式系统一致性的特点:
1.由于数据存在同步的过程,写操作的响应有一定的延迟。
2.为了保证数据一致性,会对资源暂时锁定,待数据同步完成释放锁定资源。
Availability:可用性是指任何事物操作都可以得到响应结果,且不会出现响应超时或响应错误。
上图中,商品信息读取满足可用性,就需要实现如下目标:
1. 从数据库收到查询的请求,则立即能够响应查询结果
2.从数据库不允许出现响应超时或响应错误
如何实现可用性?
1.写入到主数据库后要将数据同步到从数据库
2.由于要保证从数据库的可用性,不可将从数据库中资源进行锁定
3.即使数据还没有同步过来,从数据库也要返回要查询的数据,哪怕是旧数据,如果连旧数据也没有,则可以按照约定返回一个默认的信息,但不能返回错误或响应超时
分布式系统可用性的特点:所有请求都有响应,且不会出现响应超时或响应错误
Partiton tolerance:通常分布式系统的各个节点部署在不同子网,这就是网络分区,不可避免的会出现由于网络问题而导致节点之间通信失败,此时仍可对外提供服务,这叫分区容忍性。
上图中,商品信息读写满足分区容忍性就需要满足如下目标:
1.主数据库向从数据库同步数据失败,不影响读写操作
2.其中一个节点挂掉不影响其它节点提供服务
如何实现分区容忍性?
1.尽量使用异步取代同步操作,例如使用异步方式将数据从主数据库同步到从数据库,这样节点之间能够有效的实现松耦合。
2.添加从数据库节点,其中一个从节点挂掉,其他节点提供服务
分布式分区容忍性的特点:分区容忍性是分布式系统具备的基本能力