摘录分布式系统——CAP理论及BASE理论

在介绍一致性协议之前，我们可以先来了解一下分布式系统，原来我们在学校的时候练习项目肯定都是集中式部署，比如一个Tomcat就解决了，包括现在很多小型项目也是这样的，如下：
在这里插入图片描述

但是随着对服务性能要求的提供，或者为了避免单点故障等问题，集中式部署可能就满足不了我们的需求了，这时一个硬件或软件组件分布在不同的网络计算机上，它们彼此之间仅仅通过消息传递进行通信和协调的系统，这就是是分布式系统。
在这里插入图片描述

其特点如下：

分布性
对等性
并发性
缺乏全局时钟
故障随时发生
分布性
既然是分布式系统，最显著的特点肯定就是分布性，从简单来看，假设一个项目较为庞大，我们可以将整个项目会分成不同的功能，专业点就不同的微服务，比如用户微服务，产品微服务，订单微服务，这些服务部署在不同的Tomcat中，不同的服务器中，甚至不同的集群中，整个架构都是分布在不同的地方的，在空间上是随意的，而且随时会增加，删除服务器节点等。

对等性
对等性是分布式设计的一个目标，要完成一个分布式的系统架构，肯定不是简单的把一个大的单一系统拆分成一个个微服务，然后部署在不同的服务器集群就够了，其中拆分完成的每一个微服务都有可能发现问题，而导致整个项目出现问题。

比如订单服务，为了防止订单服务出现问题，一般情况需要有一个备份，在订单服务出现问题的时候能顶替原来的订单服务，也就是我们上述所说，为了避免单点故障。

这就要求这两个（或者2个以上）订单服务完全是对等的，功能完全是一致的，其实这就是一种服务副本的冗余。
还一种是数据副本的冗余，比如数据库，缓存等，都和上面说的订单服务一样，为了安全考虑需要有完全一样的备份存在，这就是对等性的意思。

并发性
并发性其实对我们来说并不陌生，在学习并发编程时，多线程是并发的基础。但现在我们要接触的不是多线程的角度，因为我们在介绍并发编码的时候，都是在同一台机器，同一个JVM的角度上出发，这里我们可能从多JVM的角度，例如在一个分布式系统中的多个节点，可能会并发地操作一些共享资源等问题，这就涉及到分布式锁的问题了。

缺乏全局时钟
在分布式系统中，节点是可能放在任意位置的，而每个位置，每个节点都有自己的时间系统，因此在分布式系统中，很难定义两个事务纠结谁先谁后，原因就是因为缺乏一个全局的时钟序列进行控制，当然我们可以是系统调用时间服务器进行解决该问题。

故障随时会发生
任何一个节点都可能出现停电、死机等现象，服务器集群越多，出现故障的可能性就越大，随着集群数目的增加，出现故障甚至都会成为一种常态。

上述我们简单介绍了一下分布式系统的特性，那么我们实际的分布式系统会带来哪些简单的问题呢？主要有：通信异常、网络分区、三态、节点故障

通信异常
通讯异常其实就是网络异常，网络系统本身是不可靠的，由于分布式系统需要通过网络进行数据传输，网络光纤，路由器等硬件难免出现问题。只要网络出现问题，也就会影响消息的发送与接受过程，因此数据消息的丢失或者延长就会变得非常普遍。

网络分区
网络分区，其实就是脑裂现象，本来有一个Leader，来管理整个系统的协调情况，一切井然有序，突然出现了网络问题，某些节点接受不到Leader的指令，可能在这种情况下，又会出现一个新的Leader来协调系统。但原来的Leader其实还在，并没有死机，只是网络系统暂时中断了，这时候就会出现问题了，在同一个系统中有不同Leader在协调，这样必然会引起这个系统的混乱。

这种由于种种问题导致同一个区域（分布式集群）有两个相互冲突的负责人的时候就会出现这种精神分裂的情况，在这里称为脑裂，也叫网络分区。

三态
三态是什么？三态其实就是成功，与失败以外的第三种状态，叫超时态。在一个JVM中，应用程序调用一个方法函数后会得到一个明确的相应，要么成功，要么失败，而在分布式系统中，虽然绝大多数情况下能够接受到成功或者失败的相应，但一旦网络出现异常，就非常有可能出现超时，当出现这样的超时现象，网络通讯的发起方，是无法确定请求是否成功处理的。

节点故障
这个其实在特性中就介绍过了，节点故障在分布式系统下是比较常见的问题，指的是组成服务器集群的节点会出现的宕机或“僵死”的现象，这种现象经常会发生。

CAP理论
好了，了解了上述的问题后，那我们该如何解决呢？首先我们一般可能从三个角度来解决上述的问题，就是我们的CAP理论，CAP其实就是 Consistency(一致性)，Availability(可用性)，Partition tolerance(分区容错性)

一致性
一致性是事务ACID的一个特性【原子性（Atomicity）、一致性（Consistency）、隔离性（Isolation）、持久性（Durability）】，在介绍MySQL的时候就曾详细介绍过，这里的一致性基本类似，只是现在考虑的是分布式环境中，那么就可能不是单一的数据库了。

在分布式系统中，一致性是数据在多个副本之间是否能够保证一致的特性，这里说的一致性和前面说的对等性其实差不多。如果能够在分布式系统中针对某一个数据项的变更成功执行后，所有用户都可以马上读取到最新的值，那么这样的系统就被认为具有强一致性

可用性
可用性指系统提供服务必须一直处于可用状态，对于用户的操作请求总是能够在有限的时间内访问结果。为了做到有限的时间可能需要用到缓存，可能需要用到负载，这个时候服务器增加的节点是为性能考虑；为了可能返回结果，需要考虑服务器主备，当主节点出现问题的时候需要备份的节点能最快的顶替上来，避免单点故障等问题。

分区容错性
分布式系统在遇到任何网络分区故障的时候，仍然需要能够对外提供满足一致性和可用性的服务，除非是整个网络环境都发生了故障。

BASE理论
那我们在一个分布式的系统中可以同时满足上述CAP理论的三个要求么，不好意思，是不可能的，最多只可能满足其中的两个要求，所以我们就必须对其有一定的取舍，如下：

取舍	描述
放弃P	(满足AC) 将数据和服务都放在一个节点上，避免因网络引起的负面影响，充分保证系统的可用性和一致性但放弃P意味着放弃了系统的可扩展性
放弃A	(满足PC) 当节点故障或者网络故障时，受到影响的服务需要等待一定的时间因此在等待时间里，系统无法对外提供正常服务，因此是不可用的
放弃C	(满足PA) 系统无法保证数据的实时一致性，但是承诺数据最终会保证一致性因此存在数据不一致的窗口期，至于窗口期的长短取决于系统的设计

但是我们发现，既然我们是一个分布式系统，如果放弃了P，那么不是又回来单节点了嘛，所以我们就是在放弃A或C之间考虑，但是又不能完全放弃，所以我们只能根据业务的需求，尽可能的取出一定的取舍，所以就来了我们的BASE理论

Basically Avaliable基本可用
当分布式系统出现不可预见的故障时，允许损失部分可用性，保障系统的“基本可用”；体现在“时间上的损失”和“功能上的损失”。比如：部分用户双十一高峰期淘宝页面卡顿或降级处理。

Soft state软状态
允许系统中的数据存在中间状态，既系统的不同节点的数据副本之间的数据同步过程存在延时，并认为这种延时不会影响系统可用性。比如：春节12306网站放票时，请求可能会进入排队队列。

Eventually consistent最终一致性
所有的数据在经过一段时间的数据同步后，最终能够达到一个一致的状态。比如在银行APP上转账等操作金额暂时不一致\

原文转载地址
https://blog.csdn.net/newbie0107/article/details/104976355
如果侵权请联系，立刻删除

摘录分布式系统——CAP理论及BASE理论

猜你喜欢