分布式系统的CAP和BASE理论 1. 背景 2. CAP 3. BASE

网络分区:俗称“脑裂”。当网络发生异常情况,导致分布式系统中部分节点之间的网络延时不断变大,最终导致组成分布式系统的所有节点中,只有部分节点之间能够进行正常通信,而另一些节点则不能。

当网络分区出现时,分布式系统会出现局部小集群。

2. CAP

CAP理论指的是在一个分布式系统中,不可能同时满足Consistency(一致性)、Availablity(可用性)、Partition tolerance(分区容错性)这三个基本需求,最多只能满足其中的两项。

2.1 一致性(C)

数据在多个副本之间是否能够保持一致的特性。当执行数据更新操作后,仍然可保证数据处于一致的状态。

2.2 可用性(A)

系统提供的服务必须一直处于可用的状态。对于用户的每一个操作情况总是能够在有限的时间内返回结果。这个有限时间是系统设计之初就指定好的系统运行指标。返回的结果指的是系统返回用户的一个正常响应结果,而不是系统错误信息。

2.3 分区容错性(P)

分布式系统在遇到任何网络分区故障的时候,仍然需要能够保证对外提供满足一致性和可用性的服务,除非是整个网络环境都发生了故障。

组成分布式系统的每个节点的加入与退出都可以看成是一个特殊的网络分区。

注:一个分布式系统无法同时满足这三个条件,只能满足两个,意味着我们要抛弃其中一项。

(1)CA,放弃P:将所有数据都放在一个分布式节点上,这同时放弃了系统的可扩展性。

(2)CP,放弃A:一旦系统遇到故障,受影响的服务器需要等待一段时间,在恢复期间无法对外提供正常的服务。

(3)AP,放弃C:这里的放弃一致性是指放弃数据强一致性,而保留数据的最终一致性。系统无法实时保持数据的一致性,但承诺在一个限定的时间内,数据最终能够达到一致的状态。

对于分布式系统而言,分区容错性是一个最基本的要求,因为分布式系统中的组件必然需要部署到不同的节点 ,必然会出现子网络,在分布式系统中,网络问题是必定会出现的异常。

因此分布式系统只能在一致性(C)和可用性(A)之间进行权衡。

3. BASE

BASE理论是指,Basically Available(基本可用),Soft-state(软状态),Eventual Consistency(最终一致性)。是基于CAP定理演化而来,是对CAP中一致性和可用性权衡的结果。

核心思想:即使无法做到强一致性,但每个业务根据自身的特点,采用适当的方式来使系统达到最终一致性。

3.1 基本可用

指分布式系统在出现故障的时候,允许损失部分可用性,保证核心可用。但不等价于不可用。

3.2 软状态

软状态是指允许系统存在中间状态,并且该中间状态不会影响系统整体可用性。即允许系统在不同节点间副本同步的时候存在延时。

3.3 最终一致性

系统中的所有数据副本经过一定时间后,最终能够达到一致的状态,不需要实时保证系统数据的强一致性。最终一致性是弱一致性的一种特殊情况。

BASE理论面向的是大型高可用可扩展的分布式系统,通过牺牲强一致性来获得可用性。

ACID是传统数据库常用的概念设计,追求强一致性模型。ACID,指数据库事务正确执行的四个基本要素的:原子性(Atomicty)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)