分布式系统数据一致性：6种解决方案解析

164 浏览量更新于2024-08-28 收藏 494KB PDF 举报

"保证分布式系统数据一致性的6种方案" 在分布式系统中，数据一致性是一个至关重要的问题，尤其是在电商等业务场景中。由于系统通常由多个独立服务组成，如何确保在分布式调用时数据的一致性成为了一大挑战。本文探讨了6种保证数据一致性的解决方案，针对业务操作必须同时成功或失败的需求，例如调用服务A、B、C的情况。首先，我们需要理解数据一致性的一些基本概念。根据CAP理论，分布式系统只能在一致性、可用性和分区容错性三者中选择两者的平衡。强一致性意味着所有后续访问都会返回最新的更新值，但实现起来会牺牲可用性。弱一致性则不保证立即读取到最新值，而最终一致性是弱一致性的一种形式，保证在一段时间后返回上一次更新的值。以下是6种保证分布式系统数据一致性的方案： 1. **规避分布式事务——业务整合** 这种方法是将原本分散的业务接口整合到一个服务中，通过本地事务来处理。例如，创建一个新的服务D，它包含服务A、B、C的功能，然后在服务D内部进行事务管理。虽然这种方法可以避免分布式事务，但它可能导致业务模块的耦合，增加维护难度，因此不推荐使用。 2. **经典方案-eBay模式** eBay模式依赖于消息日志，将需要分布式处理的任务转化为异步操作。消息被记录在日志中，可以是文本、数据库或消息队列，然后通过幂等性设计保证重试的安全性。人工重试在支付场景中尤为常见，通过对账系统处理事后问题。这种方案的关键在于确保服务接口的幂等性，即多次执行同一个请求应产生相同的结果。 3. **两阶段提交(2PC)** 2PC是一种协调所有参与者在事务开始时锁定资源，然后在所有参与者都准备提交时统一提交或回滚的协议。但是，2PC存在性能瓶颈和单点故障问题，可能导致系统可用性下降。 4. **补偿事务(TCC，Try-Confirm-Cancel)** TCC将每个操作分为尝试、确认和取消三个阶段。在尝试阶段，各服务执行可逆操作，只有在所有服务都成功尝试后才进入确认阶段，否则执行取消操作。这种方式降低了对全局锁的依赖，提高了系统的可用性。 5. **Saga** Saga是一种长事务的解决方案，它将一个长事务分解为一系列短事务，每个短事务都可以单独提交或回滚。如果某次操作失败，Saga会通过回滚操作来恢复一致性状态。 6. **分布式版本控制系统(如Git)** 在某些场景下，可以借鉴分布式版本控制的思想，通过版本号和冲突检测机制来保证数据一致性。每次更新都会产生新的版本，当有冲突时，系统会提示并要求用户解决冲突。在实际应用中，选择哪种方案取决于业务需求、系统架构以及对一致性和可用性的优先级。通常，互联网系统更倾向于牺牲强一致性以保证可用性，采用最终一致性策略，并结合幂等性设计来确保数据在一段时间后达到一致。而对于支付、库存等对数据实时性要求高的领域，可能需要采用更严格的强一致性解决方案。

保证分布式系统数据一致性的保证分布式系统数据一致性的6种方案种方案

问题的起源

在电商等业务中，系统一般由多个独立的服务组成，如何解决分布式调用时候数据的一致性？

具体业务场景如下，比如一个业务操作，如果同时调用服务 A、B、C，需要满足要么同时成功；要么同时失败。A、B、C 可

能是多个不同部门开发、部署在不同服务器上的远程服务。

在分布式系统来说，如果不想牺牲一致性，CAP 理论告诉我们只能放弃可用性，这显然不能接受。为了便于讨论问题，先简

单介绍下数据一致性的基础理论。

强一致

当更新操作完成之后，任何多个后续进程或者线程的访问都会返回最新的更新过的值。这种是对用户最友好的，就是用户上一

次写什么，下一次就保证能读到什么。根据 CAP 理论，这种实现需要牺牲可用性。

弱一致性

系统并不保证续进程或者线程的访问都会返回最新的更新过的值。系统在数据写入成功之后，不承诺立即可以读到最新写入的

值，也不会具体的承诺多久之后可以读到。

最终一致性

弱一致性的特定形式。系统保证在没有后续更新的前提下，系统最终返回上一次更新操作的值。在没有故障发生的前提下，不

一致窗口的时间主要受通信延迟，系统负载和复制副本的个数影响。DNS 是一个典型的最终一致性系统。

在工程实践上，为了保障系统的可用性，互联网系统大多将强一致性需求转换成最终一致性的需求，并通过系统执行幂等性的

保证，保证数据的最终一致性。但在电商等场景中，对于数据一致性的解决方法和常见的互联网系统（如 MySQL 主从同步）

又有一定区别，群友的讨论分成以下 6 种解决方案。

1. 规避分布式事务——业务整合

业务整合方案主要采用将接口整合到本地执行的方法。拿问题场景来说，则可以将服务 A、B、C 整合为一个服务 D 给业务，

这个服务 D 再通过转换为本地事务的方式，比如服务 D 包含本地服务和服务 E，而服务 E 是本地服务 A ~ C 的整合。

优点：解决（规避）了分布式事务。

缺点：显而易见，把本来规划拆分好的业务，又耦合到了一起，业务职责不清晰，不利于维护。

由于这个方法存在明显缺点，通常不建议使用。

2. 经典方案 - eBay 模式

此方案的核心是将需要分布式处理的任务通过消息日志的方式来异步执行。消息日志可以存储到本地文本、数据库或消息队

列，再通过业务规则自动或人工发起重试。人工重试更多的是应用于支付场景，通过对账系统对事后问题的处理。

消息日志方案的核心是保证服务接口的幂等性。

考虑到网络通讯失败、数据丢包等原因，如果接口不能保证幂等性，数据的唯一性将很难保证。

eBay 方式的主要思路如下。

Base：一种 Acid 的替代方案

此方案是 eBay 的架构师 Dan Pritchett 在 2008 年发表给 ACM 的文章，是一篇解释 BASE 原则，或者说最终一致性的经典文

章。文中讨论了 BASE 与 ACID 原则在保证数据一致性的基本差异。

如果 ACID 为分区的数据库提供一致性的选择，那么如何实现可用性呢？答案是

BASE (basically available, soft state, eventually consistent)

BASE 的可用性是通过支持局部故障而不是系统全局故障来实现的。下面是一个简单的例子：如果将用户分区在 5 个数据库服

务器上，BASE 设计鼓励类似的处理方式，一个用户数据库的故障只影响这台特定主机那 20% 的用户。这里不涉及任何魔

法，不过它确实可以带来更高的可感知的系统可用性。

文章中描述了一个最常见的场景，如果产生了一笔交易，需要在交易表增加记录，同时还要修改用户表的金额。这两个表属于

不同的远程服务，所以就涉及到分布式事务一致性的问题。

下载后可阅读完整内容，剩余6页未读，立即下载

weixin_38714653

粉丝: 3

分布式系统数据一致性：6种解决方案解析

连续调用多个外部系统写接口保证数据一致性的思路

分布式系统数据一致性解决方案探索

保证分布式一致性6种方案

分布式系统：数据一致性解决方案.docx

分布式系统数据一致性介绍.docx

分布式系统中一致性协议优化方案与研究

分布式系统事务一致性解决方案大对比

基于消息队列的分布式系统数据一致性方法研究.pdf

分布式系统一致性问题解决方案

分布式系统数据复制一致性.pptx

最新资源