分佈式系統一致性保障方案總結

編程語言 Java 百度錢包騰訊TM 穩穩地幸福y 穩穩地幸福y 2017-10-02

引言

在互聯網系統中，理想的情況下，肯定是希望系統能夠同時滿足“一致性”、“可用性”和“分區容忍性”。但是基於熟悉的CAP定律也好，還是BASE理論，我們知道，在實際情況中是不可能實現的。而在金融領域，一致性是最為關注的特性，任何情況下都必須滿足一致性。關於CAP定律和BASE理論，本文不再介紹，有興趣的同學可以自行百度一下。本文重點來闡述下關於一致性的方案，包括強一致性和最終一致性。而在互聯網領域，很多情況下都是犧牲強一致性，來達到高可用性，系統往往只需要保證“最終一致性”，只要這個最終時間是在用戶可以接受的範圍內即可。

數據庫本地事務

數據庫事務肯定是強一致性的方案，而且是一致性最簡單的方案，因為一致性是數據庫的事務來保證的，業務層不需要關心細節。比較典型的應用是在返現場景下，針對帶有返現的交易的退款，需要一次性退兩筆交易單，採用的就是通過數據庫本地事務來完成的。具體如下：

分佈式系統一致性保障方案總結

用戶A花了100元購買商戶B的商品，購買結束後返現給用戶A 2元。這是兩筆交易，原始交易是100元，返現交易是2元。那麼發生退款時，需要保證兩筆交易同時都退款。這個就是直接採用數據庫本地事務實現的，即一次退款請求，兩筆交易同時退款。

總結： 數據庫事務的優點是簡單，業務層關心的很少。但是對於一個可用性很高的系統來說，所有的業務都揉在數據庫事務執行，會讓事務非常的複雜，不利於系統的擴展和維護。

兩階段提交

除了數據庫能夠保證本地的一致性，對於互聯網系統來說，更多是分佈式系統。提到分佈式系統，必然提到分佈式事務。而分佈式事務中，就不得不介紹兩階段提交協議(2pc)。而在核心繫統，兩階段提交的方案主要應用在分佈式數據庫NesioDB和交易賬務分離的柔性事務中。

分佈式數據庫NesioDB是由百度DBA和百度錢包聯合開發的，支持分佈式事務的數據庫，目前已經應用在百度錢包的核心交易業務上，並穩定運行兩年。該數據庫的設計要求是讓使用者能夠像使用單機數據庫一樣的使用分佈式數據庫，因此實現的分佈式事務，滿足單機事務的ACID原則。關於分佈式事務的一致性，採用的就是兩階段提交的方式來實現的，並且滿足分佈式事務模型。如下圖所示。

第一階段是準備階段。

分佈式系統一致性保障方案總結

DTM 通知所有參與事務的各個 RM，給每個 RM 發送 prepare 消息。RM 接收到消息後進入準備階段後，要麼直接返回失敗，要麼創建並執行本地事務，寫本地事務日誌（redo 和 undo 日誌），但是不提交（此處只保留最後一步耗時最少的提交操作給第二階段執行）。

第二階段是提交/回滾階段。

分佈式系統一致性保障方案總結

DTM 收到 RM 準備階段的失敗消息或者獲取 RM 返回消息超時，則直接給 RM 發送回滾（rollback）消息，否則發送提交（commit）消息。RM 根據 TM 的指令執行提交或者回滾，執行完成後釋放所有事務處理過程中使用的鎖（最後階段釋放鎖）。

數據庫層面的兩階段提交，可以用來保證分佈式事務的一致性，使得使用者使用分佈式事務和單機事務一樣方便。而兩階段提交的另外一種實現，即TCC(Try-Confirm-Cancel)，也就是業務層面的柔性事務。交易和賬務分離的一致性實現，就是採用這種柔性事務來完成的。首先來說說柔性事務，它涉及 3 個模塊，主業務、從業務和活動管理器（協作者）。

下面這張圖是有關柔性事務一張經典的圖。

分佈式系統一致性保障方案總結

第一階段：主業務服務分別調用所有從業務服務的 try 操作，並在活動管理器中記錄所有從業務服務。當所有從業務服務 try 成功或者某個從業務服務 try 失敗時，進入第二階段。

第二階段：活動管理器根據第一階段從業務服務的 try 結果來執行 confirm 或 cancel 操作。如果第一階段所有從業務服務都 try 成功，則協作者調用所有從業務服務的 confirm 操作，否則，調用所有從業務服務的 cancel 操作。

在第二階段中，confirm 和 cancel 同樣存在失敗情況，所以需要對這兩種情況做異常處理以保證數據一致性。

1. Confirm 失敗：則回滾所有 confirm 操作並執行 cancel 操作。

2. Cancel 失敗：從業務服務需要提供自動 cancel 機制，以保證 cancel 成功。

如果對應到交易和賬務分離的項目中，流程如下：

第一階段：主業務服務調用交易和賬務執行try的操作，交易開啟事務，做業務上的判斷和寫入，但是不提交事務。賬務層面做資源的鎖定。

第二階段：賬務資源鎖定成功，交易提交事務成功，然後發送confirm 給賬務。如果交易提交失敗，則發送cancel對資源進行釋放。如果在confirm或者cancel出現異常情況下，同樣需要對異常進行處理來保證數據一致性。

總結：這種方式實現難度不算太高，比較適合傳統的單體應用，在同一個方法中存在跨庫操作的情況。

回滾機制

在分佈式架構中，功能 X，需要去協調後端的 A、B 甚至更多的原子服務。那麼問題來了，假如 A 和 B 其中一個調用失敗了，那可怎麼辦呢？這個時候，可以用回滾機制來保證一致性。該機制應用在錢包配合信貸做的聯合放貸項目中。該項目中總共有兩個原子操作，如下圖所示。

分佈式系統一致性保障方案總結

兩個原子操作，分別是資金歸集和資金到卡。所謂資金歸集，是將商戶A的錢和商戶B的錢歸集到中間商戶C。而資金到卡，是將中間商戶C的錢，通過銀行系統打入到D用戶的銀行卡。這兩個操作要滿足一致性，即資金歸集成功，然後打款到用戶的卡成功。或者是商戶A和B的錢沒變化，資金到卡失敗。總而言之，是不允許資金停留在中間商戶C的。

針對這種情況，通過回滾機制，提供一個強大的回滾操作來實現上述的一致性。比如資金歸集成功，而資金到卡失敗，那麼對歸集的資金操作做回滾處理，也就是資金從中間商戶C分別回到商戶A和B中。

總結：這種方式缺點比較多，通常在複雜場景下是不推薦使用的，除非是非常簡單的場景，非常容易提供回滾，而且依賴的服務也非常少的情況。這種實現方式會造成代碼量龐大，耦合性高。而且非常有侷限性，因為有很多的業務是無法很簡單的實現回滾的，如果串行的服務很多，回滾的成本實在太高。

本地消息表

這種實現方式的思路，其實是源於 ebay，後來通過支付寶等公司的佈道，在業內廣泛使用。其基本的設計思想是將遠程分佈式事務拆分成一系列的本地事務。如果不考慮性能及設計優雅，藉助關係型數據庫中的表即可實現。本地消息的方式，在應用在錢包非核心業務異步化改造項目中。該項目當時改造的方案如下：

1. 核心業務實時寫入交易表

2. 非核心業務非實時異步寫入交易表按照用戶維度的交易查詢表。

交易表是交易維度的，而為了滿足用戶的查詢性能，需要備份複製相同的按照用戶維度的交易查詢表。從業務屬性上來看，交易表是核心業務，交易查詢表是非核心業務(查詢使用)。而實現上，交易表是核心數據庫，而查詢表則屬於非核心數據庫。但是，這兩者需要滿足一致性。關於這類一致性保障，如果有不丟消息的消息隊列，則很容易解決。萬一沒有這類消息隊列呢？其實，使用本地消息表，也一樣可以解決。

分佈式系統一致性保障方案總結