JAVA互聯網架構分庫分表分佈式下如何實現ID全局唯一性

編程語言 Java 信息安全 MySQL Java耕耘者 Java耕耘者 2017-11-03

分庫分表：

跨庫的問題

分佈式事務問題

查詢數據結果集合並

全局唯一性ID保證

要求：

1、全局唯一性：不能出現重複的id號（基本的要求）。

2、信息安全：防止惡意用戶規矩id的規則來獲取數據。混淆效果

3、數據遞增：保證我下一個ID一定大於上一個ID。

當前201709122030 下一個：201709122031 下一個：201709122032

互斥關係：信息安全、數據遞增規律

CREATE TABLE `tl_id` (

`id` varchar(255) NOT NULL,

PRIMARY KEY (`id`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

業界分案：

UUID:

通用唯一識別碼 16個字節128位的長數字、

組成部分：當前日期和時間序列+全局的唯一性網卡mac地址

執行任務數：10000

------------------------

所有線程共耗時：38.305 s

併發執行完耗時：449.0 ms

單任務平均耗時：3.8305 ms

單線程最小耗時：0.0 ms

單線程最大耗時：193.0 ms

總結：

優點	缺點
代碼實現簡單、不佔用寬帶、數據遷移不受影響	無序、無法保證趨勢遞增（要求3）字符存儲、傳輸、查詢慢、不可讀

Snowflake雪花算法

國外的twitter分佈式下iD生成算法

1bit+41bit+10bit+10+bit=62bit

高位隨機+毫秒數+機器碼（數據中心+機器id）+10的流水號

國內：

保證數據的唯一性就行了 IDC機房。總結：

優點	缺點
代碼實現簡單、不佔用寬帶、數據遷移不受影響、低位趨勢遞增	強以來時鐘（多臺服務器時間一定要一樣）、無序無法保證趨勢遞增（要求3）

水平切分方式

範圍法
哈希法

水平切分後碰到的問題

通過uid屬性查詢能直接定位到庫，通過非uid屬性查詢不能定位到庫。

非uid屬性查詢的典型業務

用戶側，前臺訪問，單條記錄的查詢，訪問量較大，服務需要高可用，並且對一致性的要求較高。
運營側，後臺訪問，根據產品、運營需求，訪問模式各異，基本上是批量分頁的查詢，由於是內部系統，訪問量很低，對可用性的要求不高，對一致性的要求也沒這麼嚴格。

用戶側與運營側架構設計思路

針對用戶側，應該採用“建立非uid屬性到uid的映射關係”的架構方案。
針對運營側，應該採用“前臺與後臺分離”的架構方案。

用戶前臺側，“建立非uid屬性到uid的映射關係”最佳實踐

索引表法：數據庫中記錄login_name->uid的映射關係。
緩存映射法：緩存中記錄login_name->uid的映射關係。
login_name生成uid。
login_name基因融入uid。

運營後臺側，“前臺與後臺分離”最佳實踐

前臺、後臺系統web/service/db分離解耦，避免後臺低效查詢引發前臺查詢抖動。
可以採用數據冗餘的設計方式。
可以採用“外置索引”（例如ES搜索系統）或者“大數據處理”（例如HIVE）來滿足後臺變態的查詢需求。

“1對多”類業務，在架構上，採用元數據與索引數據分離的架構設計方法

帖子服務，元數據滿足uid和tid的查詢需求。
搜索服務，索引數據滿足複雜搜索尋求。

對於元數據的存儲，在數據量較大的情況下，有三種常見的切分方法：

tid切分法，按照tid分庫，同一個用戶發佈的帖子落在不同的庫上，通過 - uid來查詢要遍歷所有庫。
uid切分法，按照uid分庫，同一個用戶發佈的帖子落在同一個庫上，需要通過索引表或者緩存來記錄tid與uid的映射關係，通過tid來查詢時，先查到uid，再通過uid定位庫。
基因法，按照uid分庫，在生成tid里加入uid上的分庫基因，保證通過uid和tid都能直接定位到庫。

在數據庫架構設計過程中，除了水平切分，至少還會遇到這樣一些問題：

可用性：不管是主庫實例，還是從庫實例，如果數據庫實例掛了，如何不影響數據的讀和寫。
讀性能：互聯網業務大多是讀多寫少的業務，如果提升數據庫的讀性能是架構設計中必須考慮的問題。
一致性：數據一旦冗餘，就可能出現一致性問題，如何解決主庫與從庫之間的不一致，如何解決數據庫與緩存之間的不一致，也是需要重點設計的。
擴展性：如何在不停服務的情況下擴充數據表的屬性，實施數據遷移，實施存儲引擎的切換，架構設計上都是十分有講究的。
分佈式SQL語句：單庫情況下，所有SQL語句的執行都沒問題問題，一旦實施了水平切分，如何實現SQL的集函數，分頁，非patition key上的查詢都成了大問題。

Mysql:

JAVA互聯網架構分庫分表分佈式下如何實現ID全局唯一性

奇數跟我們偶數遞增步長2

適合小型互聯網公司、比如可以知道我們一定生成的ID數量五萬的訂單量

一年1千8百萬

Mysql一張表500萬

如果公司每天訂單量5萬的數據我們用mysql設置步長位100的話可以用27年

只能為100庫公司來到風投了每天的訂單量50萬100萬的時候

總結：

優點	缺點
代碼實現方便、性能不錯、數字排序、可讀性很強	受限數據庫、擴展麻煩、插入數據庫才能拿到ID、單點故障的問題

主從同步的時候：電商下單->支付 insert master db select 數據因為數據同步延遲導致查不到這個數據。加cache（不是最好的解決方式）數據要求比較嚴謹的話查master主庫。

CREATE TABLE `tl_num` (

`id` bigint(11) NOT NULL AUTO_INCREMENT,

KEY (`id`) USING BTREE

) ENGINE=InnoDB auto_increment=1 DEFAULT CHARSET=utf8;

Redis:

JAVA互聯網架構分庫分表分佈式下如何實現ID全局唯一性

執行任務數：10000

------------------------

所有線程共耗時：136.587 s

併發執行完耗時：1.515 s

單任務平均耗時：13.6587 ms

單線程最小耗時：1.0 ms

單線程最大耗時：254.0 ms

總結：

優點	缺點
不依賴數據、靈活方便、性能優於數據庫的、沒有單點故障（高可用）	需要佔用網絡資源、性能要比本地生成慢、需要增加插件

相關推薦

'可以永不遷移數據、避免熱點，分庫分表就該這樣玩'

"中大型項目中，一旦遇到數據量比較大，小夥伴應該都知道就應該對數據進行拆分了。有垂直和水平兩種。垂直拆分比較簡單，也就是本來一個數據庫，數據量大之後，從業務角度進行拆分多個庫。如下圖，獨立的拆分出訂單庫和用戶庫。水平拆分的概念，是同一個業務數據量大之後，進行水平拆分。上圖中...

數據庫設計 MySQL 算法 2019-09-08

'分庫分表這樣做，永不遷移數據且避免熱點'

"一、前言中大型項目中，一旦遇到數據量比較大，小夥伴應該都知道就應該對數據進行拆分了。有垂直和水平兩種。垂直拆分比較簡單，也就是本來一個數據庫，數據量大之後，從業務角度進行拆分多個庫。如下圖，獨立的拆分出訂單庫和用戶庫。水平拆分的概念，是同一個業務數據量大之後，進行水平拆分...

數據庫設計 MySQL 算法 2019-09-04

'分佈式全局ID生成方案'

"來源：公眾號JaJian 作者：JaJian傳統的單體架構的時候，我們基本是單庫然後業務單表的結構。每個業務表的ID一般我們都是從1增，通過 AUTO_INCREMENT=1設置自增起始值，但是在分佈式服務架構模式下分庫分表的設計，使得多個庫或多個表存儲相同的業務數據。這...

MySQL 數據庫 Mac電腦算法 Java 設計 2019-08-28

'架構－基於MySQL數據庫下億級數據的分庫分表'

"移動互聯網時代，海量的用戶數據每天都在產生，基於用戶使用數據等這樣的分析，都需要依靠數據統計和分析，當數據量小時，數據庫方面的優化顯得不太重要，一旦數據量越來越大，系統響應會變慢，TPS直線下降，直至服務不可用。可能有人會問，為何不用Oracle呢？確實，很多開發者寫代碼...

MySQL 數據庫 SQL 移動互聯網 DBA 銀行 NoSQL NewSql 設計 2019-08-22

'百度美團Java開發如何在高併發分佈式下生成全局ID生成策略'

"傳統的單體架構的時候，我們基本是單庫然後業務單表的結構。每個業務表的ID一般我們都是從1增，通過AUTO_INCREMENT=1設置自增起始值，但是在分佈式服務架構模式下分庫分表的設計，使得多個庫或多個表存儲相同的業務數據。這種情況根據數據庫的自增ID就會產生相同ID的情...

Java 數據庫 Mac電腦算法 MySQL 美團網百度設計 2019-08-18

'梯度下降法求多元線性迴歸及Java實現｜乾貨分享'

"鑑於本篇文章有大量乾貨內容，建議大家先收藏再觀看，看到一半也不要退出，文末有驚喜哦。給大家分享一張可愛的圖片活躍一下心情就開始這篇文章吧。對於數據分析而言，我們總是極力找數學模型來描述數據發生的規律，有的數據我們在二維空間就可以描述，有的數據則需要映射到更高維的空間。數...

Java 機器學習數學文章電腦 2019-08-16

'Java互聯網架構-百億級系統架構實時查詢優化實戰'

"歡迎關注頭條號：java小馬哥週一至週日下午三點半！精品技術文章準時送上！！！精品學習資料獲取通道，參見文末最近的一個項目是風控過程數據實時統計分析和聚合的一個 OLAP 分析監控平臺，日流量峰值在 10 到 12 億上下，每年數據約 4000 億條，佔用空間大概 200...

Java ElasticSearch 數據庫中央處理器技術 2019-08-08

'如何正確 Get 分庫分表？'

"作者 | 菜菜責編 | 郭芮YY妹：菜哥，領導讓我開發新系統了。菜菜：這麼說領導對你還是挺信任的呀。YY妹：必須的，為了設計好這個新系統，數據庫設計我花了好多心思。菜菜：做一個系統我覺得不應該從數據庫入手，應該從設計業務模型開始，先不說這個，說說你的數據庫設計的優勢。YY...

數據庫設計 Microsoft SQL Server SQL 歡聚時代程序員大數據 MySQL 人生第一份工作物理 2019-07-30

'Linux下如何實現MySQL數據庫每天定時自動備份'

"本文出自頭條號老王談運維，轉載請說明出處。在雲計算的浪潮下，企業多將業務部署在雲上。對於數據庫中的數據，直接使用雲數據庫自帶的備份功能實現備份，操作簡單。但是雲數據庫備份數據的存儲空間有限制，一旦超出存儲量便自動關閉備份功能，運維人員往往也會忽略這個問題，如果這時遭遇系統...

數據庫 MySQL Linux 腳本語言 Bash 雲計算 CentOS Vi 2019-07-29

'學“阿里資深技術專家李運華的架構設計關於分庫分表”的總結'

"最近學習了阿里資深技術專家李運華的架構設計關於分庫分表的教程，頗有收穫，總結一下。本文主要介紹高性能數據庫集群分庫分表相關理論，基本架構，涉及的複雜度問題以及常見解決方案。分庫分表概述讀寫分離分散數據庫讀寫操作壓力，分庫分表分散存儲壓力適用場景類似讀寫分離，分庫分表也是確...

設計技術數據庫 Java SQL 淘寶網 2019-07-28

'java晉級大牛篇：如何用 Zookeeper 實現分佈式鎖？（源碼資料）'

"如何用 Zookeeper 實現分佈式鎖？（附源碼）做積極的人，而不是積極廢人！中文詳細註釋的開源項目RPC 框架 Dubbo 源碼解析網絡應用框架 Netty 源碼解析消息中間件 RocketMQ 源碼解析數據庫中間件 Sharding-JDBC 和 MyCAT 源碼...

Java 技術 Linux UNIX 數據庫 2019-07-23

'海量數據下的分庫分表最佳實戰'

"每個優秀的程序員和架構師都應該掌握分庫分表，移動互聯網時代，海量的用戶每天產生海量的數量，比如：用戶表訂單表交易流水錶我們以支付寶為例，支付寶用戶是8億；微信用戶更是10億。而訂單表更誇張，比如美團外賣，每天都是幾千萬的訂單。淘寶的歷史訂單總量應該百億，甚至千億級別，這些...

NoSQL 移動互聯網 NewSql MySQL 數據庫軟件 SQL 美團網程序員 Why Not? MongoDB 張亮 2019-07-19

'一起來看看：《分佈式全局ID生成方案》'

" 傳統的單體架構的時候，我們基本是單庫然後業務單表的結構。每個業務表的ID一般我們都是從1增，通過AUTO_INCREMENT=1設置自增起始值，但是在分佈式服務架構模式下分庫分表的設計，使得多個庫或多個表存儲相同的業務數據。這種情況根據數據庫的自增ID就會產生相同ID的...

數據庫算法 Mac電腦 Java MySQL 設計 2019-07-19

分庫分表的4個面試連環炮問題！不會就慘了

專注於Java領域優質技術，歡迎關注來自：石杉的架構筆記面試中我們經常會碰到的關於分庫分表的幾個面試連環炮！今天就給大家一一介紹！希望對大家面試的時候能夠...

數據庫跳槽那些事兒 SQL Java 設計技術 MySQL 創業百度 2019-07-12

面試題：集群部署時的分佈式 session 如何實現？

面試題集群部署時的分佈式 session 如何實現？面試官心理分析面試官問了你一堆 dubbo 是怎麼玩兒的，你會玩兒 dubbo 就可以把單塊系統弄成分...

Redis Tomcat 數據庫跳槽那些事兒 Java 瀏覽器 2019-07-09

技術總監：分佈式架構基本思想，如何解決分佈式事務問題

在互聯網大行其道的今天，各種分佈式系統已經司空見慣。搜索引擎、電商網站、微博、微信、O2O平臺。。凡是涉及到大規模用戶、高併發訪問的，無一不是分佈式。關於...

MySQL 技術搜索引擎數據庫並行計算 Java NoSQL 設計 Hadoop MongoDB 電子商務 2019-06-23

數據庫進階-分庫分表技術演進暨最佳實踐

每個優秀的程序員和架構師都應該掌握分庫分表，這是我的觀點。移動互聯網時代，海量的用戶每天產生海量的數量，比如：用戶表訂單表交易流水錶以支付寶用戶為例，8億...

數據庫 NoSQL MySQL NewSql 移動互聯網技術軟件 SQL 程序員人生第一份工作 Why Not? 美團網 MongoDB 京東商城張亮 2019-06-21

你知道怎麼分庫分表嗎？如何做到永不遷移數據和避免熱點嗎？

歡迎關注頭條號：老顧聊技術精品原創技術分享，知識的組裝工目錄前言分庫分表方案hash取模方案range範圍方案總結前言中大型項目中，一旦遇到數據量比較大...

數據庫 MySQL 設計技術算法文章 2019-06-16

一種簡單易懂的 MyBatis 分庫分表方案，送給大家！

數據庫分庫分表除了使用中間件來代理請求分發之外，另外一種常見的方法就是在客戶端層面來分庫分表 —— 通過適當地包裝客戶端代碼使得分庫分表的數據庫訪問操作代...

MySQL 數據庫 SQL 設計 Python 2019-06-02

題庫分庫分表架構方案

方案項目背景在現在題庫架構下，針對新購買的1300W多道數據進行整合，不影響現有功能。由於數據量偏多，需要進行數據的切分目標場景兼容舊的功能對1300多W...

MySQL 數據庫 Microsoft SQL Server SQL 數據結構數學技術 NoSQL PostgreSQL 大數據設計模式初中數學英語 HDFS 2019-05-25

推薦中...