雲架構那些事兒：數據層存儲雲化的實踐

數據庫 HBase Redis 技術數據挖掘阿里巴巴集團 ElasticSearch 阿里雲計算 HDFS 搜索引擎設計 DTS 雲架構那些事兒 2019-04-06

業務上雲，在面臨海量的業務數據，如何在層出不窮的數據庫中選擇適合自身業務應用的解決方案，成為架構設計的難點。

傳統的集中化存儲，如將所有數據存儲在Oracle中的方式已經沒有辦法滿足現在多樣的數據類型與使用要求。採用“分而治之”的方式，更符合現在雲化架構的整體實現思路。

這裡為大家分享一下數據庫的選型原則，並提供一個真實的案例給大家作為參考。

選型原則：

如何選擇合適的數據存儲

數據層選型時，要考慮一下六個數據特點，選擇合適的數據存儲解決方案。

數據類型，關係型數據、KV數據、視頻、圖片、文件
數據量，萬級、百萬級、千萬級、億級別
實時性/一致性，實時訪問、準實時訪問、分鐘級延遲、小時級延遲、天級查詢
併發度， QPS、TPS、響應時間
使用場景，實時業務、報表分析、歷史歸檔數據、多維查詢、正則查詢
數據來源，文件、數據同步、消息隊列、數據庫

結合以上六點，選擇合適的數據存儲技術形成數據層解決方案。

這裡舉幾個選型的例子：

海量關係型數據+實時性高+高併發：可以選擇分佈式關係型數據庫，商業的如阿里雲DRDS、POLARDB，開源的如MyCAT等。
多維度查詢+正則查詢+準實時+海量數據存儲：可選擇搜索引擎，如Elasticsearch
規則類數據/高併發KV類數據：Redis/Redis Cluster
歷史歸檔數據：阿里DRDS/Hbase
視頻圖片文件：可選擇分佈式文件系統或對象存儲，商業的如阿里OSS，開源的HDFS、FastDFS、GlusterFS、CephFS

真實案例

以下是我們在某大型企業使用的數據存儲及使用方案：

某大型企業數據存儲解決方案

首先對數據存儲解決方案形成三層架構：

第一層，實時數據層

使用Redis實現高併發KV數據的緩存、Session共享。

使用阿里OSS作為大批量文件的存儲。

使用阿里DRDS作為核心業務數據庫。

使用ElasticSearch實現多維數據查詢與正則查詢。

第二層，數據傳輸層

使用阿里DTS作為數據同步通道，當然你可以選擇開源的如Otter/Canal來構建自己的數據同步通道，實現近實時的數據同步。

使用DTS-writer，將數據同步至異構數據庫，實現異構數據庫的數據同步，可大幅降低將由應用將數據存儲在各個獨立產品的研發代價。

第三層，離線數據層

使用HBASE作為歸檔數據存儲，實現數據挖掘與報表功能

使用阿里DRDS為生產提供離線/冷數據的查詢

使用阿里RDS作為同步部分關鍵數據，為打造業務生態提供個性業務數據

最後，從設計本身的角度，任何得到認可的數據庫產品都有價值，都可以作為數據存儲架構選型的備選項，但由於數據庫本身的重要性，使用團隊熟悉的技術往往可以降低整體風險。選擇使用新技術務必要進行大量驗證。

仔細思考，你一定會有所收穫。

歡迎關注：雲架構那些事兒，專注實用性雲架構分享與IT技術分享。

相關推薦

'華興Alpha對話九章雲極尚明棟：科技賦能企業服務的新實踐'

"由華興Alpha主辦的“2019第四屆影響力投資峰會”在京圓滿落幕。華興資本集團董事長、首席執行官、華菁證券董事長包凡，中金資本董事總經理易岐筠，紅杉資本中國基金合夥人周逵，洪泰基金創始合夥人、洪泰資本控股董事長盛希泰，中國風投委常務副會長、中國母基金聯盟祕書長唐勁草，京...

華興資本技術生物技術人工智能創業投資軟件機器學習金融物理市場營銷證券投資基金硬件銀行交通數據庫高德納集團人生第一份工作 2019-09-15

'最佳實踐：讓 Serverless 架構拯救大數據'

"如果你聽說過 Serverless 的話，你可能會把它當做一種雲架構模式，可以將一個應用程序所需要的、長期維護的基礎設施數量降到比較低的水平。在某些場景下，這種方式可以節省很多成本。而且也確是是這樣的。但是在這篇文章裡面，我會在一個新的場景下，介紹相關的應用程序：高度並行...

大數據數據庫 Flask 操作系統 Python 硬件 Google Spark Azure 電腦微軟機器學習物理 2019-09-13

'有了它還要啥自行車？專為網絡存儲設計的WD RED輕鬆搭建私有云'

"因工作性質和個人愛好上的需求平時存儲量挺大，加上電腦上的的存儲空間有限，而且電腦一旦出現了故障，尤其是硬盤損壞的話就會在工作和生活當中惹上了不少的麻煩。之前公司就因為硬盤的損壞導致部分重要資料的丟失，後來公司採用了服務器主機來存儲和備份數據，的確對數據安全和性能方面確...

西部數據設計固態硬盤電腦操作系統軟件自行車硬件 Windows 我想靜靜技術臺式電腦超微半導體三星集團瑞昱半導體微星科技 2019-09-12

'數據丨物聯網技術驅動，互聯網通信雲市場蘊含千億價值'

" 轉至：Ai芯天下https://iot.ofweek.com/2019-06/ART-132216-8120-30395516.html自上世紀50年代開始，伴隨著美蘇爭霸的互聯網開始逐漸展現在人類歷史信息技術的進步不斷推動著通信雲邁向新的發展階段，其迭代升級覆蓋通信形...

通信物聯網技術 SaaS IaaS 雲計算數據庫軟件操作系統人工智能電子技術非洲電信硬件高德納集團 2019-09-11

'2019世界物聯網博覽會：華雲數據榮獲“三新”金獎'

"2019年9月7日，由工業和信息化部、科學技術部、江蘇省人民政府共同主辦2019世界物聯網博覽會（以下簡稱物博會）正於無錫太湖國際會展中心如火如荼地召開。華雲數據作為中國雲計算獨角獸、江蘇省互聯網頭部企業受邀參加本屆物博會，並攜全新的產品與優秀案例亮相現場，多維度展示華雲...

物聯網技術雲計算操作系統大數據我的第一部5G手機江蘇數據庫機器人加拿大方濱興大學李小敏婁勤儉人生第一份工作太湖鄔賀銓 2019-09-09

'雲HBase Thrift使用最佳實踐'

"HBase原生只提供了JAVA API客戶端，針對諸如python、php、c++等非java語言一般都是通過Thrift代理的方式訪問HBase服務，本文從thrift架構、hbase thrift api使用以及如何監控thrift等幾個方面詳細介紹雲HBase Th...

HBase Java Python PHP Facebook 2019-09-07

'華雲數據發佈國產通用型雲操作系統安超OS'

"人們常說中國IT是“缺心少魂”的。“心”當然指的是芯片，而“魂”則是指的操作系統。當整個IT產業向雲計算邁進的產業變革之際，中國的政企客戶應用部署開始全面走向公有云、混合雲和私有云等模式，中國科技公司也迎來了巨大的機會。這種機會不僅僅是指商業層面的市場機會，還是中國科技公...

操作系統數據庫技術硬件雲計算軟件中央處理器 OpenStack 投資人生第一份工作 2019-09-07

'百度「雲+AI」戰略升級，新架構如何推動 AI 工業化浪潮？'

"週一，百度董事長兼 CEO 李彥宏的一封公開信引發行業熱議。根據其公開信內容，百度將進一步升級「雲+AI」戰略，百度智能雲與CTO體系高效融合，公司副總裁、智能雲事業群組總經理尹世明向百度首席技術官王海峰彙報。這是繼 2018 年 12 月百度智能雲從事業部升級事業群之後...

百度人工智能百度雲技術語音識別技術深度學習雲計算百度地圖騰訊阿里雲計算李彥宏騰訊雲計算數據挖掘人生第一份工作第二十二屆中國農加工投洽會阿里巴巴集團 2019-09-05

'（002316）潛力股：雲計算、物聯網、5G、大數據、獨角獸、華為'

"亞聯發展主營業務：從事專網信息通信技術解決方案業務的服務商，主要為能源、交通等行業提供信息通信技術解決方案，包括相關軟硬件產品的研發、製造與服務，以及第三方支付業務。產品類型：專網通訊技術解決方案、交通工程系統集成、收單服務、硬件銷售公司積極與華為公司在雲計算和大數據領域...

華為公司雲計算大數據技術我的第一部5G手機物聯網投資通信交通人生第一份工作鍵橋通訊能源雲南設計硬件算法 2019-09-04

'安超OS面世：華雲數據的雄心與耐心'

操作系統數據庫技術硬件軟件雲計算中央處理器 OpenStack 人生第一份工作 2019-09-03

'雲計算和大數據的區別'

"隨著科技的進步，全面實現生產過程和業務管理的數字化、智能化是企業保持市場競爭力的關鍵，在這一過程中對數據的處理和運用將極大的增強企業的核心競爭力，同時，AI 的進步為企業提供了自動化的業務流程，並深刻改變著客戶體驗和產品差異。當企業紛紛利用這些技術，來降低管理費用，擴大業...

雲計算大數據數據庫數據挖掘技術人工智能物聯網電腦軟件如果雲算法硬件經濟人生第一份工作 2019-09-01

'在電商問題不斷暴露時代，來看看樂視電商雲的整體架構與技術實現'

"主題簡介本次分享將帶大家瞭解電商系統的發展過程，並分析在高速發展期的電商面臨的問題，同時跟大家分享樂視電商雲的架構和實踐方案。1. 電商系統發展過程電商網站在不同時期的架構複雜度有所不同：初創期：商品類型少，業務複雜度低，系統架構簡單。採用高可用數據庫、分佈式緩存、文件存...

電子商務技術樂視網軟件人力資源 DNS 硬件數據庫雲計算人生第一份工作 NoSQL 推薦技術通信路由器 2019-08-30

'大數據產業“雲”集張北耗能激增，電力如何保供應、提能效？'

"【能源人都在看，點擊右上角加“關注”】北極星輸配電網訊:核心提示河北省張北縣不僅有著豐富的風力和光伏資源，還是擁有60萬臺服務器的阿里巴巴數據中心的落地之處。2012年6月，阿里巴巴數據中心落戶張北。7年來，隨著雲計算產業的蓬勃發展，電力能耗也與日俱增，如何為這樣世界級...

張北大數據能源雲計算技術可再生能源阿里巴巴集團新能源河北經濟張家口太陽能京津冀物聯網空調設計 2019-08-23

'“雲存儲第一案”引發的思考：雲上出了事，雲該擔責嗎'

"（圖片來源：壹圖網）陳永偉/文一個私服引出的雲存儲第一案2013年1月，北京樂動卓越科技有限公司（以下簡稱“樂動卓越”）推出了一款名為《我叫MT Online》的RPG（角色扮演遊戲Role-playing game）卡牌類遊戲。由於這款遊戲由人氣動漫《我是MT》改編，...

阿里雲計算我叫MT RPG遊戲動漫雲計算魔獸世界法律卡片遊戲數據庫 Cosplay 人生第一份工作石景山 2019-08-18

'衣定雲YDY動態：多領域時尚鬼才：不走尋常路的化高峰'

"衣定雲首席設計師：化高峰人物介紹：明明是設計師科班出身卻在品牌定位與企劃領域風生水起明明個人品牌已頗有名氣卻又去探索智能服裝定製科技他走的每一步路都讓人意想不到跳躍在不同領域之間他思維靈活，他天馬行空——“您為什麼會選擇服裝設計專業呢？”——“雖然我五歲開始學習繪畫，但其...

時尚服裝設計設計設計師人生第一份工作高峰時裝週服裝凡客誠品藝術 2019-08-15

'智能交通大數據及雲應用平臺解決方案（上）'

"導讀：隨著日益增長的交通“大數據”，給交通管理創新帶來的新挑戰，以及對交通管理工作提出的新要求，交通信息化建設必然步入雲計算智慧應用階段，利用雲計算破解當前諸多交通瓶頸問題。本文主要內容：什麼是交通大數據什麼是雲分析交通大數據系統及雲應用平臺系統架構交通大數據系統數據流程...

大數據交通操作系統設計技術雲計算軟件人機交互硬件 GPU 體育 GPS 中央處理器 2019-08-14

'分佈式雲存儲將於2020年迎來大爆發'

"隨著數字化、網絡化的發展，越來越多的公司構建在以數字組成的產品服務之上，蘋果、亞馬遜和微軟等公司已經超越以物質為主進行建設的傳統公司。數字化、網絡化的建設過程中，公司和個人正在產生越來越多的數據。據統計，從2010年到2020年，世界每年創造的數據在以42%的複合增長率增...

區塊鏈技術雲計算硬件電腦銀行金融經濟人工智能數據庫微軟 2019-08-13

'混合雲開啟企業架構進化之路，IT服務如何“多雲”轉晴？'

"導讀：前不久，沃達豐、AT&T、juniper networks都宣佈與IBM簽訂長達7到8年的長期混合雲管理合作。為什麼這些行業龍頭企業都青睞IBM混合雲？儘管雲計算這個詞已經出現超過十年，但之前大多數企業只是將軟件開發、網站宣傳等應用放在雲上，真正的核心繫統大...

IBM Juniper Networks 技術雲計算美國電話電報公司軟件沃達豐 DevOps 設計人生第一份工作 2019-08-13

'奧卡雲：差異化戰略造就企業級存儲市場新英雄'

"本文作者│劉學習Fiyinghare在國家級新區——西鹹新區中，電子信息技術、空港物流、文化旅遊等幾大產業快速發展，呈現蓬勃發展之勢。其中專注於企業級存儲、數據平臺的專業數據服務企業——奧卡雲數據科技在傳統企業雲集、有幾十年深厚積累的存儲系統發力，僅僅成立一年多，就以自主...

技術電信跳槽那些事兒雲計算大數據 EMC 華為公司人生第一份工作工程師 IBM 設計 VMware 創業阿萊克斯·萊恩投資 2019-08-08

'AWS伊恩·馬辛哈姆：如何構建成本導向的雲原生架構？'

"AWS全球技術與開發者佈道師團隊副總裁伊恩·馬辛哈姆（Ian Massingham）進入2019年，“雲原生”成為雲計算行業最熱門的詞彙之一。2018開源領袖峰會（OSLS）宣佈Kubernetes成為第一個從CNCF雲原生基金會畢業的項目，Kubernetes和容器技術...

技術雲計算 Aurora 數據庫算法通信亞馬遜公司 2019-08-05

推薦中...