HBase全網最佳學習資料彙總

前言

HBase這幾年在國內使用的越來越廣泛,在一定規模的企業中幾乎是必備存儲引擎,互聯網企業阿里巴巴、京東、小米都有數千臺的HBase集群,中國電信的話單、中國人壽的保單都是存儲在HBase中。注意大公司有數十個數百個HBase集群,此點跟Hadoop集群很不相同。另外,數據需求,很多公司是mysql+hbase+hadoop(spark),滿足關係型數據庫需求,滿足大規模結構化存儲需求,滿足複雜分析的需求。如此流行的原因來源於很多方面,如:

  • 開源繁榮的生態:1. 任何公司倒閉了,開源的HBase還在 2.幾乎每家公司都可以去下載源碼,改進她,再反饋給社區,就如阿里已經反饋了數百個patch了。加入的人越多,引擎就越好

  • 跟HADOOP深度結合:本就同根同源,在數據存儲在HBase後,如果想複雜分析,則非常方便

  • 高擴展、高容量、高性能、低成本、低延遲、稀疏寬表、動態列、TTL、多版本等最為關鍵,起源google論文,發揚社區及廣大互聯網公司,設計之初就是為存儲互聯網,後經過多年的改進升級,如今已經是結構化存儲的事實標準

以下資料會一直更新中......請大家關注!

書籍

最好買紙質書籍,集中時間看下

  • HBase權威指南(HBase: The Definitive Guide):理論多一些

  • HBase實戰:實踐多一些

總結性

  • HBase2.0: HBase2.0 :預計今年會發布,hbase2.0是革命性的版本

  • HBase Phoenix:Apache Phoenix與HBase:HBase之上SQL的過去,現在和未來

  • 社區hbase博客:https://blogs.apache.org/hbase/

方法論

  • HBase使用場景和成功案例 存儲互聯網的初心不變

  • 一種基於物聯網大數據的設備信息採集系統及方法:怎麼使用HBase、sparkStreaming、redis處理物聯網大數據

各大公司的實踐

基本圍繞在用戶畫像、安全風控、訂單存儲、交通軌跡、物理網、監控、大數據中間存儲、搜索、推薦等方面:

  • 阿里巴巴-大數據時代的結構化存儲HBase在阿里的應用實踐:講述在阿里巴巴集團的實踐,HBase在阿里集團已經10000臺左右,主要在訂單、監控、風控、消息、大數據計算等領域使用

  • 阿里巴巴搜索-Hbase在阿里巴巴搜索中的完美應用實踐:講述在搜索場景下hbase的應用及相關的改進

  • 滴滴-HBase在滴滴出行的應用場景和最佳實踐:統計結果、報表類數據、原始事實類數據、中間結果數據、線上系統的備份數據的一些應用

  • HBase在京東的實踐 :跟阿里一樣,京東各個業務線使用了HBase,如:風控、訂單、商品評價等

  • 中國人壽基於HBase的企業級大數據平臺:使用一個大跨表存儲所有的保單,HBase寬表的實踐

  • HBase在Hulu的使用和實踐:用戶畫像、訂單存儲系統、日誌存儲系統的使用

  • Apache HBase at Netease:在報表、監控、日誌類業務、消息類業務、推薦類業務、風控類業務有所使用,另外講述了一些優化的點。

  • 10 Million Smart Meter Data with Apache HBase:講述Hitachi為什麼選擇hbase及在HBase方面的應用

  • G7:如何用雲計算鏈接30萬車輛--EMR&Hbase 在物聯網領域的實踐及解決方案 講述了怎麼使用spark及hbase來滿足物聯網的需求

HBase資料庫

  • HBase:https://pan.baidu.com/s/1jILzgns

  • 知乎HBase討論:https://www.zhihu.com/topic/19600820/hot

結尾

這些資料是筆者整理,以供有大規模結構化需求的用戶及HBase愛好者學習交流,以使用HBase更好的解決實際的問題。

文中有很多加鏈的內容,請點此查看所有鏈接:https://yq.aliyun.com/articles/169085

相關推薦

推薦中...