'HBase的體系結構和在大數據生態圈中的位置'

HBase 大數據數據庫 Hadoop Hive HDFS MapReduce SQL Java Spark Apache Google Facebook BigTable 軟件編程語言 NoSQL ITSTAR 2019-07-27

HBase的體系結構

HBase是一個開源的非關係型分佈式數據庫（NoSQL），它參考了谷歌的BigTable建模，實現的編程語言為 Java。它是Apache軟件基金會的Hadoop項目的一部分，運行於HDFS文件系統之上，為 Hadoop 提供類似於BigTable 規模的服務。因此，它可以容錯地存儲海量稀疏的數據。

HBase在列上實現了BigTable論文提到的壓縮算法、內存操作和布隆過濾器。HBase的表能夠作為MapReduce任務的輸入和輸出，可以通過Java API來訪問數據，也可以通過REST、Avro或者Thrift的API來訪問。

雖然最近性能有了顯著的提升，HBase 還不能直接取代SQL數據庫。如今，它已經應用於多個數據驅動型網站，包括 Facebook的消息平臺。

在 Eric Brewer的CAP理論中，HBase屬於CP類型的系統。

HBase大數據生態圈中的位置

提到大數據的存儲，大多數人首先聯想到的是 Hadoop 和 Hadoop 中的 HDFS 模塊。大家熟知的 Spark、以及 Hadoop 的 MapReduce，可以理解為一種計算框架。而 HDFS，我們可以認為是為計算框架服務的存儲層。因此不管是 Spark 還是 MapReduce，都需要使用 HDFS 作為默認的持久化存儲層。那麼 HBase 又是什麼，可以用在哪裡，解決什麼樣的問題？簡單地，我們可以認為 HBase 是一種類似於數據庫的存儲層，也就是說 HBase 適用於結構化的存儲。並且 HBase 是一種列式的分佈式數據庫，是由當年的 Google 公佈的 BigTable 的論文而生。不過這裡也要注意 HBase 底層依舊依賴 HDFS 來作為其物理存儲，這點類似於 Hive。

可能有的讀者會好奇 HBase 於 Hive 的區別，我們簡單的梳理一下 Hive 和 HBase 的應用場景：

Hive 適合用來對一段時間內的數據進行分析查詢，例如，用來計算趨勢或者網站的日誌。Hive 不應該用來進行實時的查詢（Hive 的設計目的，也不是支持實時的查詢）。因為它需要很長時間才可以返回結果；HBase 則非常適合用來進行大數據的實時查詢，例如 Facebook 用 HBase 進行消息和實時的分析。對於 Hive 和 HBase 的部署來說，也有一些區別，Hive 一般只要有 Hadoop 便可以工作。而 HBase 則還需要 Zookeeper 的幫助（Zookeeper，是一個用來進行分佈式協調的服務，這些服務包括配置服務，維護元信息和命名空間服務）。再而，HBase 本身只提供了 Java 的 API 接口，並不直接支持 SQL 的語句查詢，而 Hive 則可以直接使用 HQL（一種類 SQL 語言）。如果想要在 HBase 上使用 SQL，則需要聯合使用 Apache Phonenix，或者聯合使用 Hive 和 HBase。但是和上面提到的一樣，如果集成使用 Hive 查詢 HBase 的數據，則無法繞過 MapReduce，那麼實時性還是有一定的損失。Phoenix 加 HBase 的組合則不經過 MapReduce 的框架，因此當使用 Phoneix 加 HBase 的組成，實時性上會優於 Hive 加 HBase 的組合，我們後續也會示例性介紹如何使用兩者。最後我們再提下 Hive 和 HBase 所使用的存儲層，默認情況下 Hive 和 HBase 的存儲層都是 HDFS。但是 HBase 在一些特殊的情況下也可以直接使用本機的文件系統。例如 Ambari 中的 AMS 服務直接在本地文件系統上運行 HBase。

相關推薦

'《幽靈行動：斷點》b測大數據出爐玩家累計滅敵123億'

"育碧旗下新作《幽靈行動：斷點（Tom Clancys Ghost Recon: Breakpoint）》在9月5日至9月9日期間進行了Beta測試，今天育碧官方公開了這次Beta測試的大數據統計圖，為玩家統計了遊戲中各種道具、槍械、殺敵數等。一起來看看吧。在這次測試期間共...

幽靈行動育碧軟件大數據 PlayStation Xbox Xbox One 2019-09-19

'4.7萬億！《2019中國餐飲大數據白皮書》出爐透露了這十大機會點'

"在日前舉行的第二十屆中國美食節新聞通氣會上，中國飯店協會會長韓明介紹，今年1月份至7月份，全國餐飲業收入為24937億元，同比增長9.4%。預計全年消費規模將達4.7萬億元。那麼，對於食材企業而言，其中有哪些機會？結合中國飯店協會會長韓明的介紹以及2019中國餐飲大數據白...

快餐中式快餐大數據經濟美食博覽會投資關愛吃貨成長協會 2019-09-19

'如何找對人、選好貨、鋪對場？尼爾森快消零售大數據揭開真相'

"中國商報/中國商網（記者張濤）9月17日，尼爾森發佈了《揭祕高能市場：尼爾森中國城市快消零售大數據報告(2019)》。該報告彙集消費者、門店、地理特徵、產品及銷量等超過3萬個數據標籤，實現米級人貨場數據的立體融通。尼爾森表示，報告旨在幫助品牌商和零售商以最快速度瞭解市場...

大數據黃金技術 2019-09-18

'讓人遺憾！阿根廷輸球無緣世界盃冠軍兩大數據表現太差了'

"北京時間9月15日晚上，男籃世界盃決賽打響，阿根廷隊迎戰西班牙隊，經過四節比賽的激戰，阿根廷隊遺憾75-95輸給西班牙隊無緣冠軍，本場比賽阿根廷輸球可以說是輸在了自己的天生短板跟臨場發揮了，球隊兩大方面的表現表現有點糟糕！說阿根廷輸給了天生的短板，是因為球隊陣容的短板，那...

世界盃足球賽阿根廷西班牙大數據路易斯·斯科拉籃球的夏天越投入越精彩 2019-09-18

'優信李成彬：大數據助力二手車行業成長變革'

"優信集團業務產品中心總經理李成彬日前在“創享未來，駕馭明天”——未來出行·創新與變革跨界交流活動上，發表了主題為《大數據驅動行業變革》的演講，與在場嘉賓分享大數據的影響下優信在二手車行業的成長曆程。新興價值網幫助企業實現創新性增長李成彬表示，近幾年行業變化巨大，以電商行業...

大數據二手車技術萬物嚐鮮節人生第一份工作京東商城 2019-09-18

'海盜遊戲《ATLAS》結合大數據制定新計劃，玩家50%時間在海上活動'

"作為全Steam最大的一款航海遊戲，海盜冒險生存遊戲《ATLAS》給我們帶來的第一直觀體驗就是規模宏偉，它有著4.5萬平方公里的地圖以及900多個小島嶼，而玩家則會在這款遊戲裡面和4萬個玩家一起作戰，感受由《ATLAS》帶來的真實海戰。然而最近《ATLAS》卻在分析玩家行...

大數據航海 Steam 生存遊戲 2019-09-18

'手遊大數據：川渝玩家偏愛棋牌？王者榮耀等MOBA遊戲用戶粘性最高'

"今天（9.17）國內移動互聯網大數據公司QuestMobile，發佈了2019手機遊戲行業半年報告。該報告從行業基本發展狀況、手遊玩家差異化特點、手遊流量以及遊戲推廣方式等多個方面用數據敘述了上半年國內手機遊戲行業內的一些情況。手遊行業收入增速擴大，活躍用戶規模呈現持續向...

網絡遊戲 Qwangzherongyao 大數據市場營銷廣東移動互聯網消除類遊戲四川人生第一份工作 2019-09-18

'通用大眾豐田三大品牌的11萬餘條汽車零部件進口數據，已被它覆蓋'

"汽車零部件進口通關又添利好，海關總署稅收徵管局（上海）開發的海關稅收徵管大數據應用項目“汽車零部件自動輔助申報系統”日前已上線試運行。海運集裝箱進口汽車零部件，是世界銀行營商環境報告中的商品，其口岸平均放行時間直接影響口岸營商環境的評估指標。由於海運集裝箱進口汽車零部件進...

豐田汽車大眾汽車上海數據庫廣州視覺中國青島天津長春 2019-09-18

'淺析大數據技術及其行業產品'

"大數據，IT行業的又一次技術變革，大數據的浪潮洶湧而至，對國家治理、企業決策和個人生活都在產生深遠的影響，並將成為雲計算、物聯網之後信息技術產業領域又一重大創新變革。未來的十年將是一個“大數據”引領的智慧科技的時代、隨著社交網絡的逐漸成熟，移動帶寬迅速提升、雲計算、物聯網...

大數據技術數據庫數據挖掘 NoSQL 算法硬件設計雲計算物聯網 MapReduce 可視化技術投資 SQL GFS 人工智能風行網思科系統經濟歷史社交網絡 Google 2019-09-18

'“蓮蓉蛋黃”月餅銷量最好月餅大數據——銷量同比增52%'

"中新社北京9月12日電 (記者周銳)在中秋節來臨之際，月餅的銷售又一次成為熱門話題。京東大數據研究院日前披露了一份研究報告，展示了節前兩週京東平臺月餅銷售的相關情況。資料圖：上海民眾排隊購買鮮肉月餅。湯彥俊攝從總量上看，2019年中秋節前兩週全國月餅銷量是去年同期的1...

最圓不過中秋月蓮茸大數據蜜餞廣東糕點江蘇河北堅果芝麻豆沙上海奶黃湖北河南京東商城五仁浙江省安徽黑龍江省水果山東葡萄酒海鮮遼寧重慶福建酒貴州 2019-09-18

'市場 | 電力大數據如何服務社會？國網大數據中心促進數據增值變現落地應用'

"2019中國國際智能產業博覽會國家電網展區內，重慶市民劉華龍聚精會神地聽了工作人員講解，感慨地說：“之前與國家電網的接觸僅僅是買電，沒想到你們研發的產品還可以用來支撐政府決策，幫助中小企業解決融資難題。”國家電網有限公司在2019智博會上集中展示了57項泛在電力物聯網建設...

大數據經濟國家電網投資物聯網重慶金融能源數據挖掘人生第一份工作上海可視化技術算法南京安徽 2019-09-18

'14日大數據：美國隊恥辱記錄彙總，老司機當選主席！MVP候選出爐'

"米切爾16分美國勝波蘭鎖第7；博格丹31分塞爾維亞排第51、14日之星：博格丹諾維奇31分4板3助7記三分當選男籃世界盃已經結束了9月14日的兩場排位賽，我們結合各球員的表現評選出了“今日之星”，塞爾維亞後衛博格丹-博格丹諾維奇當選。在塞爾維亞以90-81擊敗捷克的比賽中...

世界盃籃球賽德克·諾維茨基斯蒂芬·庫裡世界盃足球賽路易斯·斯科拉埃文·特納越投入越精彩法國男籃勒布朗·詹姆斯波特蘭開拓者布魯克林籃網維克托·奧拉迪波塞爾維亞丹佛掘金弗拉德·迪瓦茨詹姆斯·哈登印第安納步行者本·華萊士達米恩·利拉德安東尼·戴維斯波蘭凱里·歐文大數據喬爾·恩比德休斯頓火箭亞當·博格丹洛杉磯快船洛杉磯湖人科懷·倫納德密爾沃基雄鹿歐洲費城76人捷克比利·多諾萬傑梅因·奧尼爾蘇聯德國阿根廷阿根廷男籃奧林匹克運動會法國馬丁·喬爾俄羅斯新西蘭沙奎爾·奧尼爾舊金山加拿大 2019-09-18

'優信成長的關鍵在於大數據，李成彬分享全國購成長曆程'

"【獵雲網北京】9月12日報道近日，優信集團業務產品中心總經理李成彬在“創享未來，駕馭明天”——未來出行·創新與變革跨界交流活動上，發表了主題為《大數據驅動行業變革》的演講，與在場嘉賓分享大數據的影響下優信在二手車行業的成長曆程。新興價值網幫助企業實現創新性增長近幾年行業變...

大數據技術二手車萬物嚐鮮節京東商城人生第一份工作 2019-09-18

'提速中國大數據普惠之路，曙光大數據的沉澱與釋放'

"凱文•凱利曾在《失控》中寫到：“最深刻的技術是那些看不見的技術，他們將自己編織進日常生活的細枝末節之中，直到成為人們生活的一部分。”確實如此，今天各種數據正快速融入人們的日常生活之中，讓衣、食、住、行等相關領域的海量數據實現了持續迸發。同時，大數據技術和應用也逐步成為了國...

大數據中科曙光技術經濟雲計算歷史算法普惠公司人生第一份工作 2019-09-18

'貴州大學新生大數據，最小14歲，銅仁一中連續三年奪冠'

"開學報到兩天倒計時，2019級小萌新就位！新生都是來自哪裡呢？每個學院的新生人數有多少？男女比例又是怎樣的呢？......礦業學院、土木工程學院喜提最高男女比，每10個新生中僅有1個女生。醫學院榮獲最低男女比，每10個新生中僅有1個男生。為了均衡男女比例，溪溪單方面宣佈軍...

貴州銅仁大數據河北土木工程遵義生活冷知識湖南不完美媽媽苗族 2019-09-17

'10月國慶節前後，A股如何走？歷史十年的大數據告訴你'

"中秋佳節剛剛結束，我們就要迎來十一長假了！那麼對於此次的十一長假來說，節前節後到底A股會如何走呢？筆者用歷史的數據，以及目前的情況來給你分析一下，看看有沒有道理！第一、從數據來看，國慶小長假的節日效應明顯，漲多跌少的概率較大。我們可以看到近十年以來A股的十年國慶前夕表現都...

滬指大數據投資歷史人生第一份工作 2019-09-17

'北斗導航總設計師楊長風：北斗將與5G大數據等深度融合'

"北斗導航總設計師楊長風表示，北斗將與互聯網、物聯網、5G、大數據深度融合，塑造形成基準統一、覆蓋無縫、安全可信、便捷高效的北斗綜合導航定位授時體系。未來，北斗系統會堅持融合發展，將導航定位服務融為一體，並在此基礎上增加國際搜救、星基增強、精密單點定位等服務能力。此外，北斗...

我的第一部5G手機大數據設計師 GPS 物聯網 2019-09-17

'劉婷同學祝大家中秋節快樂'

"正值中秋佳節，埋頭苦學，研究了一下扣圖的技巧，可惜研究了兩天一夜，沒有多大長進，可是沒有關係，我很勇敢，放上我的作品，請大家欣賞指正，感謝！不要問我那些像天女散的花一樣的是啥，那些就是花！我的水平有限，只能做到這樣了，Excel做出來的，能怎樣？希望大家有好的修圖軟件的，...

中秋節蘇洵蘇軾蘇味道三字經蘇轍宋仁宗軟件眉山我在宮裡做廚師 2019-09-17

'網友：到處都是東北人；大數據：沒幾個東北人'

" 現在都說，哪哪哪都是東北人，東北人多麼多！東北已經沒人了，人都跑出來了。但是在大數據面前，東北好像又沒幾個人了。如圖所示，都在反映深圳、杭州有多麼多的東北人，深圳東北人確實挺多，都佔到外來人口的2%了！如果深圳有1000萬外來人口，那東北人至少有20多萬呢，真多啊！"

大數據深圳杭州 2019-09-17

'中秋佳節：沒編程合集大團圓！318本編出電子書籍➕視頻資料項目'

"中秋節佳節，小夥伴們都放假開心的回家團圓去了吧？這不、小編給你們帶來了更開心的事情、那就是給你們準備好了編程合集大團圓！全網最全編程語言視頻教程（從零基礎到大牛哦！）包含java、python、web、大數據、人工智能、等視頻教程+項目+源碼，現在免費分享給各位！[領取方...

Java 人工智能 Linux 技術腳本語言大數據 Node.js UNIX 程序設計設計 Python 數據庫移動互聯網 HTML HTML5 編程語言操作系統最圓不過中秋月網頁設計 CSS 程序員 JavaScript JSP 自然語言處理 GNU ASP IBM Velocity 讀書中央處理器硬件英語 PHP 文章 2019-09-17

推薦中...