Hadoop生態系統-新手快速入門（含HDFS、HBase系統架構）

Hadoop HDFS HBase Hive MapReduce SQL Apache 設計數據庫 Java 軟件 Java虛擬機分佈式計算瀏覽器數據結構硬件軟件架構 2019-06-28

Hadoop簡介

Hadoop是一個由Apache基金會所開發的分佈式系統基礎架構。

用戶可以在不瞭解分佈式底層細節的情況下，開發分佈式程序。充分利用集群的威力進行高速運算和存儲。

Hadoop實現了一個分佈式文件系統（Hadoop Distributed File System），簡稱HDFS。HDFS有高容錯性的特點，並且設計用來部署在低廉的（low-cost）硬件上；而且它提供高吞吐量（high throughput）來訪問應用程序的數據，適合那些有著超大數據集（large data set）的應用程序。

Hadoop的框架最核心的設計就是：HDFS和MapReduce。HDFS為海量的數據提供了存儲，而MapReduce則為海量的數據提供了計算。

Hadoop生態系統

廣義的Hadoop，一般稱為Hadoop生態系統，如下所示。

Hadoop生態系統中這些軟件的作用：

HDFS：Hadoop的分佈式文件系統，可以看見HBase、MapReduce這些軟件是運行在HDFS之上的，可以說是Hadoop生態系統的基石。
HBase：Google分佈式數據庫Bigtable的開源實現，是一個高可靠、高性能、面向列、可伸縮的分佈式數據庫，主要用來存儲非結構化和半結構化的鬆散數據。為了提高數據可靠性和健壯性，發揮HBase處理大數據量等功能，一般使用HDFS作為HBase的底層數據存儲方式。
MapReduce：分佈式計算框架。
Sqoop：協助RDBMS與Hadoop的Hive和HBase之間進行數據傳導的工具。
Hive：是基於Hadoop的一個數據倉庫工具，可以將結構化的數據文件映射為一張數據庫表，並提供完整的sql查詢功能，可以將sql語句轉換為MapReduce任務進行運行。
Pig：是一個基於Hadoop的大規模數據分析平臺，它提供的SQL-LIKE語言叫Pig Latin，該語言的編譯器會把類SQL的數據分析請求轉換為一系列經過優化處理的MapReduce運算。
ZooKeeper：是一個針對大型分佈式系統的可靠協調系統，提供的功能包括：配置維護、名字服務、分佈式同步、組服務等。
Avro：是一個基於二進制數據傳輸高性能的中間件。在Hadoop的其他項目中例如HBase和Hive的Client端與服務端的數據傳輸也採用了這個工具。Avro是一個數據序列化的系統。Avro可以將數據結構或對象轉化成便於存儲或傳輸的格式。Avro設計之初就用來支持數據密集型應用，適合於遠程或本地大規模數據的存儲和交換。

HDFS 系統架構

HDFS 採用了主從（Master/Slave）結構模型，一個HDFS集群包括一個名稱節點（NameNode）和若干個數據節點（DataNode）。

名稱節點（NameNode）作為中心服務器，負責管理文件系統的命名空間及客戶端對文件的訪問。HDFS集群中，只有唯一一個名稱節點。
數據節點（DataNode）一般是一個節點運行一個數據節點進程，負責處理文件系統客戶端的讀寫請求，在名稱節點的統一調度下，進行數據塊（Blocks）的創建、刪除和複製等操作。

HDFS採用Java語言開發，因此任何支持JVM的機器都可以部署名稱節點和數據節點。

在配置好Hadoop 集群之後，可以通過瀏覽器訪問 http://[NameNodeIP]:9870，查詢HDFS文件系統。通過該Web界面，可以查看當前文件系統中各個節點的分佈信息。

HBase系統架構

HBase系統架構如下所示，包括客戶端、Zookeeper服務器、Master主服務器、Region服務器。一般而言，HBase會採用HDFS作為底層數據存儲。

在HBase服務器集群中，包含了一個Master和多個Region服務器，Master是HBase集群的“總管”，它必須知道Region服務器的狀態。

HBase中可以啟動多個Master，但是Zookeeper 可以幫助選舉出一個Master 作為集群的總管，並保證在任何時刻總有唯一一個Master在運行，這樣可以避免Master單點失效的問題。

Region服務器是HBase中最核心的模塊，負責維護分配給自己的Region，並響應用戶的讀寫請求。

Store是Region服務器的核心。每個Store對應了表中的一個列族的存儲。每一個Store包含了一個MemStore緩存和若干個StoreFile文件。

HBase採用HLog來保證系統發生故障時，能夠恢復到正確的狀態。HLog是磁盤上面的記錄文件，它記錄著所有的更新操作。

HBase系統為每個Region服務器配置了一個HLog文件，它是一種預寫式日誌（Write Ahead Log），也就是說，用戶更新數據必須首先被記入日誌後，才能寫入MemStore緩存。

此外，Pig和Hive還為HBase提供了高層語言支持，使得在HBase上進行數據統計處理變的非常簡單。 Sqoop則為HBase提供了方便的RDBMS數據導入功能，使得傳統數據庫數據向HBase中遷移變的非常方便。

注意：Hadoop 安裝完成之後，只包含HDFS和MapReduce，並不含HBase，因此需要在Hadoop 之上繼續安裝HBase。

相關推薦

'這是目前最全的Note10評測！DxoMark第一名不虛傳，系統我真的服'

"我們都知道，今年是Galaxy系列十週年，上半年的S10系列一改我們對三星旗艦的印象，超窄的下巴，超高的屏幕素質以及強悍的綜合實力給小編留下了非常深刻的印象。那麼時間到了下半年，用來對抗新一代iPhone的Galaxy Note系列終於發佈，小編也是在第一時間參與了三星的...

三星集團一加手機硬件 iPhone 華為公司軟件 Galaxy Note 我的第一部5G手機攝影數據庫 2019-09-19

'中國福利會託兒所獲2019年全國教育系統先進集體稱號'

"圖說：中國福利會託兒所的孩子在中秋節學習“中秋本領” 採訪對象供圖（下同）做月餅、穿漢服、搭起氣球飛行器……在剛過去的中秋節裡，中國福利會託兒所的每個孩子都學會一項“中秋本領”。這都離不開中託所精心設計的中秋系列活動的功勞，而這樣的活動在剛獲得“2019年全國教育系統先進...

不完美媽媽幼兒園中秋節飲食健康宋慶齡上海人生第一份工作技術聰明孩子養成記文化體育設計藝術最圓不過中秋月 2019-09-19

'飛行員的噩夢！世界最先進、名列前茅的近防系統'

""密集陣"，是指美國海軍為解決軍艦近程防空問題專門設計製造的六管20毫米口徑自動旋轉式火炮系統，即MK15"火神"密集陣系統。“密集陣”採用了模塊化設計，除了炮位控制檯與遙控臺在艙外，其他設備都以模塊形式裝配在炮架上，體積小、重量輕，可安裝在各型軍艦上，如果作戰時零部件損...

海軍雷達導彈軍艦直升機護衛艦魚雷快艇驅逐艦航空母艦技術賈斯汀·加特林射擊設計威力 2019-09-19

'最實在德系入門好車，全新捷達油耗僅5.7L，不足8萬'

"新款的大眾捷達汽車看上去非常的耐看，在臉部上面我們會發現是變得更加年輕化了，應該以往大眾捷達的形象這一次是一款漂亮的解答，並且它的入門級別的價格還是在7.99萬的樣子，從這個角度來說的話是非常值得推崇的。我們可以看到它的整個進氣格柵跟大燈之間形成了一個一體化的設計，醒目的...

大眾捷達原汁原味的德系SUV 轎車大眾汽車設計豐田卡羅拉 2019-09-19

'賽博朋克2077新情報，任務系統人工生成，這招育碧永遠學不會'

"賽博朋克2077可謂是在2019TGS上出盡了風頭，它的日本代理商Spike Chunsoft專門為其建立了單獨的展臺，還將酷炫的“草薙之劍”（摩托）帶到了現場。近日波蘭蠢驢的任務設計師表示，為了遊戲的質量，賽博朋克2077中的所有任務都是他們自己來設計的，沒有一個是使用...

賽博朋克2077 育碧軟件開放世界設計設計師人工智能幽靈行動刺客信條 Cosplay 日本設計模式技術波蘭算法 2019-09-19

'開鴻蒙後窮窅冥：華為下一個開源操作系統會改變什麼？'

"“西窮窅冥之黨，東開鴻濛之先。”淮南王劉安在《淮南子》中寫下了這樣一句話。開鴻蒙意味著開闢混沌伊始，窮窅冥意味著探索遙遠天際，在中國古典哲學的世界觀中，對於未知領域的探索征服慾望，是人類文明發展的原生動力。當然在今天，人們對“鴻蒙”一詞已經有了新的理解——華為推出的基於微...

操作系統 UNIX 華為公司 Linux 技術高能小子終極裝備硬件紅帽公司軟件雲計算淮南子英特爾 X86 編譯器劉安 IBM 2019-09-18

'2019國家網絡安全宣傳週開幕：奇安信內生安全系統備受關注'

"9月16日，國家網絡安全宣傳週在天津梅江會展中心拉開帷幕。作為“網安周”其中一項重要活動，網絡安全博覽會在天津梅江會展中心舉行。作為中國人員規模最大的網絡安全公司奇安信集團通過展示內生安全系統、現場互動體驗、專家現場解讀及協辦關鍵信息基礎設施安全保護論壇等多種形式參與“網...

網絡安全黑客操作系統 Wi-Fi 金融技術天津交通大數據能源設計電腦電子政務人工智能 2019-09-18

'Deepin Linux安裝篇之系統盤刻錄'

"1、前述前面兩篇扯了這麼多廢話，也該進入正題了。都說：“工欲善其事必先利其器”，“磨刀不誤砍柴工”，對於安裝Deepin Linux系統也是一樣的。不管是任何操作系統，在安裝操作系統之前我們都需要進行系統盤的刻錄，Windows、Linux、MacOS都一樣，只是現在很多...

Deepin Linux 操作系統 U盤軟件電腦 Windows 阿里雲計算迅雷讀書 2019-09-18

'想讓年輕人玩得痛快解析名爵ZS 1.3T+6AT動力系統'

"[上愛卡汽車看更多汽車黑科技！]誕生於2017年的名爵ZS可以說是名爵品牌的當紅車型，自上市以來，其憑藉著出眾的顏值、豐富的配置以及小型SUV的定位贏得了眾多年輕消費者青睞，如今，名爵ZS的中期改款車型迎來通用1.3T發動機+愛信6AT變速箱組成的全新動力系統。【名爵Z...

技術設計節能減排原汁原味的德系SUV 空氣汙染汽車展覽上汽集團 2019-09-18

'8-bit Windows 八位機視窗操作系統（三）：小霸王SB-Win98'

"1997年年末到1998年年初之間，國內尚混戰在軟驅型學習機市場裡的三家廠商，步步高、裕興和小霸王都推出了升級版的軟驅型學習機：步步高推出了內置2M電子盤的98型學生電腦，裕興一口氣推出了可以上網的多媒體普及型電腦98型/經濟型/F型，而小霸王交出的是一款幾乎傾盡所有心血...

Windows 98 操作系統 Windows 軟件電腦輸入法鼠標 BASIC語言步步高 Windows 95 微軟 WPS 音樂藝術倉庫番 2019-09-18

'特斯拉Model 3配備噪音示警，行人預警系統或將成汽車標配？'

"據外媒報道，此前特斯拉公司為其銷售人員發送了一份溝通文件，其中談論了關於為車輛加裝行人預警系統（PWS）的內容，顯示特斯拉公司以後所有針對美國市場生產的Model 3車輛都將會配備行人預警系統。目前，特斯拉已經更改了Model 3車型的前保險槓底部設計，揚聲器就是要加裝在...

特斯拉汽車 MODEL S MODEL X 美國股市設計電動汽車中國概念股人生第一份工作音箱 2019-09-18

'自動噴水系統演示，秒懂自噴原理'

"自動噴水滅火系統由灑水噴頭、報警閥組、水流報警裝置（水流指示器或壓力開關）等組件，以及管道、供水設施組成，並能在發生火災時噴水的自動滅火系統。一、溼式自動噴水滅火系統　　1.系統用途用於環境溫度不低於4℃，且不高於70℃的高層建築、賓館、醫院、劇院、辦公樓、倉庫、車庫、...

消防跳槽那些事兒設計 2019-09-18

'2K魅眼屏+鴻蒙OS系統+麒麟810 華為出大招了'

"今年一整年（2019年）的上半年時間，華為手機在全球銷量上佔比基本上保持第二的位置，第一就是三星的品牌。此時2019年第一季度華為的銷量反超iPhone手機品牌，這點來看，華為確實能夠讓很多網友粉絲刮目相看。然後隨著智能手機快速發展，華為今年中旬的時候，華為遭受不公與待遇...

華為手機操作系統華為公司華為榮耀智能手機設計技術三星集團人臉識別時尚耳機 2019-09-18

'小區下水道堵塞成常態？偷工減料和不良習慣是排水系統癱瘓起因'

"小區下水道經常堵塞，汙穢橫流，不堪入目，業主怨聲載道。物業隔三差五花錢清掏，受累不說，還捱罵受氣。十年不到的小區，到底是什麼原因導致下水管網頻頻陷入癱瘓？小區排水系統陷入癱瘓到底是什麼狀態？如下圖所示，下水管道內壁佈滿了雜物，可以流通的部位已經只剩下三分之一的管徑了。這個...

水汙染設計建築 2019-09-18

'大眾汽車集團計劃推出共享車載控制系統'

"【太平洋汽車網行業頻道】近日，大眾汽車集團對外表示，未來將推出一個車載控制系統，能適用於旗下所有品牌車型。該系統有點類似於安卓、AGL或者QNX等跨品牌的車載信息娛樂系統，它能夠在大眾Polo和奧迪A8等大眾汽車集團各品牌車型上運行。大眾Polo 2019款該新系統的研...

大眾汽車軟件奧迪大眾POLO 奧迪A8 大眾集團上汽集團保時捷 QNX 原汁原味的德系SUV 2019-09-18

'微服務權限系統 FEBS Cloud'

"FEBS Cloud是一款使用Spring Cloud Greenwich.SR1、Spring Cloud OAuth2和Spring Cloud Security構建的權限管理系統，前端（FEBS Cloud Web）採用vue element admin構建。FEB...

MySQL GitHub Docker Excel Redis 數據庫 ElasticSearch 2019-09-18

'汽車也來多系統？大陸推汽車駕駛艙平臺'

"【太平洋汽車網行業頻道】近日，在法蘭克福國際車展上，汽車零部件供應商大陸集團發佈了最新的集成車身電子平臺（IIP）。這種全面的軟硬件解決方案不但為未來互聯駕駛艙內的人機互動奠定了基礎，將車載電子元件從許多獨立的控制單元轉移到一些高性能計算機上，形成一套完整的解決方案。大...

德國馬牌操作系統電腦汽車展覽開源軟件硬件大眾汽車軟件 Linux 長城汽車 QNX 超級計算機技術 Android 原汁原味的德系SUV 讀書 2019-09-18

'小米正式官宣：兩款5G手機和MIUI 11系統將同時亮相'

"眾所周知，對於2019年下半年的智能手機市場，是一個5G手機爆發的階段。目前，就國內智能手機市場來說，華為、中興、vivo、三星等智能手機廠商均推出了旗下的5G智能手機。對此，雖然小米的5G手機很早之前就被曝光了，不過，其具體的發佈時間，卻一直沒有公佈。到了2019年9月...

我的第一部5G手機小米科技 MIUI 智能手機雷軍硬件華為公司設計技術步步高vivo 小米電視高通三星集團一加手機聯想集團 OPPO 2019-09-18

'日產推汽車版電競椅不僅能自動調節冷暖還內置了聲效系統'

"傳統汽車廠商跨界玩家居產品早已不是什麼新鮮事。繼福特在今年的情人節推出了任夫妻睡姿三十六變也不怕睡偏的“車道保持床”後，日產最近也突發奇想，推出了汽車主題的電競椅。如果非要將電競和開車扯上什麼關係，那它們之間最大的關聯便是：長時間保持同一坐姿使得司機和電競人員對座椅有著近...

電子競技福特汽車設計日產GT-R 跑車技術我想靜靜原汁原味的德系SUV 音箱環境保護 2019-09-18

'1100萬套需求，48V輕混系統將迎爆發期'

"隨著世界主要發達經濟體排放標準的不斷提高，為了滿足日益嚴苛的排放法規，廣大車企持續加大對於節能減排技術的研發投入。近日一則國內某知名動力電池企業與博世集團達成協議，為其在全球範圍內提供48V輕混系統動力電池的新聞讓48V輕混系統走入人們的視野，在今年的成都車展上更是亮相了...

新能源汽車菲斯克汽車節能減排技術能源 BMW 新能源電動汽車人生第一份工作保時捷電腦奧迪 Ultrasone 福特汽車成都車展設計汽車展覽 2019-09-18

推薦中...