Hadoop在工業大數據中的作用

大數據 Hadoop HBase MapReduce 大海滔滔 2017-06-08

現在，一談到大數據的技術，Hadoop都是繞不開的話題，似乎在項目中不使用Hadoop或者類似的分佈式數據庫技術，就不是大數據應用。那麼，到底在工業大數據應用中，沒有沒必要使用Hadoop，或者在什麼樣的應用環境中使用Hadoop才是適合的呢？

首先，讓我們來看一看Hadoop是什麼，它是為解決什麼問題而發展起來的。

簡單說，Hadoop是一個能夠對大量數據進行分佈式處理的軟件框架。它包含眾多的應用，其最核心的是分佈式文件系統HDFS（Hadoop Distributed File System）、分佈式計算框架MapReduce。2003年Google發表了一篇技術學術論文詳細講解了谷歌文件系統（GFS），2004年Google又發表了一篇技術學術論文講解了MapReduce。2004年Nutch創始人Doug Cutting基於Google的GFS論文實現了分佈式文件存儲系統名為NDFS。2005年Doug Cutting又基於MapReduce，在Nutch搜索引擎實現了該功能。2006 年，Apache將Map/Reduce 和 Nutch Distributed File System (NDFS) 分別被納入稱為 Hadoop 的項目中。從此，Hadoop作為開源界的分佈式大數據處理框架開始迅速流行起來。

Hadoop除了核心HDFS和MapReduce外，還有許多實現具體應用的子項目，其核心組件如下圖所示：

Hadoop在工業大數據中的作用

Hadoop核心組件

具體每個組件的功能我們改天另文介紹。今天主要談談Hadoop的優點和適用領域。Hadoop由於其自身的特點，在以下場景中有比較大的優勢：

1、存儲大量的半結構化的數據集。由於HDFS會將一個完整的大文件平均分塊存儲到不同計算機上，所以一個磁盤的失敗並不會帶來數據丟失。同時，在讀取文件時，系統也是同時從多個主機取不同區塊的文件，因此效率要比傳統數據庫高許多。

2、高效的分佈式計算。通過MapReduce，可以快速地跨多臺機器處理大型數據集合。實現高效的分佈式計算。

3、低廉的部署成本。Hadoop由於其分佈式架構，可以使用普通的廉價計算機組合成數據集群來實現以前只有大型高性能計算機實現的工作。

但是，在工業大數據領域，並不是所有場合都需要或者適宜使用Hadoop這樣的系統。

工業大數據項目一般有以下幾種情況：

一種是針對單一的生產企業內部建設的工業大數據項目，那麼，它的數據主要是企業內部的設備產生的監控數據，這些數據雖然相比傳統組態等應用量很大了，但是，並達不到需要分佈式計算這麼大的數據量和計算量。這種情況下，這部分數據可以選擇傳統的工業實時數據庫，或者使用Hadoop的組件Hbase，也可以使用基於Hbase的OpenTSDB，基本就可以滿足存儲、處理的需要。

另一種是大型集團企業內部的工業大數據項目，由於其監測的設備非常多，產生的數據量巨大，需要的運算量也巨大。那麼，可以考慮在集團公司部署Hadoop環境，或者使用公有云的Hadoop服務（比如阿里雲、百度雲、騰訊雲等），使用Hbase存儲監控數據，同時存儲大量的非結構化數據，在數據積累到一定程度時，再進行大數據的分析應用。

還有一種是針對企業銷售出去的產品建設的工業大數據項目，例如，某汽車企業將其所有的汽車進行聯網監測（特斯拉現在就在做這件事）。這樣的項目，尤其是大型企業的產品數量是海量的，其監測數據也是海量的，這種情況在目前比較適合的就是自行建設Hadoop環境。但是遠期看，隨著公有云技術的逐步成熟，與公有云服務商合作應該會是一種主流。

說白了，小型的項目，不太用得著分佈式計算，一般不建議使用Hadoop。當然，小型項目還是不是嚴格意義上的大數據項目也很難說。中型的項目，建議採用公有云提供的Hadoop環境，也不要自己搭建，成本和收益實在不成比例。大型的項目，當前的實際情況比較適合自行搭建Hadoop環境，遠期，除非是中移動、中石油這樣的巨無霸企業，還是搭建在公有云上為好。

相關推薦

'《幽靈行動：斷點》b測大數據出爐玩家累計滅敵123億'

"育碧旗下新作《幽靈行動：斷點（Tom Clancys Ghost Recon: Breakpoint）》在9月5日至9月9日期間進行了Beta測試，今天育碧官方公開了這次Beta測試的大數據統計圖，為玩家統計了遊戲中各種道具、槍械、殺敵數等。一起來看看吧。在這次測試期間共...

幽靈行動育碧軟件大數據 PlayStation Xbox Xbox One 2019-09-19

'成都房價下跌誰先帶頭，3大數據判斷樓市現狀'

"點右上關注，獲得更多樓市信息與房價數據下面是幾篇閱讀量近100萬，收藏率、轉發率最高的文章，值得一看：房產過戶給子女的6種方法，注意其中的隱患，一不小心多付20%樓市風險多：買房交首付時9大注意事項，不能簽字交錢就完事樓市實戰：買房後悔時，七大方法幫你退回房子定金。附法律...

成都二手房大數據購房投資雙流 2019-09-19

'餐飲的下一個增長點，藏在餐飲信息化中'

"文丨職業餐飲網焦逸夢近些年，以海底撈、王品為代表的一大波企業都在用大數據做賦能！用餐飲SaaS做連鎖，已成不少連鎖餐企的共識！這也恰恰符合當下的餐飲環境，餐飲生意越難做，越需要降本增效！在這種情況下，餐飲SaaS行業也開始和餐飲行業融合共生！但由於信息不對稱，許多餐飲企...

SaaS 餐飲大數據人生第一份工作市場營銷軟件移動支付跳槽那些事兒技術金融海底撈阿里雲計算工程師德克士 2019-09-19

'中醫治房顫 | 連載11：早搏是怎麼回事？'

"《中醫治心臟病》第二章第3節：早搏是怎麼回事？偶爾有個早搏不需要治，頻發早搏還是需要治，西醫沒有什麼好辦法，中醫治療很有效。——馬寶琳早搏是怎麼發生的？正常心臟跳動是非常規律的，比如一分鐘跳60次，那就是一秒鐘一次，非常準。如果有一次心跳是還沒到一秒就提前跳了，就是早搏...

心臟病中醫打地鼠手術兩百年大數據 2019-09-19

'中秋之夜吃喝玩樂消費北京居首位'

"夜間經濟逐漸幫助北京挑起消費大梁。北京市商務局發佈的中秋節消費數據顯示，夜間消費在各個領域表現強勁。其中，夜間餐飲、休閒娛樂等消費總訂單量同比增長26%，居一線城市首位。北京的多個商圈也開展“不打烊”活動，為中秋節的夜空添加了新的亮色。多商圈夜間消費人次過萬夜間消費與一個...

最圓不過中秋月中秋節燒烤快餐大數據糕點西安泡饃歷史中華絨螯蟹關愛吃貨成長協會小吃三里屯火鍋鴨月球文化京東商城馬連良中國銀聯麵包美團網 2019-09-19

'4.7萬億！《2019中國餐飲大數據白皮書》出爐透露了這十大機會點'

"在日前舉行的第二十屆中國美食節新聞通氣會上，中國飯店協會會長韓明介紹，今年1月份至7月份，全國餐飲業收入為24937億元，同比增長9.4%。預計全年消費規模將達4.7萬億元。那麼，對於食材企業而言，其中有哪些機會？結合中國飯店協會會長韓明的介紹以及2019中國餐飲大數據白...

快餐中式快餐大數據經濟美食博覽會投資關愛吃貨成長協會 2019-09-19

'如何找對人、選好貨、鋪對場？尼爾森快消零售大數據揭開真相'

"中國商報/中國商網（記者張濤）9月17日，尼爾森發佈了《揭祕高能市場：尼爾森中國城市快消零售大數據報告(2019)》。該報告彙集消費者、門店、地理特徵、產品及銷量等超過3萬個數據標籤，實現米級人貨場數據的立體融通。尼爾森表示，報告旨在幫助品牌商和零售商以最快速度瞭解市場...

大數據黃金技術 2019-09-18

'德媒：經濟科技進步增強中國人自信心'

"德國《每日鏡報》網站9月4日刊登題為《中國之光》的報道稱，從北京到柏林的航班上，一箇中國旅行團的團員們在大聲交談，周圍好幾排人都能聽到他們的談話。他們大多是退休人員，第一次到歐洲旅遊，在談論自己的孫子，談論想要在旅途中購買什麼東西。飛機降落後，他們興奮地高喊：“這是柏林！...

德國經濟技術柏林習近平人工智能農村華為公司歐洲大數據 2019-09-18

'夜間經濟成中秋節消費擔當多商圈夜間消費人次過萬'

"北京市商務局發佈中秋節消費數據顯示，節日期間夜間餐飲、休閒娛樂等消費總訂單量同比增長26%，居一線城市首位。據銀聯大數據顯示，國貿、三里屯等商圈18點至次日凌晨6點夜間消費尤為活躍，消費人次過萬。夜間經濟逐漸幫助北京挑起消費大梁。北京市商務局發佈的中秋節消費數據顯示，夜間...

最圓不過中秋月中秋節經濟三里屯燒烤大數據糕點西安泡饃關愛吃貨成長協會中華絨螯蟹快餐火鍋文化順義鴨歷史 2019-09-18

'讓人遺憾！阿根廷輸球無緣世界盃冠軍兩大數據表現太差了'

"北京時間9月15日晚上，男籃世界盃決賽打響，阿根廷隊迎戰西班牙隊，經過四節比賽的激戰，阿根廷隊遺憾75-95輸給西班牙隊無緣冠軍，本場比賽阿根廷輸球可以說是輸在了自己的天生短板跟臨場發揮了，球隊兩大方面的表現表現有點糟糕！說阿根廷輸給了天生的短板，是因為球隊陣容的短板，那...

世界盃足球賽阿根廷西班牙大數據路易斯·斯科拉籃球的夏天越投入越精彩 2019-09-18

'為什麼說造電動汽車的特斯拉是一家數據公司'

"來源：汽車之心作者：葉方提到特斯拉，大家總會不自覺站成兩個陣營：一方將這家電動車公司捧上天；另一方則唱衰，認為它最終會被對手們幹掉。換句話說，特斯拉要麼一勞永逸改變汽車行業，要麼就會在不久的將來關張。不過，如果我們放下財務、競爭和Elon Musk這個神奇的存在，從理性...

特斯拉汽車電動汽車人工智能伊隆·馬斯克技術無人駕駛大數據算法電腦軟件數據庫機器學習人機交互硬件眾包石油雷達 2019-09-18

'中秋假期餘額已不足，熱力圖顯示濟南多處仍“走紅”'

"假期餘額已不足，持續狂歡充值！中秋節三天的假期已進入尾聲，也許你剛告別家人，帶著一後備箱的“愛”踏上返程的路；也許你還在依依不捨，和家人享受假期最後的溫馨時光；也許你很幸運不必奔波，正抓緊假期的尾巴，享受自己的生活……不管你在哪裡，希望今年中秋月色掃過的你，能洗去一身疲憊...

濟南中秋節交通大數據高峰萬達集團新聞 2019-09-18

'優信李成彬：大數據助力二手車行業成長變革'

"優信集團業務產品中心總經理李成彬日前在“創享未來，駕馭明天”——未來出行·創新與變革跨界交流活動上，發表了主題為《大數據驅動行業變革》的演講，與在場嘉賓分享大數據的影響下優信在二手車行業的成長曆程。新興價值網幫助企業實現創新性增長李成彬表示，近幾年行業變化巨大，以電商行業...

大數據二手車技術萬物嚐鮮節人生第一份工作京東商城 2019-09-18

'中秋假期珠海接待旅客超過96萬人次'

"文/羊城派記者錢瑜珠海海泉灣度假區的音樂節吸引了不少遊客（圖片來源：珠海海泉灣度假區微信公眾號）15日，羊城派記者從珠海市文化廣電旅遊體育局獲悉，今年中秋期間，珠海市共接待遊客96.16萬人次，同比增長1.1%，其中接待過夜遊客24.1萬人次，同比增長1.3%；實現旅遊...

珠海體育江蘇東莞廣州佛山中山酒店浙江省深圳上海江門文化中秋節澳門廣西新加坡春節泰好玩湖南書店大數據 2019-09-18

'中秋假期京城豬肉、果蔬等貨源充足餐飲交易火爆'

"來源：中新網中秋節期間,北京餐飲企業推出寓意團圓、親情的菜品及秋季養生菜餚,吊足消費者胃口。北京市商務局15日公佈的數據顯示,單是一家外賣網上訂餐平臺假日三天的餐飲交易額已超6億元(人民幣,下同),同比增長16%,尤其是夜間餐飲、休閒娛樂等消費總訂單量同比增長26%。15...

中秋節最圓不過中秋月京城十二時辰關愛吃貨成長協會小吃麵包快餐西安燒烤京菜糧油大數據雞蛋中華絨螯蟹王府井蔬菜三里屯寶貝過大年泡饃燕窩經濟 2019-09-18

'海盜遊戲《ATLAS》結合大數據制定新計劃，玩家50%時間在海上活動'

"作為全Steam最大的一款航海遊戲，海盜冒險生存遊戲《ATLAS》給我們帶來的第一直觀體驗就是規模宏偉，它有著4.5萬平方公里的地圖以及900多個小島嶼，而玩家則會在這款遊戲裡面和4萬個玩家一起作戰，感受由《ATLAS》帶來的真實海戰。然而最近《ATLAS》卻在分析玩家行...

大數據航海 Steam 生存遊戲 2019-09-18

'手遊大數據：川渝玩家偏愛棋牌？王者榮耀等MOBA遊戲用戶粘性最高'

"今天（9.17）國內移動互聯網大數據公司QuestMobile，發佈了2019手機遊戲行業半年報告。該報告從行業基本發展狀況、手遊玩家差異化特點、手遊流量以及遊戲推廣方式等多個方面用數據敘述了上半年國內手機遊戲行業內的一些情況。手遊行業收入增速擴大，活躍用戶規模呈現持續向...

網絡遊戲 Qwangzherongyao 大數據市場營銷廣東移動互聯網消除類遊戲四川人生第一份工作 2019-09-18

'中秋小長假，安全出行指南！'

"中秋月圓，是走親訪友、家人團聚、親朋組團出遊好時節，省內熱點景區、近郊風景區、重點旅遊區周圍道路交通壓力將明顯增加。中秋放假通知中秋假期從9月13日至15日放假三天全省高速公路不免費通行為保障群眾中秋假期出行平安，河南省公安廳高速交警總隊結合高德地圖《2019年中秋出行預...

鄭州河南這就是河南大數據高峰中秋節交通焦作許昌新密方城焦作雲臺山跳槽那些事兒平頂山龍門石窟禹州高德軟件商丘孟州吉利伴你回家雲臺山體育黃河 2019-09-18

'淺析大數據技術及其行業產品'

"大數據，IT行業的又一次技術變革，大數據的浪潮洶湧而至，對國家治理、企業決策和個人生活都在產生深遠的影響，並將成為雲計算、物聯網之後信息技術產業領域又一重大創新變革。未來的十年將是一個“大數據”引領的智慧科技的時代、隨著社交網絡的逐漸成熟，移動帶寬迅速提升、雲計算、物聯網...

大數據技術數據庫數據挖掘 NoSQL 算法硬件設計雲計算物聯網 MapReduce 可視化技術投資 SQL GFS 人工智能風行網思科系統經濟歷史社交網絡 Google 2019-09-18

'“蓮蓉蛋黃”月餅銷量最好月餅大數據——銷量同比增52%'

"中新社北京9月12日電 (記者周銳)在中秋節來臨之際，月餅的銷售又一次成為熱門話題。京東大數據研究院日前披露了一份研究報告，展示了節前兩週京東平臺月餅銷售的相關情況。資料圖：上海民眾排隊購買鮮肉月餅。湯彥俊攝從總量上看，2019年中秋節前兩週全國月餅銷量是去年同期的1...

最圓不過中秋月蓮茸大數據蜜餞廣東糕點江蘇河北堅果芝麻豆沙上海奶黃湖北河南京東商城五仁浙江省安徽黑龍江省水果山東葡萄酒海鮮遼寧重慶福建酒貴州 2019-09-18

推薦中...