大數據分析工具——hive入門

MySQL 編程語言大數據 Facebook 靜雅惜靈 2017-04-17

作者：2551529836

Hive

** Facebook開源

** 官網：hive.apache.org

** Hive是基於Hadoop的一個數據倉庫工具

Hive與數據庫：

數據庫: mysql、oracle、DB2、sqlserver

數據倉庫 !== 數據庫換言之, Hive不是數據庫

為什麼要選擇hive

** MapReduce編程成本高

** 針對傳統的DBA,不會不熟悉java,要想數據分析,藉助Hive

Hive簡介：

** 流程

** hql --> Hive(java) --> mapreduce -->yarn --> hdfs

** 本質: 將HQL轉化成MapReduce程序

** 使用MapReduce計算模型，運行在yarn平臺之上

** Hive適合離線批量處理,延時比較大

** 不適合在線業務實時分析結果,業務要求延時較低的場景不適合

Hive體系結構

** 用戶接口: Client

** 終端命令行CLI --主要的一種使用方式

** JDBC方式 --幾乎不用

** 元數據：metastore

** 默認apache使用的是derby數據庫(只能有一個客戶端使用),CDH使用postgreDB

** 企業通常我們會選擇另外一種mysql來存儲

** 元數據包括：表名、表所屬的數據庫（默認是default）、

表的擁有者、列/分區字段、表的類型（是否是外部表）、

表的數據所在目錄等

** 這裡並沒有存儲Hive表的真實數據

** Hadoop

** 使用HDFS進行存儲

** 使用MapReduce進行計算

** 驅動器: Driver

** 解析器：解析Hql語句

** 編譯器：把sql語句翻譯成MapReduce程序

** 優化器：優化sql語句

** 執行器：在yarn平臺運行MapReduce程序

====Hive安裝======================================================

** 版本 0.13.1(和後面使用到的框架兼容性好)

hive安裝所需要的環境：

1、安裝JDK，然後測試

$ java -version

2、安裝Hadoop

** 確保Hadoop可以正常使用(測試：上傳文件、或者運行jar)

$ hdfs dfs -mkdir /input2 #在HDFS上創建文件夾，沒有類似-cd進入目錄的參數

$ hdfs dfs -mkdir -p /aaa/bbb/ccc #級聯創建目錄

$ hdfs dfs -ls / #查看

$ hdfs dfs -put b.txt /input #把本地文件拷到HDFS

$ hdfs dfs -cat /input2/b.txt #查看文件

$ hdfs dfs -rm /input2/b.txt #刪除文件

$ hdfs dfs -rmr /input? #遞歸刪除文件夾和裡面的文件，推薦使用'-rm -r'格式；單字符通配符'?'

$ hdfs dfs -help

3、安裝mysql

$ su -

# yum -y install mysql --安裝mysql客戶端、常用命令

# yum -y install mysql-server --mysql服務

# yum -y install mysql-devel --mysql develop擴展包

***以上可以合併為一句，-y表示所有提問回答都為yes

# yum -y install mysql mysql-server mysql-devel

# rpm -qa|grep mysql --查看安裝的mysql

# rpm -ql mysql-server-5.1.73-7.el6.x86_64 --查看安裝位置

# rpm -e --nodeps mysql-server-5.1.73-7.el6.x86_64 --卸載，nodeps:不檢查依賴

# service mysqld start --啟動mysql服務

# chkconfig mysqld on --設置開機啟動

# /usr/bin/mysqladmin -uroot password 'root' --初始化密碼，只能執行一次

給用戶授權：

# mysql -uroot -proot

*** grant 權限 on 數據庫對象(數據庫.表) to 用戶

mysql> grant all on *.* to root@'blue01.mydomain' identified by 'root';

mysql> flush privileges; #刷新授權表，可以不執行

mysql> set password for root@localhost = password('root'); --修改密碼

mysql> show databases;

** mysql數據庫默認只允許root用戶通過localhost(127.0.0.1)來登錄使用

** 想要使用Windows上的Navicat登錄，需要授權

** mysql> grant all on *.* to root@'192.168.122.1' identified by 'root';

附：yum命令和rpm命令安裝的都是rpm包

yum安裝包的來源: 來自互聯網(由倉庫配置文件指定)

rpm安裝包的來源: 先提取現在需要安裝的軟件包

----------------------

4、開始安裝Hive

# su - tom

$ tar zxf /opt/softwares/apache-hive-0.13.1-bin.tar.gz

** 在conf/目錄：

$ cp -a hive-env.sh.template hive-env.sh --重命名，-a連同原來屬性一起復制

$ cp -a hive-default.xml.template hive-site.xml

5、修改hive-env.sh

JAVA_HOME=/opt/modules/jdk1.7.0_67

HADOOP_HOME=/opt/modules/hadoop-2.5.0

export HIVE_CONF_DIR=/opt/modules/apache-hive-0.13.1-bin/conf

6、配置hive-site.xml，注意：用戶名和密碼不可以有空格

<name>javax.jdo.option.ConnectionURL</name>

<value>jdbc:mysql://blue01.mydomain:3306/metastore?createDatabaseIfNotExist=true</value>

</property>

<name>javax.jdo.option.ConnectionDriverName</name>

<value>com.mysql.jdbc.Driver</value>

</property>

<name>javax.jdo.option.ConnectionUserName</name>

</property>

<name>javax.jdo.option.ConnectionPassword</name>

</property>

7、拷貝mysql驅動到lib/

** 若是jar已解壓，則不必執行這步：$ tar zxf mysql-connector-java-5.1.27.tar.gz

$ cp mysql-connector-java-5.1.27-bin.jar /opt/modules/apache-hive-0.13.1-bin/lib/

** /tmp存放臨時文件

$ bin/hadoop fs -chmod g+w /tmp #給用戶組加上寫的權限

** /user/hive/warehouse為Hive存放數據的目錄

$ bin/hdfs dfs -mkdir -p /user/hive/warehouse

$ bin/hadoop fs -chmod g+w /user/hive/warehouse

9、啟動客戶端使用Hive

$ bin/hive --用法幾乎跟mysql一樣

hive> show databases;

相關推薦

'《幽靈行動：斷點》b測大數據出爐玩家累計滅敵123億'

"育碧旗下新作《幽靈行動：斷點（Tom Clancys Ghost Recon: Breakpoint）》在9月5日至9月9日期間進行了Beta測試，今天育碧官方公開了這次Beta測試的大數據統計圖，為玩家統計了遊戲中各種道具、槍械、殺敵數等。一起來看看吧。在這次測試期間共...

幽靈行動育碧軟件大數據 PlayStation Xbox Xbox One 2019-09-19

'大西安樓市版圖“一路向西”商品房均價近兩萬能否支撐灃西新城發展？'

"今年以來，多個純新盤接二連三亮相灃西新城，且開盤去化率居高不下。灃西新城何以在這場樓市的競爭中脫穎而出，其“西引力”法則有哪些？雖然灃西新城人才智力匯聚、生態環境不斷提升、地鐵路網逐步實現，但畢竟與西安主城區還是有距離，而均價近2萬元的房價能否匹配區域發展？灃西新城能成為...

西安想象偉大的一平方公里咸陽西安交通大學技術經濟渭河文化投資陝西大數據創業興平市秦嶺第二十二屆中國農加工投洽會物聯網區塊鏈大學終南山絲綢之路 2019-09-19

'明日方舟：下期哪個六星會UP？黃票商店會進誰？大數據分析'

"又到了每個月最喜歡的猜池子的時間了！現在就讓我們用大數據，以及最嚴密的邏輯推理一下下期池子。然後再被鷹角毫無邏輯的幹員UP打臉...六星幹員的UP預測為了用大數據說話，先讓我們統計一下近期UP的幹員。六星幹員：銀灰、夜鶯的上一次UP要追溯到7月11日，已經足足九個池子沒見...

大數據夜鶯德克薩斯環境汙染 2019-09-19

'比特大陸發新雲端AI推理芯片！海康陳宗年點出城市大腦兩大陷阱'

"芯潮（ID：aichip001）文 | 心緣芯潮9月17日福州報道，今天上午，比特大陸預告已久的第三代雲端AI推理芯片BM1684終於來了！該芯片採用臺積電12nm工藝製程，Winograd卷積加速下INT8算力可達35.2TOPS ，典型功耗僅16W，為視頻結構化和加...

人工智能技術算法雲計算臺灣積體電路製造公司雷州福州軟件海康威視深度學習大數據設計編譯器經濟 2019-09-19

'4.7萬億！《2019中國餐飲大數據白皮書》出爐透露了這十大機會點'

"在日前舉行的第二十屆中國美食節新聞通氣會上，中國飯店協會會長韓明介紹，今年1月份至7月份，全國餐飲業收入為24937億元，同比增長9.4%。預計全年消費規模將達4.7萬億元。那麼，對於食材企業而言，其中有哪些機會？結合中國飯店協會會長韓明的介紹以及2019中國餐飲大數據白...

快餐中式快餐大數據經濟美食博覽會投資關愛吃貨成長協會 2019-09-19

'如何找對人、選好貨、鋪對場？尼爾森快消零售大數據揭開真相'

"中國商報/中國商網（記者張濤）9月17日，尼爾森發佈了《揭祕高能市場：尼爾森中國城市快消零售大數據報告(2019)》。該報告彙集消費者、門店、地理特徵、產品及銷量等超過3萬個數據標籤，實現米級人貨場數據的立體融通。尼爾森表示，報告旨在幫助品牌商和零售商以最快速度瞭解市場...

大數據黃金技術 2019-09-18

'讓人遺憾！阿根廷輸球無緣世界盃冠軍兩大數據表現太差了'

"北京時間9月15日晚上，男籃世界盃決賽打響，阿根廷隊迎戰西班牙隊，經過四節比賽的激戰，阿根廷隊遺憾75-95輸給西班牙隊無緣冠軍，本場比賽阿根廷輸球可以說是輸在了自己的天生短板跟臨場發揮了，球隊兩大方面的表現表現有點糟糕！說阿根廷輸給了天生的短板，是因為球隊陣容的短板，那...

世界盃足球賽阿根廷西班牙大數據路易斯·斯科拉籃球的夏天越投入越精彩 2019-09-18

'優信李成彬：大數據助力二手車行業成長變革'

"優信集團業務產品中心總經理李成彬日前在“創享未來，駕馭明天”——未來出行·創新與變革跨界交流活動上，發表了主題為《大數據驅動行業變革》的演講，與在場嘉賓分享大數據的影響下優信在二手車行業的成長曆程。新興價值網幫助企業實現創新性增長李成彬表示，近幾年行業變化巨大，以電商行業...

大數據二手車技術萬物嚐鮮節人生第一份工作京東商城 2019-09-18

'海盜遊戲《ATLAS》結合大數據制定新計劃，玩家50%時間在海上活動'

"作為全Steam最大的一款航海遊戲，海盜冒險生存遊戲《ATLAS》給我們帶來的第一直觀體驗就是規模宏偉，它有著4.5萬平方公里的地圖以及900多個小島嶼，而玩家則會在這款遊戲裡面和4萬個玩家一起作戰，感受由《ATLAS》帶來的真實海戰。然而最近《ATLAS》卻在分析玩家行...

大數據航海 Steam 生存遊戲 2019-09-18

'手遊大數據：川渝玩家偏愛棋牌？王者榮耀等MOBA遊戲用戶粘性最高'

"今天（9.17）國內移動互聯網大數據公司QuestMobile，發佈了2019手機遊戲行業半年報告。該報告從行業基本發展狀況、手遊玩家差異化特點、手遊流量以及遊戲推廣方式等多個方面用數據敘述了上半年國內手機遊戲行業內的一些情況。手遊行業收入增速擴大，活躍用戶規模呈現持續向...

網絡遊戲 Qwangzherongyao 大數據市場營銷廣東移動互聯網消除類遊戲四川人生第一份工作 2019-09-18

'淺析大數據技術及其行業產品'

"大數據，IT行業的又一次技術變革，大數據的浪潮洶湧而至，對國家治理、企業決策和個人生活都在產生深遠的影響，並將成為雲計算、物聯網之後信息技術產業領域又一重大創新變革。未來的十年將是一個“大數據”引領的智慧科技的時代、隨著社交網絡的逐漸成熟，移動帶寬迅速提升、雲計算、物聯網...

大數據技術數據庫數據挖掘 NoSQL 算法硬件設計雲計算物聯網 MapReduce 可視化技術投資 SQL GFS 人工智能風行網思科系統經濟歷史社交網絡 Google 2019-09-18

'“蓮蓉蛋黃”月餅銷量最好月餅大數據——銷量同比增52%'

"中新社北京9月12日電 (記者周銳)在中秋節來臨之際，月餅的銷售又一次成為熱門話題。京東大數據研究院日前披露了一份研究報告，展示了節前兩週京東平臺月餅銷售的相關情況。資料圖：上海民眾排隊購買鮮肉月餅。湯彥俊攝從總量上看，2019年中秋節前兩週全國月餅銷量是去年同期的1...

最圓不過中秋月蓮茸大數據蜜餞廣東糕點江蘇河北堅果芝麻豆沙上海奶黃湖北河南京東商城五仁浙江省安徽黑龍江省水果山東葡萄酒海鮮遼寧重慶福建酒貴州 2019-09-18

'市場 | 電力大數據如何服務社會？國網大數據中心促進數據增值變現落地應用'

"2019中國國際智能產業博覽會國家電網展區內，重慶市民劉華龍聚精會神地聽了工作人員講解，感慨地說：“之前與國家電網的接觸僅僅是買電，沒想到你們研發的產品還可以用來支撐政府決策，幫助中小企業解決融資難題。”國家電網有限公司在2019智博會上集中展示了57項泛在電力物聯網建設...

大數據經濟國家電網投資物聯網重慶金融能源數據挖掘人生第一份工作上海可視化技術算法南京安徽 2019-09-18

'計算機專業已過時？這五大“計算機專業”人才缺口大，畢業就高薪'

"隨著我國社會的發展，在大背景的情況下，計算機專業已經成為了一個熱門的專業。在當前巨大的就業壓力形勢下，擁有一個好的專業，在就業方面顯然是更有優勢的，而計算機就是一個很有優勢的專業。然而在社會上卻是有一些言論說，計算機專業已經飽和，並且是過時了，那麼這些言論是真實的嗎？我們...

電腦信息安全人生第一份工作大數據人工智能雲計算軟件工程 PHP Java 2019-09-18

'“兩岸烽火必再起！”孫大千批民進黨為勝選將臺灣推向戰爭'

"韓國瑜幕僚、“立委”參選人孫大千批評，民進黨為了要贏得明年“大選”，想盡各種辦法要把臺灣推向戰爭的邊緣。孫大千在臉書貼文指出，在中美貿易戰打得如火如荼之際，高喊“臺美建交”，不是擺明了把臺灣送給特朗普當槍來使嗎？哪壺不開提哪壺的結果，就是逼迫北京對臺採取更強硬和激烈的措施...

臺灣蔡英文 Facebook 2019-09-18

'14日大數據：美國隊恥辱記錄彙總，老司機當選主席！MVP候選出爐'

"米切爾16分美國勝波蘭鎖第7；博格丹31分塞爾維亞排第51、14日之星：博格丹諾維奇31分4板3助7記三分當選男籃世界盃已經結束了9月14日的兩場排位賽，我們結合各球員的表現評選出了“今日之星”，塞爾維亞後衛博格丹-博格丹諾維奇當選。在塞爾維亞以90-81擊敗捷克的比賽中...

世界盃籃球賽德克·諾維茨基斯蒂芬·庫裡世界盃足球賽路易斯·斯科拉埃文·特納越投入越精彩法國男籃勒布朗·詹姆斯波特蘭開拓者布魯克林籃網維克托·奧拉迪波塞爾維亞丹佛掘金弗拉德·迪瓦茨詹姆斯·哈登印第安納步行者本·華萊士達米恩·利拉德安東尼·戴維斯波蘭凱里·歐文大數據喬爾·恩比德休斯頓火箭亞當·博格丹洛杉磯快船洛杉磯湖人科懷·倫納德密爾沃基雄鹿歐洲費城76人捷克比利·多諾萬傑梅因·奧尼爾蘇聯德國阿根廷阿根廷男籃奧林匹克運動會法國馬丁·喬爾俄羅斯新西蘭沙奎爾·奧尼爾舊金山加拿大 2019-09-18

'關注 | 2019世界計算機大會，看看大咖們都在聊什麼？'

"“計算萬物湘約未來”9月10日2019世界計算機大會在長沙梅溪湖國際文化藝術中心隆重開幕在開幕式與主論壇上，中國科學院院士、中國人民解放軍軍事科學院院長楊學軍，諾貝爾經濟學獎獲得者芬恩·基德蘭德等17位來自計算、網絡技術等相關領域的著名專家、學者作主題演講。共同探討計算...

電腦技術網絡安全機器人操作系統芬恩·基德蘭德黑客人工智能軟件智能手機楊學軍大數據設計經濟湖南跳槽那些事兒中國電子科技集團物聯網人生第一份工作諾貝爾獎諾貝爾經濟學獎大學長沙國防科學技術大學金融文化習近平藝術 2019-09-18

'優信成長的關鍵在於大數據，李成彬分享全國購成長曆程'

"【獵雲網北京】9月12日報道近日，優信集團業務產品中心總經理李成彬在“創享未來，駕馭明天”——未來出行·創新與變革跨界交流活動上，發表了主題為《大數據驅動行業變革》的演講，與在場嘉賓分享大數據的影響下優信在二手車行業的成長曆程。新興價值網幫助企業實現創新性增長近幾年行業變...

大數據技術二手車萬物嚐鮮節京東商城人生第一份工作 2019-09-18

'阿里巴巴在一個10年技術大會上的祕辛往事'

"擁抱社會，擁抱變化，擁抱未來，阿里想要並正在這麼做。出品／新摘商業評論撰文／子雨曾有人把杭州比為一座“把中國帶上雲”的城市，而當“雲”逐漸成為一種基礎設施，“在雲上再造生態”又成為了新的命題。出題的是全社會，解題的卻要到杭州西湖區之江的雲棲小鎮去尋找。“雲計算和大數據”賦...

阿里巴巴集團阿里雲計算技術雲計算移動互聯網大數據數據庫操作系統微軟微軟亞洲研究院蓮池祩宏杭州 IBM 馬雲電子商務電腦 EMC 分佈式計算工程師經濟程序員 2019-09-18

'遭空頭大鱷查諾斯“炮轟”，特斯拉真的“一文不值”？'

"Kynikos Associates的創始人兼總裁吉姆•查諾斯(Jim Chanos)長期做空特斯拉股票。2017年，這位著名的對衝基金經理在接受CNBC採訪時提到特斯拉時說，“我們認為特斯拉的股票一文不值。”查諾斯似乎並不不認同特斯拉的商業模式，也不認同首席執行官埃隆·...

特斯拉汽車標準普爾證券投資基金對衝基金投資伊隆·馬斯克 Facebook 領航投資 2019-09-17

推薦中...