'Hive精華問答 | Hive和傳統數據庫有什麼不同？'

數據庫 Hive Hadoop 大數據 HDFS 可視化技術 Spark MapReduce 科技百分百 2019-07-30

Hive是一個數據倉庫基礎工具，它是建立在Hadoop之上的數據倉庫，在某種程度上可以把它看做用戶編程接口（API），本身也並不存儲和處理數據，依賴於HDFS存儲數據，依賴MR處理數據。它提供了一系列對數據進行提取、轉換、加載的工具。依賴於HDFS存儲數據，依賴MR處理數據。

Q：Hive和傳統數據庫有什麼不同?各有什麼試用場景。

A：1、數據存儲位置。Hive是建立在Hadoop之上的，所有的Hive的數據都是存儲在HDFS中的。而數據庫則可以將數據保存在塊設備或本地文件系統中。

2、數據格式。Hive中沒有定義專門的數據格式，由用戶指定，需要指定三個屬性：列分隔符，行分隔符，以及讀取文件數據的方法。數據庫中，存儲引擎定義了自己的數據格式。所有數據都會按照一定的組織存儲。

3、數據更新。Hive的內容是讀多寫少的，因此，不支持對數據的改寫和刪除，數據都在加載的時候中確定好的。數據庫中的數據通常是需要經常進行修改。

4、執行延遲。Hive在查詢數據的時候，需要掃描整個表(或分區)，因此延遲較高，只有在處理大數據是才有優勢。數據庫在處理小數據是執行延遲較低。

5、索引。Hive沒有，數據庫有

6、執行。Hive是MapReduce，數據庫是Executor

7、可擴展性。Hive高，數據庫低

8、數據規模。Hive大，數據庫

Q：Hive有哪些應用場景？

A：1、Data Ingestion (數據攝取)

2、Data Discovery(數據發現)

3、Data analytics(數據分析)

4、Data Visualization & Collaboration(數據可視化和協同開發)

Q：大數據分析與挖掘方法論是哪六步活動？

A：大數據分析與挖掘方法論被稱為CRISP-DM方法，是以數據為中心迭代循環進行的六步活動，它們分別是：商業理解、數據理解、數據準備、建立模型、模型評估、結果部署。

Q:數據分析挖掘方法大致包含哪些組成部分？

A：1.分類 Classification

2.估計Estimation

3.預測Prediction

4. 關聯規則Association Rules

5. 聚類Cluster

6. 描述與可視化Description and Visualization

Q：在數據分析與挖掘中對數據的訪問性有哪些要求？

A：交互性訪問、批處理訪問、迭代計算、數據查詢，Hadoop僅僅支持了其中批處理訪問，而Spark則支持所有4種方式

Q：Hive和傳統數據庫有什麼不同?各有什麼試用場景。

A：1、數據存儲位置。Hive是建立在Hadoop之上的，所有的Hive的數據都是存儲在HDFS中的。而數據庫則可以將數據保存在塊設備或本地文件系統中。

4、執行延遲。Hive在查詢數據的時候，需要掃描整個表(或分區)，因此延遲較高，只有在處理大數據是才有優勢。數據庫在處理小數據是執行延遲較低。

5、索引。Hive沒有，數據庫有

6、執行。Hive是MapReduce，數據庫是Executor

7、可擴展性。Hive高，數據庫低

8、數據規模。Hive大，數據庫

Q：Hive有哪些應用場景？

A：1、Data Ingestion (數據攝取)

2、Data Discovery(數據發現)

3、Data analytics(數據分析)

4、Data Visualization & Collaboration(數據可視化和協同開發)

Q：大數據分析與挖掘方法論是哪六步活動？

Q:數據分析挖掘方法大致包含哪些組成部分？

A：1.分類 Classification

2.估計Estimation

3.預測Prediction

4. 關聯規則Association Rules

5. 聚類Cluster

6. 描述與可視化Description and Visualization

Q：在數據分析與挖掘中對數據的訪問性有哪些要求？

A：交互性訪問、批處理訪問、迭代計算、數據查詢，Hadoop僅僅支持了其中批處理訪問，而Spark則支持所有4種方式

福利

相關推薦

'NoSQL究竟是什麼？瞭解為什麼NoSQL數據庫不是傳統數據庫的對手'

"近年來，我們目睹了NoSQL的興起，並觀察它在各種應用中的應用。本文旨在對SQL和NoSQL技術進行客觀比較，並嘗試澄清一些不明確的方面，以幫助人們熟悉地選擇後端。我對NoSQL的態度一切都有時間，2014年我開始使用NoSQL。也許我遲到了，但我之前的項目需求完全被傳統...

NoSQL 數據庫 SQL 技術數據挖掘 Cassandra 數據結構軟件 Neo4J 設計大數據 CouchDB MemcacheDB MongoDB 文化人生第一份工作 SaaS 文章 2019-09-12

'QQ也有微粒貸？它和微信微粒貸有啥不同'

"相信大家都對微信的微粒貸有所瞭解，都說微粒貸是一個非常厲害的借款平臺！額度高達30萬，放款時間短至10分鐘，簡直秒殺支付寶的借唄有木有！不過微粒貸開通比較困難，用戶並不是很多，聽說最近騰訊在qq上推出了qq的微粒貸！那麼它們有什麼異同呢？快快來看看吧！一、相同之處:1、開...

微信騰訊QQ 騰訊大數據信用記錄關愛日支付寶 2019-09-05

'5G的商業模式與1G到4G的商業模式有什麼不一樣？'

"6月28日，由中國工信出版傳媒集團主辦，信通傳媒·通信世界全媒體承辦的“MVNO創新峰會暨2019移動轉售產業浦東研討會”在上海浦東嘉裡大酒店舉辦。GSMA大中華區戰略合作總經理葛頎表示，MVNO下一步發展可能需要著眼於行業客戶，5G將會是MVNO下一個增長的空間。從物聯...

我的第一部5G手機運營商通信大數據技術上海物聯網能源交通傳媒人生第一份工作人工智能 2019-08-31

'不同方式的python實現，它們之間的差異是什麼？'

"不同方式的python實現，它們之間的差異你們知道嗎？python從2017年開始就一直受到關注與追捧，它與高新科技人工智能相聯繫，但對於什麼是python？python能幹什麼？似乎是最為熱門的話題。這裡先解釋下：什麼是python：其實python就是是一種面向對象的...

Python Jython IronPython 編程語言 Java虛擬機 Java 數據庫 JavaScript 虛擬機編譯器程序設計人工智能技術 LLVM 網絡爬蟲 Microsoft Visual Studio 設計 Windows 黑客 2019-08-29

'小米是電視業恥辱？榮耀有不同意見，華為智能家居戰略深度解讀'

"2019年8月10日，華為榮耀在東莞籃球中心舉行了首款搭載鴻蒙操作系統的終端榮耀智慧屏，正式加入了電視的戰場。也標誌著過去看似塵埃落定的電視大戰，又有了新的攪局者加入。而據外媒Mysmartprice透露，另一家手機廠商一加正準備進入智能電視領域。Mysmartprice...

華為榮耀華為公司小米電視智能電視技術智能家居小米手機移動互聯網餘承東平板電腦 Wi-Fi 一加手機算法藍牙大數據藍牙耳機操作系統人機交互籃球中央處理器 GPU NFC 耳機東莞音箱 2019-08-28

'左氧氟沙星與環丙沙星和莫西沙星有什麼區別？不合理用法有哪些？'

"喹諾酮類藥物為濃度依賴性抗菌藥物，臨床適應證非常廣泛，除呼吸道外，還可用於治療泌尿生殖道、皮膚軟組織等各類感染。喹諾酮類藥物各有什麼特點？臨床應用最為廣泛的三種喹諾酮類藥物為左氧氟沙星、莫西沙星和環丙沙星，個性分明，各具特點。1. 左氧氟沙星：具有良好的抗菌活性，包括對肺...

藥品癲癇肺炎鏈球菌肺炎流感嗜血桿菌結核桿菌數據庫 2019-08-23

'同一酒店同一房型價格不同，大數據“殺熟”有多狠？你中過招嗎？'

"最近市民關先生遇到了一件"離奇事兒"，前幾天關先生在上海度假，他用旅行網站的手機客戶端訂房時發現，自己的賬號和家人的帳號搜索同一家酒店的同一種房型，價格竟然不一樣。1關先生用自己的去哪兒網手機客戶端搜索"上海愛莎堡酒店式公寓"的神奇飛俠親子房，價格是468元一間，"上海漫...

酒店去哪兒網大數據上海技術 2019-08-07

雲ERP和傳統ERP有什麼區別？

ERP是必不可少的管理軟件，但是隨著雲計算的推出和普及，雲計算以其強大而便捷的功能席捲市場，ERP也順應潮流，開始雲化，雲ERP對很多企業都是一個很陌生的...

SaaS 軟件雲計算技術數據庫市場營銷人生第一份工作軟件設計設計瀏覽器數據結構 2019-07-13

如何用形象的比喻描述大數據Hadoop、Hive、Spark 之間是什麼關係

問題：如何用形象的比喻描述大數據的技術生態？Hadoop、Hive、Spark 之間是什麼關係？對於我們這些文科，商科生來說。我們剛剛搞懂服務器，數據庫，...

Spark Hadoop 大數據 Hive HDFS MapReduce 技術數據庫算法 BigTable 腳本語言工程師 Cassandra Java 彙編語言 GFS 設計程序員 HBase 2019-07-10

都在提雲ERP，與傳統ERP到底有什麼不同？

在過去20年中，ERP對全球經濟以及社會發展中起到了很大的作用。隨著雲計算新興技術的日趨成熟以及逐步深入應用到很多領域。如今，我們一直在談論的ERP已逐步...

雲計算軟件電腦高能小子終極裝備數據庫硬件經濟平板電腦可視化技術技術跳槽那些事兒智能手機 2019-07-04

百度智能小程序與微信小程序有什麼不同？可以一起開發嗎？

今天的toC市場已經是騰訊、百度等互聯網巨頭的天下，但隨著C 端的創新空間不斷壓縮，流量成本水漲船高， toB已經成為巨頭們統治領域之外最大的金礦。但to...

百度微信移動互聯網騰訊百度地圖市場營銷技術京東商城百度貼吧 iOS 愛奇藝電子商務人工智能 Bilibili Android 數據庫 Windows 裝修 2019-07-03

深耕內容、放大IP價值，2019萬達之夜有什麼不同？｜上影節觀察

文 | 浮萍2019年的上影節是特殊的。雖然這一節上影節的氛圍受到了整體宏觀環境的影響，出現了一些調整的趨勢，但是行業領袖們更多地站出來聲援，當下唯有團...

萬達集團萬達電影華語電影黃建新李少紅傳奇影業傳媒電視劇萬物生長侏羅紀公園2 姜偉人生第一份工作大數據市場營銷鬼吹燈我不是藥神環太平洋 2019-06-23

Docker精華問答 | 數據庫為什麼不適合放在 Docker 中運行？

戳藍字“CSDN雲計算”關注我們哦！Docker 是一個開源的應用容器引擎，讓開發者可以打包他們的應用以及依賴包到一個可移植的容器中，然後發佈到任何流行的...

Docker 數據庫 Linux 雲計算虛擬機 CentOS 區塊鏈 CSDN Red Hat Enterprise Linux 算法 Ubuntu 物聯網人工智能 Windows CNN 2019-06-11

考上“公務員”或“研究生”，有什麼不一樣

大學本科畢業之後，考上公務員或研究生，有什麼不一樣？對於這個問題，很多人並沒有認真思考。尤其是那些選擇當公務員和選擇讀研究生的同學，在今後發展上的差距，又...

公務員跳槽那些事兒大學中國研究生入學考試人工智能大數據 2019-06-06

面試題：redis 的持久化有幾種？不同的持久化機制有什麼優缺點？

面試題redis 的持久化有哪幾種方式？不同的持久化機制都有什麼優缺點？持久化機制具體底層是如何實現的？面試官心理分析redis 如果僅僅只是將數據緩存在內存裡面，如果 redis 宕機了再重啟，內存裡的數據就全部都弄丟了啊。你必須得用 redis 的持久化機制，將數據寫入...

Redis 雲計算數據庫跳槽那些事兒阿里雲計算 MySQL 亞馬遜公司 2019-05-27

5G精華問答 | 大數據和5G有什麼關係？

戳藍字“CSDN雲計算”關注我們哦！即將到來的5G，通過提升連接速率，提升了“人聯網”的感知，也促進了人類主動創造數據。另一方面，它更多是為“物聯網”服務...

大數據雲計算物聯網技術 TD-LTE 運營商中國移動 CSDN 硬件能源通信區塊鏈愛立信程序員 2019-05-09

大數據、雲計算、數據中心三者之間有什麼不同？

前言：不少人把數據中心、雲計算數據中心、大數據搞混淆，覺得這三者是一樣的產品，其實有顯著的區別，數據中心機房是一整套複雜的設施，如今，雲計算即將成為信息社會的公共資源，而數據中心則是支撐雲計算服務的基礎設施，所以自從雲計算橫空出世，一切信息技術都開始圍著它轉，雲計算有如神一...

??? 雲計算技術數據庫移動互聯網數據挖掘物聯網 ?? 電子商務通信瀏覽器 2019-04-26

支撐起寶駿鑽石標的首款車型，新寶駿RS-5有何與眾不同？

翹首踱步眼欲穿，終於，明日（11日），上海黃浦江畔的國際時尚中心，“新寶駿品牌之夜”將在這裡舉行。懸掛著寶駿鑽石標的首款車型RS-5也將上市，肩負著寶駿4...

寶駿汽車無人駕駛鑽石設計上汽通用五菱豪華車時尚人機交互特斯拉汽車上汽集團大數據平板電腦雷達 2019-04-11

10年前的數據庫有什麼好聊的……

說起 SQL Server，小編其實是有複雜的感情的。在 Wikipedia 裡面搜索“SQL Server”，得到的第一個解釋是這樣的（這是懂歷史的，而...

數據庫 Microsoft SQL Server SQL 微軟 Azure 軟件虛擬機技術維基百科 IaaS Windows Windows Server 2019-04-08

虛擬化精華問答 | 虛擬化的關鍵技術有哪些？

在實際的生產環境中，虛擬化技術主要用來解決高性能的物理硬件產能過剩和老的舊的硬件產能過低的重組重用，透明化底層物理硬件，從而最大化的利用物理硬件。今天就讓...

技術虛擬機硬件電腦操作系統中央處理器程序員物理雲計算防火牆大數據英特爾固態硬盤環境保護 2019-04-05

推薦中...