比MapReduce快百倍的Spark，如何快速編譯安裝

編程語言 Spark MapReduce Scala 卡弗卡大數據 2017-05-11

Spark每一個版本的編譯要求都不一樣，請大家仔細看官網說明。我們以Spark2.0的編譯和安裝做詳細步驟說明。

第一步：看官網

“Building Spark using Maven requires Maven 3.3.9 or newer and Java 7+”，這是官網的特別說明，Spark2.0的編譯必須基於Maven3.3.9和JDK1.7以上的版本。

第二步：下載Spark2.0源碼

第三步：解壓Spark源碼包

$ tar -zxf spark-2.0.0.tgz -C /opt/modules

第四步：下載安裝Maven

注意Maven的版本，http://maven.apache.org/download.cgi這是下載地址。

$ tar -zxf apache-maven-3.3.9-bin.tar.gz -C /opt/modules

第五步：Maven環境變量配置

在/etc/profile中添加如下的內容：

#MAVEN_HOME
export MAVEN_HOME=/opt/modules/apache-maven-3.3.9

export PATH=$PATH:$MAVEN_HOME/bin
export MAVEN_OPTS="-Xmx2g -XX:MaxPermSize=1024M -XX:ReservedCodeCacheSize=1024m"

第六步：驗證Maven環境

$ mvn -version

第七步：配置DNS

在/etc/resolv.conf文件中添加如下的內容：

nameserver 8.8.8.8
nameserver 8.8.4.4

第八步：設置預編譯版本號

編輯/opt/modules/spark2.0.0/dev/make-distribution.sh文件，編輯內容如下：

VERSION=2.0.0
SCALA_VERSION=2.10.4
SPARK_HADOOP_VERSION=2.5.0
SPARK_HIVE=1

保存文件。

為什麼要編輯這個文件，其實不編輯也可以執行，只是我們設置了，讓編譯跑的更快些。

第九步：開始編譯Spark2.0

$cd /opt/modules/spark-2.0.0/dev/

$./make-distribution.sh --tgz -Pyarn -Phadoop-2.4 -Dhadoop.version=2.5.0 -Phive -Phive-thriftserver -Phive-0.13.1

經過漫長的等待，如果出現如下圖的日誌信息，那就恭喜你，Spark2.0的編譯就完成了。

比MapReduce快百倍的Spark，如何快速編譯安裝

編譯完成之後，會在Spark2.0根目錄下生成一個編譯完成的spark-2.0.0-bin-2.5.0.tgz包，這是我針對hadoop2.5.0編譯的spark2.0.0版本。

比MapReduce快百倍的Spark，如何快速編譯安裝

第十步：安裝scala

下載scala2.10.4版本，這個版本號跟之前spark2.0編譯設置的scala版本必須一致。

$tar -zxf /opt/softwares/scala-2.10.4.tgz -C /opt/modules/

第十一步：配置scala

在/etc/profiles文件中添加如下的內容：

第十二步：安裝Spark2.0

將已經編譯好的spark2.0包解壓到/opt/modules下

$tar -zxf /opt/softwares/spark-2.0.0-bin-2.5.0.tgz -C /opt/modules/

第十三步：啟動Spark2.0

$ bin/spark-shell

第十四步：WEB UI監控

默認端口號是4040：

地址：bigdata-senior01-kfk.com:4040

至此，Spark2.0所有的環境就配置好了。

我是卡弗卡大數據，關注我，讓我們一起為Spark前行。

比MapReduce快百倍的Spark，如何快速編譯安裝

相關推薦

'零基礎程序員如何快速入門C語言，附視頻教程'

"學習C語言不是一朝一夕的事情，但卻也不是需要花費幾年時間才能精通的。那麼如何以最小的代價，學習C語言呢？這最小的代價也絕不是什麼捷徑，而是以最短的時間去收穫最多的知識，但同時也意味著你需要經歷艱苦的過程。學習C語言是如此，學習其他語言亦是如此。一、要讀就讀好書，否則不如...

C語言程序員編程語言 UNIX Microsoft Visual Studio Windows 編譯器集成開發環境程序設計 Linux 讀書 GCC 歷史 2019-08-26

'IT大牛告訴你：如何快速從零基礎，成為編程大神'

"首先要求這幾點：1、做一名程序員，絕對要耐得住寂寞，並且要一直有點興趣促進你學習。如果你完全沒興趣，你是不可能學會編程。2、能抗壓。咱幹程序員這一行業，沒填幾乎都是面對枯燥的代碼，經常要面臨著加班，除非你特意去很輕鬆的公司上班。滿足了這兩點，那就開始努力學習吧。在分享學習...

Java Python 編程語言 JavaScript 數據庫 C語言 HTML SQL MySQL 大學 Microsoft SQL Server 程序員電腦 Android Studio Android 程序設計人工智能 jQuery CSS JSP 人生第一份工作 2019-08-14

'Linux環境Spark安裝配置及使用（三）'

"7. Spark RDD的高級算子(1) mapPartitionsWithIndex把每個partition中的分區號和對應的值拿出來def mapPartitionsWithIndex[U](f: (Int, Iterator[T]) ⇒ Iterator[U], p...

Spark Linux Scala 2019-08-06

'Linux環境Spark安裝配置及使用（六）'

"12. 認識 Spark Streaming(1) Spark Streaming 簡介流式計算框架（類似於Storm）常用的實時計算引擎（流式計算）<1>. Apache Storm：真正的流式計算<2>. Spark Streaming ：嚴格...

Spark Linux Apache 數據庫 Scala 算法 Storm Python 機器學習 Java 2019-08-04

'如何快速學習做圖軟件，應用於平時的新媒體運營中？'

"我們總說，新媒體人必須是全才。“刀槍劍戟斧鉞鉤叉”，樣樣都得會。簡單點兒的就是用Photoshop做個圖、Premiere剪輯視頻，複雜一點兒可能還需要用jsp（編程語言）寫個H5。然而，在一般情況下，新媒體人不需要在這些軟件上下太多功夫，瞭解基本功能，就足夠我們平時文章...

圖像處理美圖秀秀軟件 Photoshop Premiere 百度 JSP 編程語言傳媒文化 2019-07-31

大數據學習之Spark快速入門指南(Quick Start Spark)

大數據學習之Spark快速入門指南(Quick Start Spark)快速入門指南(Quick Start Spark)這個文檔只是簡單的介紹如何快速地...

Spark Scala 大數據 Apache MapReduce Line Java Hadoop Word 跳槽那些事兒泛函編程 Python 2019-07-12

如何學習Python5個月就達到月薪1萬及AI快速入職情況

學習Python的程序員也能達到月薪1萬嗎？如何學習？2百多集資料路線，告訴你學習方法！近幾年Python發展，市場上需要的Python人員非常多，而且按...

Python 人工智能工程師大數據程序員人生第一份工作技術網絡爬蟲編程語言 Java MySQL 設計 JSON 2019-07-09

如何快速地近似任何函數？一個用Python構建深度神經網絡極簡方法

不久前，研究人員Hornik等58發現，一個隱藏層足以模擬任何分段連續函數。他們的定理非常好，值得在這裡重申一下：Hornik等人的定理：設F是n維空間有...

Python 人工智能深度學習程序員數據結構編程語言 2019-07-02

美團是如何應用Spark處理大數據的？

前言美團最初的數據處理以Hive SQL為主，底層計算引擎為MapReduce，部分相對複雜的業務會由工程師編寫MapReduce程序實現。隨著業務的發展...

Spark 美團網大數據數據挖掘 SQL MapReduce Hive Python Scala 工程師算法 Markdown 程序設計可視化技術 JSON 機器學習 Apache 2019-06-22

如何快速從算法萌新逆襲成為碼神？

算法萌新在刷力扣時，雖然已有一些算法基礎但仍然出現一題都做不出來的現象，經常有以下困惑：1.代碼寫了又刪、刪了又寫，寫到一半才發現邏輯走不通，沒有整體思路...

算法逆襲故事編程語言讀書 Kotlin 2019-06-07

如何快速搭建一個微服務架構

什麼是微服務？微服務(Microservices Architecture)是一種架構風格，一個大型複雜軟件應用由一個或多個微服務組成。系統中的各個微服務...

Java 設計 JSON Tomcat Node.js 通信編程語言 XML 2019-05-16

如何快速構建可直接落地、基於開源的低成本架構！｜技術頭條

作者 | 張輝清責編 | 郭芮出品 | CSDN（ID：CSDNnews）技術大會上的分享大多高大上，億級流量、超大型研發團隊，雖然值得借鑑，但由於應用場...

技術 Redis 操作系統數據庫工作這一年程序員 Lua CSDN MongoDB 數據結構大眾汽車編程語言 2019-04-06

基礎都掌握了還是敲不出代碼？編程新手如何快速提升coding能力？

相信很多初學編程的朋友都有這樣的苦惱：為什麼我感覺自己基礎都掌握了，但是學校的課程結束後再進行編程時還是什麼都不會呢？通常新手程序員會以不同的方式來表達這個疑問，比如：“我通過在線課程學習了Python，但是我還是不知道怎麼用它來編程。”“我知道這個理論，可是怎麼把它運用到...

集成開發環境程序員算法編程語言 Xcode YouTube Eclipse 文本編輯器 2019-04-05

如何快速構建一個 Spring Boot 工程？

作者 | 唐亞峰責編 | 胡巍巍Spring Boot 是為了簡化 Spring 應用的創建、運行、調試、部署等一系列問題而誕生的產物，自動裝配的特性讓...

編程語言 Tomcat XML Java HTML 2018-11-30

老程序員告訴你：如何快速從零基礎，成為編程大神

首先要求這幾點：1、做一名程序員，絕對要耐得住寂寞，並且要一直有點興趣促進你學習。如果你完全沒興趣，你是不可能學會編程。2、能抗壓。咱幹程序員這一行業，沒...

編程語言程序員 Java Python JavaScript 2018-11-29

神級程序員花十天整理的進程乾貨教你如何快速系統編程！超全！

1.進程1.多任務的引入有很多的場景中的事情是同時進行的，比如開車的時候手和腳共同來駕駛汽車，再比如唱歌跳舞也是同時進行的；在給大家分享之前呢，小編推薦一...

編程語言程序員 Python sun菜菜 2017-10-29

Python那些事——如何快速理解 Python 生成器原理？看這就對了！

在掌握 Python 生成器之前，你必須瞭解常規 Python 函數的工作原理。通常，當一個 Python 函數調用子程序（subroutine）時，這個...

編程語言 Python 鏡音雙子技術科趣 2017-10-14

3分鐘準備Tensorflow環境，python包集成管理anaconda如何安裝？

本文帶大家看如何安裝谷歌人工智能tensorflow框架。鈦客這裡得所有人工智能程序都是在國內可以安全完整運行得。為什麼這麼說呢？現在國內很多技術資料翻...

編程語言 Python 人工智能 Google 昂鈦客AI 2017-10-06

Python那些事——如何三步用 python快速生成word報表

在工作中，我們如何利用python快速生成word報表呢？快來看看吧，基本就三步，你說你說難不難？Python那些事——如何三步用 python快速生成w...

編程語言 Python Word XML 科趣 2017-10-02

獻給迷茫的JAVA程序員，如何快速成為高薪架構師

程序員如何才能晉升為優秀的高薪架構師？100offer希望通過本文讓程序員們瞭解架構師的市場行情，瞭解架構師的發展前景，並幫助你更清晰地做出職業規劃。架構...

編程語言程序員 Java 軟件 Java歲月 2017-09-30

推薦中...