"Spark"

spark基礎知識
1.Spark是什麼?UCBerkeley AMPlab所開源的類HadoopMapReduce的通用的並行計算框架dfsSpark基於mapreduce算法實現的分佈式計算,擁有HadoopMapReduce所具有的優點;但不同於MapReduce的是Job中間輸出和結果...
Spark(python)
一、 安裝下載jdk、scala、spark並配置環境變量/etc/profile創建軟鏈接打開python的spark連接窗口 or ./bin/spa...
'TalkingData的Spark On Kubernetes實踐'
"眾所周知,Spark是一個快速、通用的大規模數據處理平臺,和Hadoop的MapReduce計算框架類似。但是相對於MapReduce,Spark憑藉其可伸縮、基於內存計算等特點,以及可以直接讀寫Hadoop上任何格式數據的優勢,使批處理更加高效,並有更低的延遲。實際上,...
spark系列:Spark Streaming官方文檔譯文
概述spark stream是對spark core api的擴展;對於spark core不太瞭解的請閱讀:spark系列:spark core 數據交...
'Spark Streaming 場景應用'
"作者:徐勝國來源:數盟Spark Streaming 是一套優秀的實時計算框架。其良好的可擴展性、高吞吐量以及容錯機制能夠滿足我們很多的場景應用。本篇結合我們的應用場景,介結我們在使用 Spark Streaming 方面的技術架構,並著重講解 Spark Streami...
基於 Spark 的數據分析實踐
轉載本文需註明出處:微信公眾號EAWorld,違者必究。引言:Spark是在借鑑了MapReduce之上發展而來的,繼承了其分佈式並行計算的優點並改進了M...
當MongoDB遇見Spark
適宜讀者人群正在使用Mongodb的開發者傳統Spark生態系統 和 MongoDB在Spark生態的角色傳統Spark生態系統Spark生態系統那麼Mo...
NoSQL Spark MongoDB HDFS 2017-04-03
Spark 的學習使用
最近一直在做數據統計相關的工作,主要是用 Spark 分析一些關鍵詞在微信中的傳播行為。這篇博客記錄一下學習的過程。資源參數調優使用公司的 Spark 平...
Spark 科技 2017-06-25
Spark Streaming 原理
Spark Streaming工作原理每個Spark Streaming程序提交後,會在Driver把程序計算邏輯描述為一個 RDD DAG 的“模板”,...
Spark 2017-05-07
spark RDD 函數之map
1.map(func):數據集中的每個元素經過用戶自定義的函數轉換形成一個新的RDD,新的RDD叫MappedRDD(例1)(RDD依賴圖:紅色塊表示一個...
Spark 技術 2017-05-29
Spark名詞解釋及關係
隨著對spark的業務更深入,對spark的瞭解也越多,然而目前還處於知道的越多,不知道的更多階段,當然這也是成長最快的階段。這篇文章用作總結最近收集及理...
物理 2017-04-14
Spark:超越Hadoop MapReduce
引言:和 Hadoop 一樣,Spark 提供了一個 Map/Reduce API(分佈式計算)和分佈式存儲。二者主要的不同點是,Spark 在集群的內存...
“曉”Spark相遇古城西安
你能想象到的最小航拍無人機有多小?2017年6月16日由全球民用無人機及航拍技術領導者大疆創新主辦,授權一級代理西安交遠承辦的大疆“曉”Spark掌上無人...
無人機 DJI Spark 航拍 2017-06-19
何必糾結hadoop和spark如何選擇
說到大數據,想必大家對Hadoop和Apache Spark這兩個名詞並不是很陌生。或許我們也可以這樣來表達,Hadoop是大數據的啟蒙者,藉助Hadoo...
Spark算子講解(下)
接上11:takeSample隨機採樣,抽取num個樣例。可以指定是否重複抽取,隨機數種子是一個生成隨機數的初始條件,可以使用系統時間戳作為種子值。當不允...
Storm,Spark和Hadoop MapReduce關係
Storm,Spark和Hadoop MapReduce之間有什麼關係呢?接下來是咱們的Spark的詳細筆記:高階函數:如果一個函數的參數類型為一個函數,...
大數據學習之Spark快速入門指南(Quick Start Spark)
大數據學習之Spark快速入門指南(Quick Start Spark)快速入門指南(Quick Start Spark)這個文檔只是簡單的介紹如何快速地...
大數據之Spark詞頻統計
準備工作#進入spark目錄cd /usr/local/spark#新建代碼實驗目錄mkdir demo_codecd demo_code#新建一個詞頻統...
大疆超小型穿越機Spark現身
【大疆超小型穿越機Spark現身】大疆(DJI)一款超小型穿越機現身,尺寸只有一部iPad Mini大小,這款無人機並不是MAVIC系列中的一員,兩軸雲臺...
推薦中...