太陽底下沒有新鮮事兒:大數據相關的分析方法

大數據 HDFS EVA 杜邦 智慧城市漫談 2017-04-01

經常談到大數據分析,那麼怎麼來進行所謂的大數據分析呢,我們從比較基礎的數據分析談起,如下各種層次、各種步驟和各種方法,僅供參考。

1、數據接入層:關係型數據庫適配器、文本適配器、WebService、HDFS等。

2、數據處理:數據關聯(內連接、外連接、左連接、右連接);數據篩選:(列篩選、行篩選、數據抽樣、數據過濾);異常處理:(空值、缺失值、不準確值、去重);專用處理(離散化、分箱、數據集拆分、數據降維、數據規約、數據轉換、數據集成、數據融合)。

太陽底下沒有新鮮事兒:大數據相關的分析方法

3、數據分析算法管理:聚類、迴歸、因子分析、時間序列、分類、關聯、描述性分析。

太陽底下沒有新鮮事兒:大數據相關的分析方法

4、各種分析:多維分析(數圖映射、分析計算、圖形修飾);情境分析(杜邦分析、What-if分析、EVA分析);統計分析(比較均值、描述分析、相關性分析);挖掘分析(挖掘流分析、模型生成、結果發佈);場景/故事設計(場景設計、故事設計、場景管理、故事管理);場景故事發布(WEB形式發佈、文件形式發佈、三方系統集成)。

太陽底下沒有新鮮事兒:大數據相關的分析方法

5、數據可視化:數據關聯(內連接、外鏈接、左連接、右連接);數據篩選(列篩選、數據抽樣、數據過濾、行篩選);異常處理(空值、不準確值、缺失值);數圖映射(座標變換、連續離散變換、圖形變換);數據計算(自定義計算、快速計算);數圖修飾(字體、對齊、填充);場景設計和故事設計等。

太陽底下沒有新鮮事兒:大數據相關的分析方法


越努力越幸運。

智慧城市領域的思考者、踐行者。

歡迎關注,不定期更新。

相關推薦

推薦中...