數據分析法之迴歸分析

機器學習 大數據 數據挖掘 遊戲 上海數據分析網 2017-06-12

數據分析法之迴歸分析

數據分析法之迴歸分析

昨天介紹了《數據挖掘經典算法—樸素貝葉斯》,今天介紹迴歸分析法。

在統計學中迴歸分析是一種分析數據的方法。目的在於瞭解兩個或多個變數間是否相關、相關方向與強度,並建立數學模型以便觀察特定變數來預測研究者感興趣的變數。

迴歸分析的起源

1855年,英國著名生物學家兼統計學家高爾頓在《遺傳的身高向平均數方向的迴歸》提出“迴歸”概念。

迴歸分析(regression analysis)是確定兩種或兩種以上變量間相互依賴的定量關係的一種統計分析方法。

在大數據分析中,迴歸分析是一種預測性的建模技術,它研究的是因變量(目標)和自變量(預測器)之間的關係。這種技術通常用於預測分析,時間序列模型以及發現變量之間的因果關係。可以幫助數據分析師排除並估計出一組最佳的變量,用來構建預測模型。

根據自變量與因變量的多少與關係又可以細分為以下8種:

一元迴歸、多元迴歸、簡單迴歸、多重回歸、線性迴歸、非線性迴歸、一元線性迴歸和多重線性迴歸。

數據分析法之迴歸分析

迴歸分析的作用

迴歸分析主要主要有四種作用:

1. 確定變量之間是否存在相關關係。

2.判斷影響因變量的自變量顯著性。

3.對客觀過程進行分析、預測、模擬控制。

4. 根據一個或幾個變量的值,確定這些變量之間的迴歸關係。

迴歸分析步驟:

1.確定因變量(預測的具體目標)。

2.建立預測模型

3. 檢測變量與因變量的相關性,確定相關係數;

4.檢驗預測模型是否可用於實際預測

5.根據預測模型,進行綜合分析,並計算預測值的置信區間;

數據分析法之迴歸分析

當採用的模型和數據相同,迴歸分析可以計算出唯一的結果。在對多因素模型進行分析時,迴歸分析可以準確地計量各個因素之間的相關程度與迴歸擬合程度的高低,提高預測方程式的效果。而且迴歸分析更加簡單和方便。

但迴歸分析有一定的侷限性。首先回歸分析要有要求大量和正確的數據,其次變量與因變量的關係是要由數據分析師自己來判斷是否合理。而且迴歸分析會受異常數據點的影響。有時候迴歸分析對選用的因子和該因子採用何種表達 式只是一種推測,對因子的多樣性與不可測性產生了影響,使得迴歸分析在某些 情況下受到限制。

相關推薦

推薦中...