用SPSS做Logistics迴歸分析

機器學習 SPSS 教育 迎著北風前進 2017-05-05

用SPSS做Logistics迴歸分析

課程介紹

大家好,今天課程主要是學會使用SPSS的二元Logistic迴歸分析,課程通過logistics模型的介紹、二元logistics案例、自變量的篩選三部分教會大家分析、使用SPSS的二元Logistic迴歸分析,具體的內容請同學們關注晚上的直播內容,下面做一下課前相關知識簡介。

簡介

logistic迴歸又稱logistic迴歸分析,是一種廣義的線性迴歸分析模型,常用於數據挖掘,疾病自動診斷,經濟預測等領域。例如,探討引發疾病的危險因素,並根據危險因素預測疾病發生的概率等。

logistic迴歸與多重線性迴歸分析有很多相同之處。它們的模型形式基本上相同,其區別在於他們的因變量不同(具體介紹可自行百度,由於太過專業,這裡不做過多介紹)。Logistic迴歸的因變量可以是二分類的,也可以是多分類的,但是二分類的更為常用,也更加容易解釋,實際中最為常用的就是二分類的logistic迴歸,所以我們今天的課程就是用SPSS分析二元logistics的案例。

適用條件

1 因變量為二分類的分類變量或某事件的發生率,並且是數值型變量。但是需要注意,重複計數現象指標不適用於Logistic迴歸。

2 殘差和因變量都要服從二項分佈。二項分佈對應的是分類變量,所以不是正態分佈,進而不是用最小二乘法,而是最大似然法來解決方程估計和檢驗問題。

3 自變量和Logistic概率是線性關係

4 各觀測對象間相互獨立。

數據分析技術在實際應用過程中,大量的研究都需要對只有“是”和“否”兩種選擇的結論給予解釋,即研究中的因變量並不是常用的定距變量和定序變量,而是僅有兩種狀態的二分變量。針對這種變量的迴歸分析稱為二元Logistic迴歸分析技術。二元Logistic迴歸分析是一種多元迴歸分析,這裡的二元不是自變量個數,而是指因變量的取值範圍,與多元迴歸分析中的多元代表自變量個數截然不同。

例如,作為汽車銷售商,其最關心的問題是顧客是否會購買某種品牌小汽車,為了預測未來顧客的購車可能性,汽車銷售商可以採集半年來諮詢該種小汽車的顧客的基本信息,以這些顧客最終是否購買了小汽車作為因變量,以顧客的職業、文化程度、收入情況、民族、宗教、喜好等因素作為自變量、藉助二元Logistic迴歸分析技術,構造顧客購買此品牌小汽車的迴歸方程。然後,汽車銷售商就可以以此迴歸方程式為依據,對前來諮詢的顧客做出初步判定。這就是二元Logistic迴歸分析的主要目的。

相關推薦

推薦中...