支持向量機模型參數選擇方法的優缺點

機器學習 數學 一辰的遊樂場 2017-06-07

在用支持向量機進行模型訓練時,選擇參數是首先應解決的問題,但始終沒有得到令人滿意的解決方案。

支持向量機模型參數選擇方法的優缺點

支持向量機核心思想:尋找最優分類超平面

目前關於參數的選擇,主要採用經驗取值法進行試算或者採用理論方法

  1. 用小編前期介紹過的經驗取值法進行試算,雖然可以降低運算量,但準確率較低。而且不同數學特徵的樣本的最佳參數往往相差很大,經驗中適用於一類樣本的參數未必適用於其他類型的樣本。

  2. 理論參數選擇的方法主要有留一法(Leave One Out, LOO)、k折交叉驗證法、經驗公式法等。該方法的缺點是計算量太大。

k折交叉驗證法考慮了模型的推廣能力,其思想是把學習樣本集分為k個子集,用其中k-1子集作為訓練集,另外一個子集作為測試集來檢驗,通過不斷選取不同的支持向量機參數組合進行訓練並測試,最終選擇使得訓練精度和檢驗精度都滿足要求的參數值作為最優參數組合,作為訓練模型的參數。這種方法的缺點是計算量太大,具體實施時幾乎等同於直接對全部樣本進行訓練來不斷尋優的過程,留一法是k折交叉驗證法的特例。

相關推薦

推薦中...