《常用數據挖掘算法從入門到精通》系列文章現已更新完畢,大家可以按需學習。
《常用數據挖掘算法從入門到精通》系列共21篇文章,主要向大家介紹了包括 K-means聚類, 決策樹分類, 人工神經網絡以及支持向量機等10多種常用的數據挖掘算法理論和具體的案例。本文給出全部的鏈接以及每一篇文章的簡介,大家可以根據自己的需要有選擇性地學習和查閱,真正想學習數據挖掘和機器學習但是算法理論功底又不夠紮實的同學建議把這一系列的文章都看一看,每天看一點也不用多久就可以看完了,每一篇文章除了以儘量簡單通俗的語言給大家介紹理論部分外,還附有詳細的案例幫助大家理解和鞏固,希望對後續大家進一步的學習有所幫助。
CONTENT
第一篇:《常用數據挖掘算法從入門到精通 第一章數據預處理(1)數據預處理簡介》
介紹了數據預處理的目的;常用的數據預處理方法;一般數據預處理流程。
第二篇:《常用數據挖掘算法從入門到精通 第一章數據預處理(2)數據清理》
介紹了填充缺失值,光滑噪聲數據的數據清理方法。
第三篇:《常用數據挖掘算法從入門到精通 第一章數據預處理(3)數據集成》
介紹了數據集成的概念;數據集成的內容;模式集成和對象匹配,冗餘數據的處理,數值衝突的檢測和解決的數據集成方法。
第四篇:《常用數據挖掘算法從入門到精通 第一章數據預處理(4)數據變換》
介紹了平滑/光滑處理,聚集操作,數據泛化,數據規範化,屬性構造/特徵構造的數據變換方法。
第五篇:《常用數據挖掘算法從入門到精通 第一章數據預處理(5)數據歸約》
介紹了數據歸約的概念;數據立方體聚集,維歸約,數據壓縮,數值規約,直方圖的數據規約方法。
第六篇:《常用數據挖掘算法從入門到精通 第一章數據預處理(6)數據離散化和概念分層》
介紹了數據離散化和概念分層的概念;數值數據的離散化和概念分層建立的方法;分箱方法:一種簡單的離散化技術,離散化:直方圖方法,離散化:聚類分析方法的數據離散化和概念分層方法。
第七篇:《常用數據挖掘算法從入門到精通 第二章 K-means聚類算法》
介紹了K-means聚類算法簡介;相似度準則與聚類性能評價準則;K-means聚類算法原理和步驟;K-means聚類算法實例。
第八篇:《常用數據挖掘算法從入門到精通 第三章 K-中心點聚類算法》
介紹了K-中心點聚類算法簡介;K-中心點聚類算法原理;四種情況的代價函數;K-中心點聚類算法步驟;K-中心點聚類算法實例。
第九篇:《常用數據挖掘算法從入門到精通 第四章SOM神經網絡聚類(上)》
介紹了SOM神經網絡簡介;SOM神經網絡的結構;相似性測量;競爭學習規則WTA(Winner-Take-All);競爭學習步驟。
第十篇:《常用數據挖掘算法從入門到精通 第四章SOM神經網絡聚類(下)》
介紹了SOM網絡的拓撲結構;SOM網的權值調整域;SOM網絡的運行原理;SOM網絡的算法流程;SOM網絡算法實例;SOM神經網絡聚類算法的簡單理解。
第十一篇:《常用數據挖掘算法從入門到精通 第五章 貝葉斯分類算法》
介紹了分類分析;貝葉斯概率—主觀概率;概率基礎知識;Bayes 決策理論;貝葉斯分類案例。
第十二篇:《常用數據挖掘算法從入門到精通 第六章 決策樹分類算法概述》
介紹了決策樹分類模型簡介;決策樹的結構;決策樹分類模型學習;分類特徵選擇;決策樹的剪枝。
第十三篇:《常用數據挖掘算法從入門到精通 第七章 ID3決策樹分類算法》
介紹了ID3算法原理介紹;熵和信息增益;ID3算法的信息增益算法;ID3算法實例分析。
第十四篇:《常用數據挖掘算法從入門到精通 第八章 C4.5決策樹分類算法》
介紹了C4.5分類算法介紹;信息增益比(Information Gain Ratio);對連續型屬性的處理;對樣本缺失值的處理;C4.5算法步驟;C4.5算法實例分析。
第十五篇:《常用數據挖掘算法從入門到精通 第九章 CART決策樹分類算法》
介紹了CART算法簡介(Classification And Regression Tree);Gini指數;對缺失值和連續屬性的處理;CART決策樹的算法步驟;CART算法實例分析。
第十六篇:《常用數據挖掘算法從入門到精通 第十章 支持向量機理論基礎》
介紹了統計學習理論;經驗風險和結構風險;函數集的VC維。
第十七篇:《常用數據挖掘算法從入門到精通 第十一章 支持向量機算法》
介紹了結構風險最小化(Structural Risk Minimization,SRM);分類問題的數學表示;分類問題的學習方法;線性可分情形:最大間隔原理;近似線性可分情形;線性不可分情形;核函數K(xi,xj)。
第十八篇:《常用數據挖掘算法從入門到精通 第十二章 人工神經網絡算法》
介紹了人工神經網絡簡介;人工神經元模型;神經網絡模型的三個要素;前饋(forward)神經網絡;BP神經網絡模型;BP神經網絡訓練的兩個階段;BP神經網絡參數設定;BP網絡的正向傳遞過程;BP網絡的反向傳播過程;BP神經網絡的算法步驟。
第十九篇:《數據挖掘算法之關聯規則挖掘Apriori算法詳細過程》
介紹了關聯規則挖掘的概念;關聯規則的種類;支持度與置信度;頻繁項集;Apriori定理;Apriori算法關聯規則挖掘詳細過程。
第二十篇:《數據挖掘技術之迴歸分析超全總結,常見迴歸模型介紹及應用場景》
介紹了迴歸分析介紹;簡單線性迴歸;簡單多項式迴歸;多元線性迴歸;多元多項式迴歸;多變量回歸;Logistic邏輯迴歸;Poison泊松迴歸;Cox比例風險迴歸。
第二十一篇:《數據挖掘關鍵技術、步驟與算法發展歷史,超全總結!》
介紹了數據挖掘關鍵技術;數據挖掘主要步驟;數據挖掘發展歷史及各階段的主要算法簡介;未來發展。
想要學習數據挖掘的童鞋趕快堅持學起來吧,若學習過程中遇到任何問題,歡迎向作者提問和交流~