大數據、機器學習必讀書目——《Python數據分析與挖掘實戰》

大數據、機器學習及人工智能必讀書目——《Python數據分析與挖掘實戰》

我們已經進入了全新的數據時代,大數據、雲計算、物聯網、機器學習、人工智能等等一系列技術紛至沓來,數據的管理和應用已經滲透到每一個行業和業務領域,成為當今以及未來商業運作的基礎資產。可以說,只有掌握數據並善於運用數據的人,才會在競爭日益激烈的環境中尋得先機。 那麼我們該怎麼樣學習大數據分析、機器學習以及人工智能?作者認為,學習大數據、機器學習和人工智能,所需的知識分為五個層次,一是數學知識;二是統計學知識;三是算法知識;四是工具知識;五是哲學思想知識。所謂工具知識,就是我們需要藉助計算機軟件來完成相關的分析和運算,目前大數據和機器學習領域熱門的語言就是 R 和 Python。我們會分別介紹這五個層次所需要看的書,希望對大家有用。

《Python數據分析與挖掘實戰》

  • 作者:張良均 / 王路 / 譚立雲 / 蘇劍林

  • 頁數: 335

  • 出版:機械工業出版社 2016年版

大數據、機器學習必讀書目——《Python數據分析與挖掘實戰》

簡要評價:

這本書真的是一本實踐入門書,由十多位資深大數據專家結合10餘年數據挖掘與實施經驗,通過10餘個真實的案例為10餘個行業的數據挖掘給出瞭解決方案。因此我個人的感覺是適合有一定基礎的人看,否則看過之後好像明白了,但是自己用的時候又不知道咋辦了,不管怎麼樣,一定的數學、統計學基礎是學好大數據分析的前提和基礎、

從實踐的角度來說,這本書非常不錯,案例選的很好,都是實際應用的項目,不是作者為了寫書而編造出來的,很適合有一點理論基礎,推薦給有一定理論基礎,想迅速開展大數據分析實戰的同學們讀。

內容介紹:

10餘位數據挖掘領域資深專家和科研人員,10餘年大數據挖掘諮詢與實施經驗結晶。從數據挖掘的應用出發,以電力、航空、醫療、互聯網、生產製造以及公共服務等行業真實案例為主線,深入淺出介紹Python數據挖掘建模過程,實踐性極強。

本書共15章,分兩個部分:基礎篇、實戰篇。基礎篇介紹了數據挖掘的基本原理,實戰篇介紹了一個個真實案例,通過對案例深入淺出的剖析,使讀者在不知不覺中通過案例實踐獲得數據挖掘項目經驗,同時快速領悟看似難懂的數據挖掘理論。讀者在閱讀過程中,應充分利用隨書配套的案例建模數據,藉助相關的數據挖掘建模工具,通過上機實驗,以快速理解相關知識與理論。

基礎篇(第1~5章),第1章的主要內容是數據挖掘概述;第2章對本書所用到的數據挖掘建模工具Python語言進行了簡明扼要的說明;第3章、第4章、第5章對數據挖掘的建模過程,包括數據探索、數據預處理及挖掘建模的常用算法與原理進行了介紹。

實戰篇(第6~15章),重點對數據挖掘技術在電力、航空、醫療、互聯網、生產製造以及公共服務等行業的應用進行了分析。在案例結構組織上,本書是按照先介紹案例背景與挖掘目標,再闡述分析方法與過程,最後完成模型構建的順序進行的,在建模過程的關鍵環節,穿插程序實現代碼。最後通過上機實踐,加深讀者對數據挖掘技術在案例應用中的理解。

書籍目錄

前言

基礎篇

第1章 數據挖掘基礎

  • 1.1 某知名連鎖餐飲企業的困惑

  • 1.2 從餐飲服務到數據挖掘

  • 1.3 數據挖掘的基本任務

  • 1.4 數據挖掘建模過程

  • 1.5 常用的數據挖掘建模工具

  • 1.6 小結

第2章 Python數據分析簡介

  • 2.1 搭建Python開發平臺

  • 2.2 Python使用入門

  • 2.3 Python數據分析工具

  • 2.4 配套資源使用設置

  • 2.5 小結

第3章 數據探索

  • 3.1 數據質量分析

  • 3.2 數據特徵分析

  • 3.3 Python主要數據探索函數

  • 3.4 小結

第4章 數據預處理

  • 4.1 數據清洗

  • 4.2 數據集成

  • 4.3 數據變換

  • 4.4 數據規約

  • 4.5 Python主要數據預處理函數

  • 4.6 小結

第5章 挖掘建模

5.1 分類與預測 5.2 聚類分析 5.3 關聯規則 5.4 時序模式 5.5 離群點檢測 5.6 小結

實戰篇

第6章 電力竊漏電用戶自動識別

  • 6.1 背景與挖掘目標

  • 6.2 分析方法與過程

  • 6.3 上機實驗

  • 6.4 拓展思考

  • 6.5 小結

第7章 航空公司客戶價值分析

  • 7.1 背景與挖掘目標

  • 7.2 分析方法與過程

  • 7.3 上機實驗

  • 7.4 拓展思考

  • 7.5 小結

第8章 中醫證型關聯規則挖掘

  • 8.1 背景與挖掘目標

  • 8.2 分析方法與過程

  • 8.3 上機實驗

  • 8.4 拓展思考

  • 8.5 小結

第9章 基於水色圖像的水質評價

  • 9.1 背景與挖掘目標

  • 9.2 分析方法與過程

  • 9.3 上機實驗

  • 9.4 拓展思考

  • 9.5 小結

第10章 家用電器用戶行為分析與事件識別

  • 10.1 背景與挖掘目標

  • 10.2 分析方法與過程

  • 10.3 上機實驗220

  • 10.4 拓展思考221

  • 10.5 小結222

第11章 應用系統負載分析與磁盤容量預測

  • 11.1 背景與挖掘目標

  • 11.2 分析方法與過程

  • 11.3 上機實驗

  • 11.4 拓展思考

  • 11.5 小結

第12章 電子商務網站用戶行為分析及服務推薦

  • 12.1 背景與挖掘目標

  • 12.2 分析方法與過程

  • 12.3 上機實驗

  • 12.4 拓展思考

  • 12.5 小結

第13章 財政收入影響因素分析及預測模型

  • 13.1 背景與挖掘目標

  • 13.2 分析方法與過程

  • 13.3 上機實驗

  • 13.4 拓展思考

  • 13.5 小結

第14章 基於基站定位數據的商圈分析

  • 14.1 背景與挖掘目標

  • 14.2 分析方法與過程

  • 14.3 上機實驗

  • 14.4 拓展思考

  • 14.5 小結

第15章 電商產品評論數據情感分析

  • 15.1 背景與挖掘目標

  • 15.2 分析方法與過程

  • 15.3 上機實驗

  • 15.4 拓展思考

  • 15.5 小結 參考文獻


喜歡閒適安靜的生活,懂一點計算機編程,懂一點統計學和數據分析。(愛編程愛統計)

相關推薦

推薦中...