來源:AI有道
本文共1398字,建議閱讀5分鐘。
本文為你詳細介紹AI資源——《AI 算法工程師手冊》,涵蓋了機器學習、深度學習等領域的很多重要理論知識和實戰經驗。
最近作者在瀏覽網頁的時候,偶然發現一份非常不錯的 AI 資源,就是這本《AI 算法工程師手冊》 。本文將給大家推薦這本優秀教材,並作詳細的介紹。
這本《AI 算法工程師手冊》已正式開源,無需購買紙質書籍,可以直接在線閱讀,體驗感爆棚。在線閱讀地址為:
http://www.huaxiaozhuan.com/
作者簡介
首先不得不提一下本書的作者,作者華校專,曾經在阿里巴巴擔任資深算法工程師,現任智易科技首席算法研究員。他還是《Python 大戰機器學習》書籍的作者。
書籍介紹
這本《AI 算法工程師手冊》是作者多年以來學習總結的筆記,經整理之後開源於世。關於為什麼將完整書籍開源,作者是這樣說的:曾有出版社約稿,但是考慮到出版時間週期較長,而且書本購買成本高不利於技術廣泛傳播,因此就採取開源的形式。
既然本書是 AI 算法工程師的手冊,因此內容非常豐富,基本涵蓋了機器學習、深度學習等領域的很多重要理論知識和實戰經驗,同時也介紹了工程應用中經常使用的 AI 工具和編程庫。
書籍整體包含了 5 大塊內容,分別是:
- 數學基礎
- 統計學習
- 深度學習
- 自然語言處理
- 工具
下面我們分別來看一下各模塊的內容。
1. 數學基礎
提升 AI 內功心法離不開紮實的數學基礎。本書數學基礎這部分,作者主要介紹了最重要的 4 點:
- 線性代數基礎
- 概率論基礎
- 數值計算基礎
- 蒙特卡洛方法與 MCMC 採樣
例如線性代數部分最基本的基礎知識:
2. 統計學習
這部分內容作者花了比較大的篇幅,主要介紹的是機器學習中一些常見的算法,包括線性迴歸、感知機、支持向量機、決策樹、集成學習等。同時還包括模型評估、特徵選擇、降維等。具體內容如下:
- 機器學習簡介
- 線性代數基礎
- 支持向量機
- 樸素貝葉斯
- 決策樹
- knn
- 集成學習
- 梯度提升樹
- 特徵工程
- 模型評估
- 降維
- 聚類
- 半監督學習
- EM算法
- 最大熵算法
- 隱馬爾可夫模型
- 概率圖與條件隨機場
- 邊際概率推斷
每個算法的理論介紹非常詳細、數學推導完整,例如支持向量機中關於對偶問題的推導:
3. 深度學習
這部分主要介紹深度學習神經網絡的基本知識和模型,包括前饋神經網絡、卷積神經網絡、循環神經網絡等。具體內容如下:
- 深度學習簡介
- 反向傳播算法
- 正則化
- 最優化基礎
- 卷積神經網絡
- 循環神經網絡
- 工程實踐指導原則
這部分詳細介紹了神經網絡模型的基本結構和訓練方法,例如列舉了經典 CNN 結構:LeNet、AlexNet、VGG-Net、Inception、ResNet、ResNet 變種、SENet、DenseNet。
1998 年 LeCun 推出的 LeNet 網絡
4. 自然語言處理
這部分作者主要介紹了自然語言處理領域的 2 個方面:
主題模型
- Unigram Model
- pLSA Model
- LDA Model
- 型討論
詞向量
- 向量空間模型 VSM
- LSA
- Word2Vec
- GloVe
5. 工具
這部分主要介紹了 AI 常用工具和函數庫,具體內容如下:
- CRF
- lightgbm
- xgboost
- scikit-learn
- spark
- numpy
- scipy
- matplotlib
- pandas
這部分的內容更加側重於 AI 實戰,包含很多具體函數庫的使用教程和代碼。例如 lightbgm 是一個快速的,分佈式的,高性能的基於決策樹算法的梯度提升框架。可用於排序,分類,迴歸以及很多其他的機器學習任務中。本書對 lightbgm 的安裝、各參數含義、調參、使用等都作了詳細的介紹,宛如一份優秀的中文文檔!
這裡附上 lightbgm 簡單的 pip 安裝方法:
pip install lightgbm
pip install --no-binary :all: lightgbm #從源碼編譯安裝
pip install lightgbm --install-option=--mpi #從源碼編譯安裝 MPI 版本
pip install lightgbm --install-option=--gpu #從源碼編譯安裝 GPU 版本
pip install lightgbm --install-option=--gpu --install-option="--opencl-include-dir=/usr/local/cuda/include/" --install-option="--opencl-library=/usr/local/cuda/lib64/libOpenCL.so" #從源碼編譯安裝,指定配置
#可選的配置有:
# boost-root
# boost-dir
# boost-include-dir
# boost-librarydir
# opencl-include-dir
# opencl-library
同樣,像 xgboost、scikit-learn 等庫,書中也作了詳盡的解釋。除此之外,還有 spark 的內容哦,可以說是非常全面了。
最後
不得不說,這本《AI 算法工程師手冊》是一本比較完備的 AI 書籍,既包含了算法理論,也有實戰 AI 算法庫的使用。作為一份參考手冊還是非常不錯的!
更重要的是本書完全開源,直接在線閱讀就好了。不過注意該書籍僅供個人學習使用,非作者同意不得應用於商業領域。
編輯:文婧
校對:林亦霖
— 完 —
關注清華-青島數據科學研究院官方微信公眾平臺“THU數據派”及姊妹號“數據派THU”獲取更多講座福利及優質內容。