開源!《AI 算法工程師手冊》中文教程發佈!(附鏈接)

開源!《AI 算法工程師手冊》中文教程發佈!(附鏈接)

來源:AI有道

本文共1398,建議閱讀5分鐘

本文為你詳細介紹AI資源——《AI 算法工程師手冊》,涵蓋了機器學習、深度學習等領域的很多重要理論知識和實戰經驗。

最近作者在瀏覽網頁的時候,偶然發現一份非常不錯的 AI 資源,就是這本《AI 算法工程師手冊》 。本文將給大家推薦這本優秀教材,並作詳細的介紹。

這本《AI 算法工程師手冊》已正式開源,無需購買紙質書籍,可以直接在線閱讀,體驗感爆棚。在線閱讀地址為:

http://www.huaxiaozhuan.com/

作者簡介

首先不得不提一下本書的作者,作者華校專,曾經在阿里巴巴擔任資深算法工程師,現任智易科技首席算法研究員。他還是《Python 大戰機器學習》書籍的作者。

書籍介紹

這本《AI 算法工程師手冊》是作者多年以來學習總結的筆記,經整理之後開源於世。關於為什麼將完整書籍開源,作者是這樣說的:曾有出版社約稿,但是考慮到出版時間週期較長,而且書本購買成本高不利於技術廣泛傳播,因此就採取開源的形式。

既然本書是 AI 算法工程師的手冊,因此內容非常豐富,基本涵蓋了機器學習、深度學習等領域的很多重要理論知識和實戰經驗,同時也介紹了工程應用中經常使用的 AI 工具和編程庫。

書籍整體包含了 5 大塊內容,分別是:

  • 數學基礎
  • 統計學習
  • 深度學習
  • 自然語言處理
  • 工具


下面我們分別來看一下各模塊的內容。

1. 數學基礎

提升 AI 內功心法離不開紮實的數學基礎。本書數學基礎這部分,作者主要介紹了最重要的 4 點:

  • 線性代數基礎
  • 概率論基礎
  • 數值計算基礎
  • 蒙特卡洛方法與 MCMC 採樣


例如線性代數部分最基本的基礎知識:


開源!《AI 算法工程師手冊》中文教程發佈!(附鏈接)


2. 統計學習

這部分內容作者花了比較大的篇幅,主要介紹的是機器學習中一些常見的算法,包括線性迴歸、感知機、支持向量機、決策樹、集成學習等。同時還包括模型評估、特徵選擇、降維等。具體內容如下:

  • 機器學習簡介
  • 線性代數基礎
  • 支持向量機
  • 樸素貝葉斯
  • 決策樹
  • knn
  • 集成學習
  • 梯度提升樹
  • 特徵工程
  • 模型評估
  • 降維
  • 聚類
  • 半監督學習
  • EM算法
  • 最大熵算法
  • 隱馬爾可夫模型
  • 概率圖與條件隨機場
  • 邊際概率推斷


每個算法的理論介紹非常詳細、數學推導完整,例如支持向量機中關於對偶問題的推導:


開源!《AI 算法工程師手冊》中文教程發佈!(附鏈接)


開源!《AI 算法工程師手冊》中文教程發佈!(附鏈接)


開源!《AI 算法工程師手冊》中文教程發佈!(附鏈接)


3. 深度學習

這部分主要介紹深度學習神經網絡的基本知識和模型,包括前饋神經網絡、卷積神經網絡、循環神經網絡等。具體內容如下:

  • 深度學習簡介
  • 反向傳播算法
  • 正則化
  • 最優化基礎
  • 卷積神經網絡
  • 循環神經網絡
  • 工程實踐指導原則


這部分詳細介紹了神經網絡模型的基本結構和訓練方法,例如列舉了經典 CNN 結構:LeNet、AlexNet、VGG-Net、Inception、ResNet、ResNet 變種、SENet、DenseNet。


開源!《AI 算法工程師手冊》中文教程發佈!(附鏈接)


1998 年 LeCun 推出的 LeNet 網絡

4. 自然語言處理

這部分作者主要介紹了自然語言處理領域的 2 個方面:

主題模型

  • Unigram Model
  • pLSA Model
  • LDA Model
  • 型討論


詞向量

  • 向量空間模型 VSM
  • LSA
  • Word2Vec
  • GloVe

5. 工具

這部分主要介紹了 AI 常用工具和函數庫,具體內容如下:

  • CRF
  • lightgbm
  • xgboost
  • scikit-learn
  • spark
  • numpy
  • scipy
  • matplotlib
  • pandas

這部分的內容更加側重於 AI 實戰,包含很多具體函數庫的使用教程和代碼。例如 lightbgm 是一個快速的,分佈式的,高性能的基於決策樹算法的梯度提升框架。可用於排序,分類,迴歸以及很多其他的機器學習任務中。本書對 lightbgm 的安裝、各參數含義、調參、使用等都作了詳細的介紹,宛如一份優秀的中文文檔!

這裡附上 lightbgm 簡單的 pip 安裝方法:

pip install lightgbm
pip install --no-binary :all: lightgbm #從源碼編譯安裝
pip install lightgbm --install-option=--mpi #從源碼編譯安裝 MPI 版本
pip install lightgbm --install-option=--gpu #從源碼編譯安裝 GPU 版本
pip install lightgbm --install-option=--gpu --install-option="--opencl-include-dir=/usr/local/cuda/include/" --install-option="--opencl-library=/usr/local/cuda/lib64/libOpenCL.so" #從源碼編譯安裝,指定配置
#可選的配置有:
# boost-root
# boost-dir
# boost-include-dir
# boost-librarydir
# opencl-include-dir
# opencl-library


同樣,像 xgboost、scikit-learn 等庫,書中也作了詳盡的解釋。除此之外,還有 spark 的內容哦,可以說是非常全面了。

最後

不得不說,這本《AI 算法工程師手冊》是一本比較完備的 AI 書籍,既包含了算法理論,也有實戰 AI 算法庫的使用。作為一份參考手冊還是非常不錯的!

更重要的是本書完全開源,直接在線閱讀就好了。不過注意該書籍僅供個人學習使用,非作者同意不得應用於商業領域。


編輯:文婧

校對:林亦霖

— 完 —

關注清華-青島數據科學研究院官方微信公眾平臺“THU數據派”及姊妹號“數據派THU”獲取更多講座福利及優質內容。

相關推薦

推薦中...