「決戰紫禁之巔」之深度學習框架篇：Keras VS PyTorch

人工智能程序員 Python 決戰紫禁之巔 Facebook 工程師機器之心 2019-07-01

選自towardsdatascience

作者：George Seif

機器之心編譯

參與：杜偉、一鳴

Keras和PyTorch之爭由來已久。一年前，機器之心就曾做過此方面的探討：《Keras vs PyTorch：誰是「第一」深度學習框架？》。現在PyTorch已經升級到1.x版本，而Keras也在進一步發展，情況發生了怎樣的變化呢？本文從四個方面對Keras和PyTorch各自的優劣勢做了進一步詳述，相信讀者會對如何選擇適合自己的框架有更清楚的認知。

TensorFlow 是很多科學家、工程師和開發人員的首個深度學習框架。雖然 TensorFlow 1.0 早在 2017 年 2 月就發佈了，但使用過程中對用戶不太友好。

過去幾年裡，Keras 和 PyTorch 日益成為廣受用戶歡迎的兩種深度學習庫，因為它們使用起來比 TensorFlow 簡單多了。

本文將分別對 Keras 和 PyTorch 的四個方面進行比較，你可以根據兩種框架的優劣勢以及自身的需要選擇其中一種。

Keras 和 PyTorch 簡介

Keras 於 2015 年 3 月首次發佈，是能夠在 TensorFlow、CNTK、Theano 或 MXNet 上運行的高級 API（或作為 TensorFlow 內的 tf.contrib）。Keras 的突出特點在於其易用性，它是迄今為止最容易上手且能夠快速運行的框架。此外，Keras 能夠直觀地定義

神經網絡，函數式 API 的使用令用戶可以將層定義為函數。

PyTorch 於 2016 年 10 月發佈，由 Facebook AI 研究團隊開發，是專注於直接處理數組表達式的較低級別 API。與 Keras 相比，你能夠擁有更強的靈活度以及對 PyTorch 的控制，同時又不需要進行太多的聲明式編程（declarative programming）。

選擇 Keras 還是 PyTorch？

有時，深度學習從業者會糾結於應該使用哪一種框架，這通常取決於個人喜好。下面將介紹 Keras 和 PyTorch 的幾個方面對比，你可據此做出自己的選擇。

定義模型的類 vs 函數

Keras 在定義深度學習模型時提供函數式 API。通過函數式 API，神經網絡被定義為一組序列函數，然後一個接一個地得到應用。例如，函數定義層 1 的輸出是函數定義層 2 的輸入。

在使用 PyTorch 時，用戶將神經網絡設置為一個擴展了 Torch 庫中 torch.nn. 模塊的類。與 Keras 類似，PyTorch 為用戶提供作為組件的層，但由於這些層屬於 Python 類，所以它們是類__init__() 方法中的引用，並通過類的 forward() 方法執行。

相比而言，PyTorch 能夠令你訪問 Python 的所有類別特徵，而不只是簡單的函數調用。定義網絡變得更加清晰，而且優雅。但如果你認為以最快的速度編寫網絡代碼最為重要，則 Keras 對你來說更加易於使用。

張量和計算圖 vs 標準陣列

對於一般程序員來說，Keras API 會隱藏大量的混亂細節，定義網絡層也非常直觀。因而，你在默認設置下就足以入門。但當你想要實現一個非常先進或「獨特的」模型時，才真正需要深入瞭解低級和本質的 TensorFlow。

但當你真正深入瞭解低級 TensorFlow 代碼時，就會遇到一些挑戰。你需要確保所有矩陣乘法對齊。更不要想著將層輸出打印出來了，因為你會在終端上打印出一個很好的張量定義（Tensor definition）。

相較於 Keras，PyTorch 在這些方面往往更加寬容。你只需要瞭解每個層的輸入和輸出大小就可以了，並且 PyTorch 在這一點上做得非常好，你可以快速掌握。你不需要構建抽象的計算圖（其內部情況你在調試時無法看到）。

PyTorch 的另一個優點在於其平滑性（smoothness），你可以在 Torch 張量和 Numpy 矩陣之間來回切換。但如果開發者需要實現一些自定義內容，則 TF 張量和 Numpy 矩陣之間的切換可能會很麻煩，這要求他們對 TensorFlow 有一個透徹瞭解。

實際上，PyTorch 的交互運算更加簡單，兩步即可：將 Torch 張量（變量對象）轉換成 Numpy，然後進行反向運算即可。

當然，如果你不需要實現任何獨特的內容，則 Keras 也表現的非常好，因為你不會遇到任何 TensorFlow 障礙。但如果想要實現一些獨特的內容，則 PyTorch 可能會表現得更加平滑。

訓練模型

開始訓練

利用 Keras 訓練模型超級簡單！只需要一個簡單的.fit()，你就可以開啟模型訓練之旅。

而利用 PyTorch 訓練模型包含以下幾個步驟：

每一批次的訓練開始時初始化梯度
在模型中運行前向傳播
運行後向傳播
計算損失和更新權重

所以，就訓練模型來說，PyTorch 較為繁瑣。

控制 CPU vs GPU 模式

我們需要更多算力。

如果你已經安裝了 tensorflow-gpu，則在 Keras 中能夠使用 GPU 並且會默認完成。然後，如果你想要將某些運算轉移至 CPU，則可以以單行方式完成。

但對於 PyTorch 來說，你必須顯式地為每個 torch 張量和 numpy 變量啟動 GPU。這樣代碼會比較混亂。並且如果你想在 CPU 和 GPU 之間來回移動以執行不同運算，則很容易出錯。

例如，為了將之前的模型轉移到 GPU 上運行，則需要以下步驟：

因而，Keras 在簡潔性和默認設置方面優於 PyTorch。

選擇 Keras 或 PyTorch 的一般性建議

作者通常建議初學者從 Keras 開始。Keras 絕對是理解和使用起來最簡單的框架，能夠很快地上手運行。你完全不需要擔心 GPU 設置、處理抽象代碼以及其他任何複雜的事情。你甚至可以在不接觸任何 TensorFlow 單行代碼的情況下，實現自定義層和損失函數。

但如果你開始深度瞭解到深度網絡的更細粒度層面或者正在實現一些非標準的事情，則 PyTorch 是你的首選庫。使用 PyTorch 需要進行一些額外操作，但這不會減緩你的進程。你依然能夠快速實現、訓練和測試網絡，並享受簡單調試帶來的額外益處。

參考鏈接：https://towardsdatascience.com/keras-vs-pytorch-for-deep-learning-a013cb63870d

相關推薦

'男籃世界盃決賽直播：西班牙男籃VS阿根廷男籃直播決戰紫禁之巔'

"賽事：西班牙男籃VS阿根廷男籃時間：2019-09-15 20:00直播地址：關注微信公眾號（微信搜索“feisuzhibo”或“球壇資訊”）所有賽事免費看！北京時間9月15日晚上20:00，男籃世界盃決賽將揭開戰幕，阿根廷男籃將挑戰西班牙男籃。阿根廷可以說是本屆賽事的...

阿根廷西班牙阿根廷男籃西班牙男籃世界盃足球賽決戰紫禁之巔創作者來直播 2019-09-16

'分佈式機器學習之——Spark MLlib並行訓練原理'

"這裡是王喆的機器學習筆記的第二十五篇文章。接下來的幾篇文章希望與大家一同討論一下機器學習模型的分佈式訓練的問題。這個問題在推薦、廣告、搜索領域尤為突出，因為在互聯網場景下，動輒TB甚至PB級的數據量，幾乎不可能利用單點完成機器學習模型的訓練，分佈式機器學習訓練成為唯一...

Spark 機器學習分佈式計算並行計算大數據 GPU 算法 Docker 中央處理器工程師文章物理 2019-09-16

'迴歸理性還是盲從口碑？40萬級大中型豪華座駕決戰紫禁之巔'

"每次一提到豪華品牌，眾人目光都集中在BBA身上，德系豪華在汽車領域的建樹非一般車企能夠比擬，畢竟德系嚴謹的做工與先進的技術百年來有口皆碑。不過要論國內車市的頭部車企，大眾絲毫不遜於這三大豪門。尤其在中大型車領域，同門之爭從未停歇過，今天我們就來聊聊BBAD的四位當家花旦寶...

奧迪A6L 奔馳E級奧迪 BMW 設計奔馳決戰紫禁之巔大眾汽車轎車 BMW 5系 2019-09-15

'Deep CARs：使用Pytorch學習框架實現遷移學習'

"全文共13449字，預計學習時長26分鐘或更長圖片來源：https://www.pexels.com/photo/vehicles-parked-inside-elevated-parking-lot-63294/如何讓電腦識別不同的汽車品牌？想用手機拍任何一輛車就能知道...

GPU 人工智能電腦 Kaggle Google 中央處理器深度學習數據庫 JSON 硬件盜夢空間動物 2019-09-12

'阿里20年之AI篇：“雲”上的“阿里巴巴智能”'

"“我不喜歡AI被稱為人工智能，我稱它為阿里巴巴智能。”在2019年世界人工智能大會上，馬雲在與馬斯克對話時，如此解釋他所理解的AI。如今，歷經20年發展的阿里巴巴，在AI領域的佈局已成規模。那麼，“阿里巴巴智能”是什麼？首先要從阿里雲說起。起始於雲計算面向智能化縱觀阿里...

人工智能阿里巴巴集團阿里雲計算雲計算技術機器人算法 2019世界人工智能大會操作系統金融大數據分佈式計算語音識別技術電腦武漢自然語言處理無人駕駛設計經濟讓夢發生馬雲航天技術數據庫大學胡曉明人臉識別區塊鏈電子商務 2019-09-12

'機器學習之誤差反向傳播算法'

"機器學習之誤差反向傳播算法我們知道神經網絡是由大量的參數即權重構成，神經網絡的學習過程則是這些參數的變化更新過程。誤差反向傳播算法就是用於更新這些參數的。這裡我們假設激活函數為Sigmoid。Ps: 在吳恩達機器學習反向傳播算法課程中，而不是：這是因為吳恩達中使用的損失...

機器學習算法吳恩達人工智能 2019-09-09

'深度剖析自動駕駛“機器之眼”：360度無死角感知導航'

"“富豪們喜歡勞斯萊斯蘭博基尼，金融男喜歡奔馳寶馬，而技術宅程序員喜歡的是特斯拉。”這是網友的一句玩笑話，但很真實。在崇尚技術的程序員眼中，特斯拉無疑是最具科技感的車，它的自動駕駛更是智慧與炫酷的象徵，是前沿科技的代表。特斯拉那麼炫酷的自動駕駛是怎麼實現的呢？自動駕駛實現的...

無人駕駛雷達技術特斯拉汽車程序員 Google 金融蘭博基尼勞斯萊斯汽車 BMW 人生第一份工作 2019-09-07

'深度學習框架Keras與Pytorch對比'

"對於許多科學家、工程師和開發人員來說，TensorFlow是他們的第一個深度學習框架。TensorFlow 1.0於2017年2月發佈，可以說，它對用戶不太友好。在過去的幾年裡，兩個主要的深度學習庫Keras和Pytorch獲得了大量關注，主要是因為它們的使用比較簡單。本...

人工智能程序員 Python Facebook 工程師 2019-09-05

'編程語言學習之——Java'

"Java是一門面向對象編程語言，不僅吸收了C++語言的各種優點，還摒棄了C++裡難以理解的多繼承、指針等概念，因此Java語言具有功能強大和簡單易用兩個特徵。Java語言作為靜態面向對象編程語言的代表，極好地實現了面向對象理論，允許程序員以優雅的思維方式進行復雜的編程。J...

Java Java虛擬機編程語言程序員 NetBeans 集成開發環境 EditPlus IBM 設計 IntelliJ IDEA 軟件虛擬機人生第一份工作 Eclipse Sun公司 2019-09-05

'JavaScript系統學習DOM系列文章之20個不得不學的新API'

"程序猿就是一個活到老學到老的職業，如果你不想被淘汰，就得逼著自己去優秀。WEB技術隨著大潮發生了很多變化，尤其是2.0後時代階段，Ember、Angular、React、Vue的興起，極大的推動了WEB行業的變革。大多數的人開始被分成兩大組——使用框架和制定框架，人們越來...

JavaScript CSS 瀏覽器 HTML jQuery 程序員技術文章 HTML5 蜘蛛俠 2019-09-02

'深度學習框架Keras與Pytorch對比'

人工智能程序員 Python Facebook 工程師 2019-09-01

'數字化轉型之解決方案篇 | 基於 QingStor®️ 對象存儲的數據湖解決方案'

"據 IDC 最新報告預測，2022 年中國 50% 以上的組織都將成為數字化堅定者，依靠新的商業模式、數字化產品與服務實現業務增長。面對數字化轉型的時代浪潮，青小云為大家準備了一份硬核大禮 —— 《數字化轉型之路》，包含基礎設施、業務架構、解決方案到行業實踐、未來探索五個...

大數據技術經濟人工智能金融 Hadoop 固態硬盤青雲雲存儲人生第一份工作工程師 SQL 2019-08-31

'李彥宏在智博會上說的深度學習框架是什麼'

"中新網8月27日電人工智能技術的發展，已經到了一個非常關鍵的節點，科技圈的大佬們，對此又有什麼樣的真知灼見？8月26日，一場全球矚目的盛會——2019中國國際智能產業博覽會拉開帷幕，國際組織負責人、國外知名學者和60多位世界500強企業高管雲集，而百度創始人、董事長兼首...

人工智能李彥宏技術百度操作系統 Google 算法 iOS 演講法律 Facebook Windows Android 城市規劃人臉識別農業 2019-08-31

'深度：華為、阿里入局，一場被低估的安防三極之戰'

"智東西（公眾號：zhidxcom）文 | 季瑜生就在本月初，華為安防又開大會了。這一次的年度安防業務戰略發佈會上，華為拿出了看家的本事，16T算力智能攝像機與可接入800路視頻的邊緣計算產品，以及明年將推出的多模態全息攝像機。順便，還秀了一把業績，今年上半年華為安防中國區...

華為公司阿里巴巴集團阿里雲計算千方科技軟件物聯網通信攝像放像機海康威視技術全息技術硬件高德軟件交通雷達雷州投資任正非人工智能戴爾 2019-08-31

'重慶智博會觀察：李彥宏為何要提深度學習框架？'

"文|鄰章九言勸醒迷途仕，一語驚醒夢中人。李彥宏在2019中國國際智能產業博覽會上發表的主題演講，對於我國人工智能的研究發展而言，頗有此意。他在演講中表示：“過去我們津津樂道說中國的人工智能的論文發表數量、專利申請數量是全球第一，但是今天我們更多的是要看人工智能整體這個開發...

人工智能李彥宏技術百度 Google 重慶 Facebook 農業算法搜狗美團網人生第一份工作百度地圖操作系統小米科技林業華為公司網易中興通訊聯想集團頭號大贏家| 理財大賽第二季 2019-08-29

'中國資本市場頂級賦能者之恆生電子深度解析'

"（登陸未來智庫「鏈接」獲取本報告及更多卓越報告。）一、多年積累形成頂級壁壘，經營質量大幅改善1.國內金融領域頂級賦能者，先發優勢、研發積累構築壁壘國內金融領域頂級賦能者，多個細分市佔率第一。1）1995年，恆生電子股份有限公司成立於杭州，2003年在上海證券交易所主板...

恆生電子金融銀行光大證券證券投資基金上海證券交易所螞蟻金服頭號大贏家| 理財大賽第二季投資技術私募人工智能雲計算軟件人生第一份工作創業跳槽那些事兒浙江省上海期貨區塊鏈 2019-08-29

'李彥宏在智博會上說的深度學習框架是什麼'

人工智能李彥宏技術百度操作系統 Google 算法 iOS 演講法律 Facebook Windows Android 城市規劃人臉識別農業 2019-08-28

'圖形界面讓代碼運行更加直觀，python模塊之Tkinter 顯示篇'

"在日常操作中，我們使用軟件基本都是直接利用鼠標點擊操作，但是編程中我們往往是使用鍵盤進行操作的，這樣的操作其實對於一名程序員來說沒有什麼問題，但是如果你想讓自己寫的程序給別人使用，除了考慮別人電腦環境之外，一個能夠讓別人操作方便的圖形化界面顯然也挺重要的。那麼我們有哪些模...

Python 軟件程序員操作系統鼠標電腦 2019-08-28

'國產AI框架再添猛將：華為深度學習框架MindSpore問世'

"一直以來，給我們的印象，Google的TensorFlow是有名的人工智能深度學習框架，而我們自己國家，似乎沒有什麼開源的AI深度學習框架，所以我們的機器學習也總需要向外求索，一直需要國外的AI框架來訓練數據。事實上，我們並不是沒有開源的AI框架，比如百度早前就推出了自己...

人工智能華為公司技術百度 Google 操作系統中央處理器工程師 GPU 2019-08-25

'第四十四節、Python之定義默認參數《Python學習》'

"定義函數的時候，還可以有默認參數。例如Python自帶的 int() 函數，其實就有兩個參數，我們既可以傳一個參數，又可以傳兩個參數：>>> int('123')123>>> int('123', 8)83int()函數的第二個參數是轉...

Python 2019-08-23

推薦中...