深度學習TensorFlow如何使用多GPU並行模式？

機器學習 GPU 深度學習 CPU 中科院計算所培訓中心中科院計算所培訓中心 2017-08-26

TensorFlow可以用單個GPU，加速深度學習模型的訓練過程，但要利用更多的GPU或者機器，需要了解如何並行化地訓練深度學習模型。

常用的並行化深度學習模型訓練方式有兩種：同步模式和異步模式。

下面將介紹這兩種模式的工作方式及其優劣。

如下圖，深度學習模型的訓練是一個迭代的過程。

深度學習TensorFlow如何使用多GPU並行模式？

在每一輪迭代中，前向傳播算法會根據當前參數的取值，計算出在一小部分訓練數據上的預測值，然後反向傳播算法，再根據損失函數計算參數的梯度並更新參數。

異步模式的訓練流程圖

深度學習TensorFlow如何使用多GPU並行模式？

在並行化地訓練深度學習模型時，不同設備（GPU或CPU），可以在不同訓練數據上，運行這個迭代的過程，而不同並行模式的區別在於，不同的參數更新方式。

異步模式的訓練流程

從異步模式的訓練流程圖中可以看到，在每一輪迭代時，不同設備會讀取參數最新的取值。

–但因為不同設備，讀取參數取值的時間不一樣，所以得到的值也有可能不一樣。

根據當前參數的取值，和隨機獲取的一小部分訓練數據，不同設備各自運行反向傳播的過程，並獨立地更新參數。

–可以認為異步模式，就是單機模式複製了多份，每一份使用不同的訓練數據進行訓練。

同步模式深度學習訓練

在同步模式下，所有的設備同時讀取參數的取值，並且當反向傳播算法完成之後同步更新參數的取值。

單個設備不會單獨對參數進行更新，而會等待所有設備都完成反向傳播之後再統一更新參數。

分析

圖中在每一輪迭代時，不同設備首先統一讀取當前參數的取值，並隨機獲取一小部分數據。

深度學習TensorFlow如何使用多GPU並行模式？

然後在不同設備上運行反向傳播過程得到在各自訓練數據上參數的梯度。

當所有設備完成反向傳播的計算之後，需要計算出不同設備上參數梯度的平均值，最後再根據平均值對參數進行更新。

3多GPU並行

下面將給出具體的TensorFlow代碼，在一臺機器的多個GPU上並行訓練深度學習模型。

–因為一般來說一臺機器上的多個GPU性能相似，所以在這種設置下，會更多地採用同步模式，訓練深度學習模型。

下面將給出具體的代碼，在多GPU上訓練深度學習模型解決MNIST問題。

–樣例代碼將沿用mnist_inference.py程序，來完成神經網絡的前向傳播過程。

–新的神經網絡訓練程序是mnist_multi_ gpu_train.py

運行樣例

運行MNIST樣例程序時GPU的使用情況

深度學習TensorFlow如何使用多GPU並行模式？

–因為定義的神經網絡規模比較小，所以在圖中顯示的GPU使用率不高。

–如果訓練大型的神經網絡模型，TensorFlow將會佔滿所有用到的GPU。

相關推薦

'如何優化人工智能、機器學習和深度學習的存儲'

"如今的人工智能和深度學習應用程序中使用了大數據集和快速I/O技術，但數據存儲可能會導致性能問題。人們需要了解人工智能和深度學習存儲系統應該具備哪些功能。人工智能技術廣泛應用在機器學習和深度學習中，已經引發了研究和產品開發的爆炸性增長，因為企業發現了創造性的方法，將這些新算...

人工智能深度學習機器學習設計操作系統算法軟件技術分佈式計算 GPU 硬件英偉達工程師人生第一份工作中央處理器電腦固態硬盤 2019-09-16

'機器學習和深度學習的區別是什麼'

"機器學習和深度學習是人工智能的兩個子集，在過去兩年中引起了很多關注。如果你在這裡想以最簡單的方式理解這兩個術語，那就沒有比這更好的地方了。人工智能這兩個領域，即機器學習和深度學習，提出了比整個領域組合更多的問題，主要是因為這兩個領域經常混淆並在提到數據統計建模時可以互換使...

機器學習深度學習人工智能算法技術軟件設計高德納集團人生第一份工作維基百科 2019-09-15

'「NLP」如何系統性的學習NLP，有三AI-NLP知識星球等你來'

"文 | 小Dream哥編輯 | 言有三星球開設的必要性時間過的很快，轉眼在有三AI開設NLP專欄已經2個月了。是時候總結下了，我們的NLP專欄按計劃更新了NLP中用的常用的機器學習模型，深度學習特徵抽取器從RNN講到了Transformer，馬上就要更新BERT。基本上聊...

人工智能機器人技術電腦工程師機器學習讀書 2019-09-15

'機器學習&深度學習基礎（tensorflow版本實現的算法概述0）'

"tensorflow集成和實現了各種機器學習基礎的算法，可以直接調用。代碼集：https://github.com/ageron/handson-ml監督學習1）決策樹（Decision Tree）和隨機森林決策樹：決策樹是一種樹形結構，為人們提供決策依據，決策樹可以用...

機器學習算法深度學習隨機森林 2019-09-14

'學習PythonforDataScience:如何科學的使用Python'

"Python for Data Science是數據分析領域專業人士必須學習的東西。隨著IT行業的發展，對熟練數據科學家的需求急劇增加，Python已經發展成為最受歡迎的編程語言。通過這篇博客，您將學習基礎知識，如何分析數據，然後使用Python創建一些漂亮的可視化。這篇...

Python 可視化技術機器學習腳本語言瀏覽器算術 Guido 算法筆記本電腦 2019-09-14

'又有一本深度學習方面的入門書要與您見面啦'

"小編告訴您一個好消息，有一本最新的深度學習入門書即將要與您見面。喜歡深度學習的朋友們可以關注一下。深度學習案例精粹（Deep Learning By Example）使用TensorFlow框架，輕鬆理解深度學習算法包含大量案例，快速動手實現深度學習任務可下載配套源碼+...

深度學習人工智能算法機器學習自然語言處理電腦人生第一份工作生物醫學 CNN 讀書 2019-09-13

'「專利解密」騰訊遊戲是如何利用深度學習技術的'

"集微網消息，2019世界人工智能大會在上海開幕。會上，騰訊董事會主席兼CEO馬化騰在開幕式演講上重點講了關於AI的內容。他表示，一年來，在上海地區，騰訊在人工智能、雲計算等領域都有大幅投入。去年此時，騰訊華東總部在上海成立，目前已擁有超5000人團隊。騰訊電競的6大職業賽...

深度學習騰訊遊戲騰訊 2019世界人工智能大會技術上海人工智能王者聯盟雲計算通信算法馬化騰機器人 2019-09-12

'Deep CARs：使用Pytorch學習框架實現遷移學習'

"全文共13449字，預計學習時長26分鐘或更長圖片來源：https://www.pexels.com/photo/vehicles-parked-inside-elevated-parking-lot-63294/如何讓電腦識別不同的汽車品牌？想用手機拍任何一輛車就能知道...

GPU 人工智能電腦 Kaggle Google 中央處理器深度學習數據庫 JSON 硬件盜夢空間動物 2019-09-12

'深度學習的完整硬件指南'

"原標題 | A Full Hardware Guide to Deep Learning作者 | Tim Dettmers 譯者 | linlh、呀啦呼（Tufts University）、Ryan222（重慶郵電大學）深度學習是非常消耗計算資源的，毫無疑問這就需要多核高...

深度學習 GPU 中央處理器硬件技術跳槽那些事兒德州儀器 Linux 心理學 Kaggle 市場營銷重慶 2019-09-12

'基於深度學習的人臉檢測和識別方法介紹'

"關注微信公眾號：人工智能前沿講習，重磅乾貨，第一時間送達人臉識別分人臉驗證（face verification）和人臉確認（face identification）；前者是指兩個人是不是同一個人，即1-to-1 mapping，而後者是確定一個人是一群人中的某個，即1-t...

深度學習人臉識別算法設計歐幾里得人工智能照相機大和族 Branch CNN 2019-09-11

'顛覆未來，看英特爾如何玩轉多芯片封裝架構'

"新興技術的到來不斷推動時代的發展。在PC時代，英特爾技術創新很大程度上是依賴於晶體管密度提高和CPU架構的創新。而走進數據時代，英特爾開始建立起全新路徑。去年年底，在2018年12月英特爾“架構日”活動上，英特爾首次提出“六大技術支柱”的概念，也就是製程&封裝、架...

英特爾 X86 技術軟件中央處理器硬件 GPU 圖像處理設計工程師上海人工智能市場營銷投資 2019-09-11

'python之父：零基礎學python，如何學習最為快速？這套教程請收好'

"1.Python的設計目標1999年，吉多*範羅蘇姆向DARPA提交了一條名為”Computer Programming For Everybody”的資金申請，並在後來說明了他對Python的目標：1.一門簡單直觀的語言並與主要競爭者一樣強大2.開源，以便任何人都可以為...

Python 設計機器學習數據庫 Java 工程師人工智能算法 2019-09-09

'5分鐘內看懂機器學習和深度學習的區別'

"在本文中，我們將研究深度學習和機器學習之間的差異。我們將逐一瞭解它們，然後討論他們在各個方面的不同之處。除了深度學習和機器學習的比較外，我們還將研究他們未來的趨勢和走向。深度學習 VS 機器學習深度學習與機器學習簡介一、什麼是機器學習？通常，為了實現人工智能，我們使用機器...

人工智能算法自然語言處理技術信息檢索 GPU 人生第一份工作市場營銷隨機森林 2019-09-09

' 一文了解Netflix 如何深度使用Scheduling Jupyter Notebooks '

"在Netflix，我們投入了大量的努力，將Notebooks作為一個綜合開發平臺超越互動：看Netflix是如何將Jupyter Notebook使用到極致的。這個想法開始於對未來開發和協作接口的討論。它發展成為一個戰略賭注在Notebooks上，既作為一個互動的用戶界面...

Netflix 工程師筆記本電腦人生第一份工作 Git JSON 機器學習 2019-09-08

'零基礎自學python，如何學習最為快速？阿里大佬：這套教程請收好'

"1.Python的設計目標1999年，吉多*範羅蘇姆向DARPA提交了一條名為”Computer Programming For Everybody”的資金申請，並在後來說明了他對Python的目標：1.一門簡單直觀的語言並與主要競爭者一樣強大2.開源，以便任何人都可以為...

Python 設計機器學習數據庫 Java 算法工程師人工智能 2019-09-07

'「大數據分析」深入淺出：如何從零開始學習大數據分析與挖掘'

"文章梳理了學習大數據挖掘分析的思路與步驟，給大家提供一些參考，希望能夠對你有所幫助。最近有很多人想學習大數據，但不知道怎麼入手，從哪裡開始學習，需要學習哪些東西？對於一個初學者，學習大數據分析與挖掘的思路邏輯是什麼？本文就梳理了如何從0開始學習大數據挖掘分析，學習的步驟思...

數據挖掘大數據數據庫算法機器學習 Python SPSS 可視化技術技術人生第一份工作工程師文章人工智能軟件編程語言深度學習 2019-09-05

'2019深度學習語音合成指南'

"雷鋒網AI科技評論編者按：人工合成人類語音被稱為語音合成。這種基於機器學習的技術適用於文本轉換語音（text-to-speech）、音樂生成、語音生成、語音支持設備、導航系統以及為視障人士提供無障礙服務。在這篇文章中，我們將研究基於深度學習而進行的研究或模型框架。在我們正...

語音合成深度學習人工智能跳槽那些事兒技術數據庫 Google 文章音樂機器學習算法 2019-09-05

'揭祕人工智能深度學習算法的奧祕'

"話說當前最熱門的技術是什麼？我想非人工智能莫屬。雖說大導演斯皮爾伯格在2001年就拍攝了好萊塢大片《人工智能》，但他怎麼又能想到十幾年後人類在人工智能領域紮紮實實得走出了一大步——以阿爾法機器人為代表的人工智能橫空出世，在圍棋上戰勝了人類最強棋手。具備學習思考能力的機器人...

人工智能深度學習算法電腦機器學習技術機器人九陽神功文章 2019-09-03

推薦中...