百度雲張發恩:高性能的百度雲深度學習平臺為企業賦能

機器學習 深度學習 百度雲 人工智能 中國雲計算 2017-04-27

TEF科技娛樂季(上海站)之2017亞太人工智能峰會於4月21日在上海市世博展覽館隆重召開,大會由AI科學創新與未來、AI深度學習專場、AI語音與視覺識別技術、AI無人駕駛引領汽車、AI與教育、AI與家庭娛樂、AI與計算機視覺、AI與VR、AI與物聯網等板塊組成。

會上,百度雲大數據和人工智能首席架構師張發恩做了題為《百度雲與百度雲深度學習平臺》的精彩演講。他表示,百度雲是大數據、人工智能和雲三位一體的平臺,為企業用戶賦能、創造價值。基於典型的神經網絡模型以及當中使用數據的場景,百度雲做了一些抽象,百度雲深度學習平臺也因此誕生。百度雲深度學習平臺支持用戶按需使用,隨時進行框架模型的訓練和發佈,具有高可靠、高性能、高穩定的引擎。

百度雲張發恩:高性能的百度雲深度學習平臺為企業賦能

以下為張發恩演講全文:

非常感謝各位來賓參與此次人工智能會議。百度雲是一個三位一體的平臺,我們把大數據,人工智能和雲平臺統一,為企業用戶賦能、創造價值。百度雲現今大概有5個大方向:基礎雲、天算、天智、天工和天像。

相信現場在座的各位都瞭解到今天的主題是AI,AI也是時下非常熱門的主題。所以今天我著重講一下天智,即百度雲的人工智能。天智這個取自於韓非子中的一句話“人也者,乘於天明以視,寄於天聰以聽,託於天智以思慮”,名字還是挺文藝的。在天智平臺上,主要有三個方向,一個是感知平臺,一個機器學習平臺,還有一個深度學習平臺。我相信今天AI話題如此火熱跟深度學習的關係是非常緊密的。所以今天我也主要講深度學習平臺。

提到深度學習平臺,我們不得不講一下神經網絡發展的發展歷史。神經網絡的發展歷史上發生過三次典型的成長期、失落期。1943年的時候,這個時候單層感知機特別火熱。後來被證明單層感知機解決不了非線性分類問題。然後在發明了反向傳播算法以後出現了多層感知機,解決了非線性分類問題,一下子又開始火熱起來。一直到1998年以後,它才又進入了低谷時期。所以大家發現神經網絡雖然看起來很美,但實際情況也沒有想象的那麼好。

自2006年以後又開始了一個新的時期,這時候發明了卷積神經網絡,在圖片分類靈域遠遠超出了其他的分類算法,這個算法的火熱程度一直持續到現在還沒有停止下來。在深度學習領域,現在有最重要的兩類神經網絡,一類是卷積神經網絡,它在當下解決了很多的問題,比如大家熟悉的人臉識別技術、圖片分類技術等,都是卷積神經網絡的拿手好戲。卷積神經網絡和AlexNet在2012年紅爆全球,它在ImageNet比賽當中,圖片分類錯誤率從大約從26%降到了15%,發展態勢驚人。

遞歸神經網絡也是非常革命性的進展,它在語言識別、機器翻譯上創造了以往任何一個模型都沒有成功典範,使今天的語音識別和機器翻譯達到了新的高度。遞歸神經網絡在自然語言處理靈域大放異彩,比如機器人寫稿。

基於典型的神經網絡模型以及神經網絡當中使用數據的場景,我們對此做了一些抽象。比如說應用深度學習到我們的項目當中,一般會有數據的收集、存儲、模型訓練等程序,然後再把訓練的模型上到線上。這時候我們就會拿到很多log,然後進一步再去收集,形成這樣的閉環。我們百度雲基於這個抽象開發了百度雲深度學習平臺。

百度雲上的深度學習平臺支持什麼?支持你用各種各樣的現在比較流行的framework。你可以在平臺上使用框架訓練模型,訓練完之後就可以發佈。這裡面有什麼特點呢?我們的平臺是按需使用的,你可以隨時開通一個集群,訓練完以後可以釋放。為什麼百度雲的深度學習平臺這麼先進呢?其實跟百度雲本身對硬件、軟件的獨到的優化選型是有關係的。比如說百度雲對GPU、CPU的選型有嚴格的測試流程。其次百度雲底層的深度學習平臺使用的服務器都是特別定製的,像GPU Box。今天的百度雲已經可以做到一臺服務器上搭載64塊顯卡,這在現在的市面上是不可能找到的。它提供的性能,可靠性、穩定性都不是市場上簡單採購一塊服務器能夠獲得的。

最後是百度雲的硬件實驗室,百度雲深度學習平臺底下的引擎,都會在實驗室中嚴格測試,最終確保我們的百度雲深度學習平臺的引擎是高可靠、高性能、高穩定的。這是百度雲深度學習平臺的GPU資源監控系統,使你做到心裡有數。到底誰用了我的資源?我是不是應該採購更多的資源?還是說我的資源已經過剩了?百度雲深度學習平臺都能使你做到心中有數。

相關推薦

推薦中...