一文看盡飛槳PaddlePaddle新升級：5大優勢更低門檻使用深度學習

人工智能算法百度設計自然語言處理技術大數據固態硬盤百度AI 2019-07-13

飛槳（ PaddlePaddle ）是國內唯一功能完備的端到端開源深度學習平臺，集深度學習訓練和預測框架、模型庫、工具組件、服務平臺為一體，其兼具靈活和效率的開發機制、工業級應用效果的模型、超大規模並行深度學習能力、推理引擎一體化設計以及系統化的服務支持，致力於讓深度學習技術的創新與應用更簡單。

從 PaddleFluidv1.0 以來，飛槳致力於打造更好的用戶體驗，趁著百度開發者大會，也為用戶精心準備了一份大禮，在開發、訓練及部署全流程上進行了全新升級，發佈了飛槳的五大特性。接下來小編為您一一解讀。

一、動態圖&靜態圖 - 兼具動態圖和靜態圖兩種計算圖的優勢

從飛槳核心框架 PadldeFluid v1.5開始，飛槳同時為用戶提供動態圖和靜態圖兩種機制。靜態圖是先定義網絡結構而後運行，對定義好的圖結構進行分析，可以使運行速度更快，顯存佔用更低，在業務部署上線上的具有非常大的優勢，為用戶的 AI 應用落地提供高效支持。但是靜態圖組網和執行階段是分開，對於新用戶理解起來不太友好。

飛槳從最新版本開始，提供了更方便的動態圖模式，所有操作可以立即獲得執行結果，而不必等到執行階段才能獲取到結果，這樣可以更方便進行模型的調試，同時還減少了大量用於構建 Executor 等代碼，使得編寫、調試網絡的過程變得更加便捷。用戶可以使用更加便捷的動態圖模式進行調試、訓練，然後可以把訓練好的模型轉換為靜態圖的結構，快速上線部署。

二、應用效果最佳的官方模型 - 覆蓋三大主流任務

基於百度多年的產業應用經驗，以及百度生態夥伴的人工智能解決方案實踐，飛槳為用戶提供70+精選經過真實業務場景驗證的、應用效果最佳的官方算法模型，涵蓋視覺、 NLP 、語音和推薦等 AI 核心技術領域。

飛槳自然語言處理模型庫 PaddleNLP ：基於飛槳打造的工業級中文 NLP 開源工具集，擁有當前業內效果最好的中語義表示模型和基於百億級大數據訓練的預訓練模型，並將自然語言處理領域的多種模型用一套共享骨架代碼實現，可大大減少用戶在開發過程中的重複工作。用戶在極大地減少研究和開發成本的同時，也可以獲得更好的基於工業實踐的應用效果。

本次發佈的 PaddleNLP-Research ，支持 NLP 前沿研究，現已開源 MRQA 2019閱讀理解競賽 PaddleFluid 基線、 DuConv （ ACL 2019）、 ARNOR （ AC L2019）、 MMPMS （ IJCAI 2019）、 MPM （ NAACL 2019）等近期百度在 NLP 學術領域的工作。

飛槳視覺模型庫 Paddle CV ：基於飛槳打造的業界效果最好的 CV 開源工具集，並開源多個百度自研、國際賽事奪冠方案模型。物體檢測統一框架、圖像分類庫、圖像生成庫、視頻識別庫多個基礎任務庫中，既具備高精度模型、也具備高速推理模型。基於易擴展、易模塊化的操作，用戶可以高效完成各類視覺任務的工業應用。

Paddle Detection 物體檢測統一框架，覆蓋主流的檢測算法，即具備高精度模型、也具備高速推理模型，包含 Faster-RCNN （支持FPN)， Mask-RCNN （支持 FPN ）， Cascade-RCNN ， RetinaNet ， Yolo v3， SSD 算法並提供一系列的預訓練模型，具有工業化、模塊化、高性能的優勢。結合飛槳核心框架的高速推理引擎，訓練到部署無縫銜接；提供模塊化設計，模型網絡結構和數據數據處理均可定製；基於高效的核心框架，訓練速度和顯存佔用上有一定的優勢，例如， YOLO v3 訓練速度相比同類框架快1.6倍。此外，本次除了統一檢測框架，還發布一系列預訓練模型，例如基於改進版的 ResNet 的檢測模型，不增加計算量的情況下，精度普遍提高約1%左右。
圖像分類庫本次新增9個圖像分類模型，截至目前，覆蓋10種、超過25個 ImageNet 預訓練模型，其中 ResNet 模型持續改進，發佈計算量相當的改進模型，例如 ResNet50 Top1 準確率從76.5%提升到79.84%（+3.34%）。
PaddleGAN 為用戶提供易上手的、一鍵式可運行的 GAN 模型，覆蓋主流GAN 算法，包括 CGAN 、 DCGAN 、 Pix2Pix 、 CycleGAN 、 StarGAN 、 STGAN 、ATTGAN ，其中 STGAN 是百度自研的人臉屬性編輯編輯模型，發表於 CVPR 2019。
PaddleVideo 業界首個視頻識別與定位工具集繼4月份發佈，本次持續優化訓練速度，部分模型速度優於同類產品的30%；本次新增加 C-TCN ，百度自研的視頻動作定位模型，也是2018年 ActivityNet 奪冠方案，在飛槳上首次開源。

基於預訓練模型，用戶可以更便捷地完成自己的 AI 應用，飛槳為用戶提供預訓練模型管理和遷移學習組件 Paddle Hub ，可一鍵加載工業級預訓練模型。本次新增發佈29個預訓練模型，共為用戶提供40+預訓練模型，覆蓋文本、圖像、視頻三大領域八類模型。 Paddle Hub 提供 Fine-tune API ，10行代碼即可完成大規模預訓練模型的遷移學習。 Paddle Hub 還引入「模型即軟件」的理念，通過 Python API 或者命令行工具，一行代碼完成預訓練模型的預測。

三、大規模分佈式訓練 - 業界最強的超大規模並行深度學習能力

飛槳同時支持稠密參數和稀疏參數場景的超大規模深度學習並行訓練，支持千億規模參數、數百個節點的高效並行訓練，也是最早提供如此強大的深度學習並行技術的深度學習平臺。

飛槳提供高性價比的多機 CPU 參數服務器解決方案，基於真實的推薦場景的數據驗證，可有效地解決超大規模推薦系統、超大規模數據、自膨脹的海量特徵及高頻率模型迭代的問題，實現高吞吐量和高加速比。

基於 PaddleFluid v1.5，分佈式訓練新發布 High-level API Fleet ，單機轉分佈式訓練成本顯著降低； GPU 多機多卡性能顯著提升，在 ResNet 50、BERT 、 ERNIE 等模型中 4x8v100 配置下相比此前發佈的 Benchmark 提速超過50%。

四、端到端部署 - 推理引擎一體化設計，訓練到多端推理的無縫對接移動端加速

基於 PaddleFluid v1.5，飛槳完整支持多框架、多平臺、多操作系統，為用戶提供高兼容性、高性能的多端部署能力、全面領先的底層加速庫和推理引擎 Paddle Mobile 和 Paddle Serving 。

對於開發者來說，除了模型的訓練，在產品化過程中還會遇到各種各樣的工程化問題。隨著移動設備被廣泛使用，在移動互聯網產品應用深度學習和神經網絡技術已經成為必然趨勢。例如在移動端部署，就需要面臨很多的問題，例如安裝包大小、運行內存佔用大小、推理速度和效果等。當前主流的模型很難直接部署到移動設備中。在4月份的發佈中， PaddleSlim 實現了目前主流的網絡量化、剪枝、蒸餾三種壓縮策略，並可快速配置多種壓縮策略組合使用。針對體積已經很小的 MobileNet 模型，在模型效果不損失的前提下實現 70% 以上的體積壓縮。

本次版本 PaddleSlim 更是進一步升級，新增基於模擬退火的自動剪枝策略和輕量級模型結構自動搜索功能 Light-NAS ，對比 MobileNet v2 在 ImageNet 1000類分類任務上精度無損情況下 FLOPS 減少17%，並在百度的 OCR 識別、人體檢測、人臉關鍵點檢測等業務線應用，精度無損甚至提高的情況下，速度帶來了30%～40%的提升。