'AI戰略說到做到!華為最強AI芯片啟動暴力計算'

"

去年10月,華為在全聯接大會2018上,首次宣佈了華為的AI的戰略,併發布了基於達芬奇架構的自研“昇騰(Ascend )”系列AI芯片,向全球首次發了華為自研的昇騰310 AI處理器,並預告了昇騰910 AI處理器的相關參數,這兩款芯片也被業界看作為“華為面向AI華麗的轉身”。時隔不到一年,華為在AI的戰略領地再上一層樓,8月23日,華為在深圳阪田基地正式發佈了算力最強的AI處理器Ascend 910,及全場景AI計算框架MindSpore,用更快的速度、更低的功耗、以及更自由的使用度,支撐人類對未來的創新與探索。

昇騰910 AI處理器正式商用

此次正式發佈的AI芯片是昇騰910,屬於Ascend-max系列。在HC2018上已經發布了其技術規格。而實際測試結果表明,在算力方面,昇騰910完全達到了設計規格,即:半精度 (FP16)算力達到256 Tera-FLOPS,整數精度 (INT8) 算力達到512 Tera-OPS,重要的是,達到規格算力所需功耗僅310W,明顯低於設計規格的350W。徐直軍表示:昇騰910總體技術表現超出預期,作為算力最強AI處理器,當之無愧。

"

去年10月,華為在全聯接大會2018上,首次宣佈了華為的AI的戰略,併發布了基於達芬奇架構的自研“昇騰(Ascend )”系列AI芯片,向全球首次發了華為自研的昇騰310 AI處理器,並預告了昇騰910 AI處理器的相關參數,這兩款芯片也被業界看作為“華為面向AI華麗的轉身”。時隔不到一年,華為在AI的戰略領地再上一層樓,8月23日,華為在深圳阪田基地正式發佈了算力最強的AI處理器Ascend 910,及全場景AI計算框架MindSpore,用更快的速度、更低的功耗、以及更自由的使用度,支撐人類對未來的創新與探索。

昇騰910 AI處理器正式商用

此次正式發佈的AI芯片是昇騰910,屬於Ascend-max系列。在HC2018上已經發布了其技術規格。而實際測試結果表明,在算力方面,昇騰910完全達到了設計規格,即:半精度 (FP16)算力達到256 Tera-FLOPS,整數精度 (INT8) 算力達到512 Tera-OPS,重要的是,達到規格算力所需功耗僅310W,明顯低於設計規格的350W。徐直軍表示:昇騰910總體技術表現超出預期,作為算力最強AI處理器,當之無愧。

AI戰略說到做到!華為最強AI芯片啟動暴力計算

昇騰910

將昇騰910用於實際AI訓練任務。比如,在典型的ResNet50 網絡的訓練中,昇騰910與MindSpore配合,與現有主流訓練單卡配合TensorFlow相比,顯示出接近2倍的性能提升。面向未來,針對不同的場景,包括邊緣計算、自動駕駛車載計算、訓練等場景,華為將持續投資,推出更多的AI處理器,面向全場景持續提供更充裕、更經濟、更適配的AI算力。

華為公司輪值董事長徐直軍在發佈會上表示:華為自2018年10月發佈AI戰略以來,穩步而有序地推進戰略執行、產品研發及商用進程。昇騰910、MindSpore的推出,標誌著華為已完成全棧全場景AI解決方案(Portfolio)的構建,也標誌著華為AI戰略的執行進入了新的階段。

會上有記者提問:華為之前談到,芯片要自主可控,又談及開放合作,那麼芯片會否成為獨立的業務?對此,徐直軍表示,不會把昇騰作為獨立芯片面向市場。不僅如此,我們還希望,與其它AI芯片開發企業探討合作,讓他們的芯片運用於我們多樣化的場景中。

華為AI芯片的進階之路

華為目前的昇騰AI系列芯片覆蓋終端、邊緣及數據中心所有領域的產品及服務。

2017年,華為在業內重磅推出手機AI芯片麒麟970,麒麟970是業界首顆帶有獨立NPU專用硬件處理單元的手機芯片,華為終端官方微博稱,相較於四個Cortex-A73核心,處理相同 AI任務,新的異構計算架構擁有約50倍能效和25倍性能優勢,圖像識別速度可達到約2000 張/分鐘。在傳統的手機 SoC 上,額外增加一顆專門為 AI 相關運算定製的芯片(NPU),全面提升了智能手機的用戶體驗,也讓AI專用硬件處理單元的設計成為了行業的發展趨勢。

2018年8月,華為繼續乘勝追擊,在德國IFA展上重磅發佈新一代的手機AI芯片麒麟980,

麒麟980創下的“六個全球首款”,包括全球首款商用7nm手機SoC芯片;全球首款ARM Cortex-A76架構CPU;全球首款雙核NPU;全球首款Mali-G76 GPU;全球首款1.4Gbps Cat.21調制解調器;全球首款支持2133MHz LPDDR4X的手機SoC芯片。麒麟980是華為最新的手機AI芯片,主要面向手機終端,為用戶提供基於端側AI運算的應用,帶給消費者更多豐富、智慧的手機使用體驗。

如今,人工智能已經進入高速發展時期,傳統的雲端及中心側計算已經無法滿足移動設備及其他智能終端的需求,AI向邊緣側及端側發展成為必然趨勢,2018年10月10日,在全聯接大會2018上,華為發佈了自研雲端AI芯片“昇騰(Ascend )”系列,基於達芬奇架構,

首批推出12nm的昇騰310,助力AI向端側及邊緣側延伸。Ascend 310是業界面向邊緣計算場景最強算力的AI SoC,Ascend 310採用針對AI計算特點而設計的全新Da Vinci計算架構,以高性能3D Cube計算引擎為基礎,針對矩陣運算進行加速,大幅提高單位功耗下的AI算力,每個AI Core可以在一個時鐘週期內實現4096個MAC操作,相比傳統的CPU和GPU實現數量級的提升。徐志軍表示,在已經商用Ascend 310基礎上,計劃2021年將推出Ascend 320。

"

去年10月,華為在全聯接大會2018上,首次宣佈了華為的AI的戰略,併發布了基於達芬奇架構的自研“昇騰(Ascend )”系列AI芯片,向全球首次發了華為自研的昇騰310 AI處理器,並預告了昇騰910 AI處理器的相關參數,這兩款芯片也被業界看作為“華為面向AI華麗的轉身”。時隔不到一年,華為在AI的戰略領地再上一層樓,8月23日,華為在深圳阪田基地正式發佈了算力最強的AI處理器Ascend 910,及全場景AI計算框架MindSpore,用更快的速度、更低的功耗、以及更自由的使用度,支撐人類對未來的創新與探索。

昇騰910 AI處理器正式商用

此次正式發佈的AI芯片是昇騰910,屬於Ascend-max系列。在HC2018上已經發布了其技術規格。而實際測試結果表明,在算力方面,昇騰910完全達到了設計規格,即:半精度 (FP16)算力達到256 Tera-FLOPS,整數精度 (INT8) 算力達到512 Tera-OPS,重要的是,達到規格算力所需功耗僅310W,明顯低於設計規格的350W。徐直軍表示:昇騰910總體技術表現超出預期,作為算力最強AI處理器,當之無愧。

AI戰略說到做到!華為最強AI芯片啟動暴力計算

昇騰910

將昇騰910用於實際AI訓練任務。比如,在典型的ResNet50 網絡的訓練中,昇騰910與MindSpore配合,與現有主流訓練單卡配合TensorFlow相比,顯示出接近2倍的性能提升。面向未來,針對不同的場景,包括邊緣計算、自動駕駛車載計算、訓練等場景,華為將持續投資,推出更多的AI處理器,面向全場景持續提供更充裕、更經濟、更適配的AI算力。

華為公司輪值董事長徐直軍在發佈會上表示:華為自2018年10月發佈AI戰略以來,穩步而有序地推進戰略執行、產品研發及商用進程。昇騰910、MindSpore的推出,標誌著華為已完成全棧全場景AI解決方案(Portfolio)的構建,也標誌著華為AI戰略的執行進入了新的階段。

會上有記者提問:華為之前談到,芯片要自主可控,又談及開放合作,那麼芯片會否成為獨立的業務?對此,徐直軍表示,不會把昇騰作為獨立芯片面向市場。不僅如此,我們還希望,與其它AI芯片開發企業探討合作,讓他們的芯片運用於我們多樣化的場景中。

華為AI芯片的進階之路

華為目前的昇騰AI系列芯片覆蓋終端、邊緣及數據中心所有領域的產品及服務。

2017年,華為在業內重磅推出手機AI芯片麒麟970,麒麟970是業界首顆帶有獨立NPU專用硬件處理單元的手機芯片,華為終端官方微博稱,相較於四個Cortex-A73核心,處理相同 AI任務,新的異構計算架構擁有約50倍能效和25倍性能優勢,圖像識別速度可達到約2000 張/分鐘。在傳統的手機 SoC 上,額外增加一顆專門為 AI 相關運算定製的芯片(NPU),全面提升了智能手機的用戶體驗,也讓AI專用硬件處理單元的設計成為了行業的發展趨勢。

2018年8月,華為繼續乘勝追擊,在德國IFA展上重磅發佈新一代的手機AI芯片麒麟980,

麒麟980創下的“六個全球首款”,包括全球首款商用7nm手機SoC芯片;全球首款ARM Cortex-A76架構CPU;全球首款雙核NPU;全球首款Mali-G76 GPU;全球首款1.4Gbps Cat.21調制解調器;全球首款支持2133MHz LPDDR4X的手機SoC芯片。麒麟980是華為最新的手機AI芯片,主要面向手機終端,為用戶提供基於端側AI運算的應用,帶給消費者更多豐富、智慧的手機使用體驗。

如今,人工智能已經進入高速發展時期,傳統的雲端及中心側計算已經無法滿足移動設備及其他智能終端的需求,AI向邊緣側及端側發展成為必然趨勢,2018年10月10日,在全聯接大會2018上,華為發佈了自研雲端AI芯片“昇騰(Ascend )”系列,基於達芬奇架構,

首批推出12nm的昇騰310,助力AI向端側及邊緣側延伸。Ascend 310是業界面向邊緣計算場景最強算力的AI SoC,Ascend 310採用針對AI計算特點而設計的全新Da Vinci計算架構,以高性能3D Cube計算引擎為基礎,針對矩陣運算進行加速,大幅提高單位功耗下的AI算力,每個AI Core可以在一個時鐘週期內實現4096個MAC操作,相比傳統的CPU和GPU實現數量級的提升。徐志軍表示,在已經商用Ascend 310基礎上,計劃2021年將推出Ascend 320。

AI戰略說到做到!華為最強AI芯片啟動暴力計算

Ascend 310已獲得廣泛商用

2019年8月9日,華為在東莞召開的2019 年度的華為開發者大會上,餘承東表示真正的AI全場景智慧時代正在來臨,華為所倡導的智能家居,萬物互聯、萬物智能時代 IoT,所有家電都要智能化。華為也是業界第一家在智能終端中引入 AI,從麒麟970到980,引入AI處理器、NPU。還發展AI生態,打造Hi-AI開放平臺,引領AI體驗創新。隨著昇騰910 AI處理器以及 MindSpore全場景AI計算框架的推出,華為全棧全場景AI解決方案各重要組成部分悉數登場,因此可以說,華為已完成了全棧全場景AI解決方案的構建。

華為這些年一直注重AI人才的吸引和培育,在此次會議上,徐直軍表示,華為正在努力點亮“人才燈塔”。最近華為推出天才少年計劃,希望全球的天才少年加入華為,這是華為吸納人才的措施之一。昇騰芯片投資立項並不是自上而下,而是自下而上,這正是人才發揮的價值。

生態鏈的構建是重中之重

只有芯片提供算力還不夠,重要的是構建開發者生態。

前有谷歌TensorFlow、Facebook PyTorch以及百度的PaddlePaddle在先,華為還是想要打造屬於自己的整套軟硬件統一框架,從底層算法到應用,從訓練到部署,從雲端到終端完全打通,華為的雄心只增不減。

為了助力開發者與產業更加從容地應對人工智能時代的面臨的系統級挑戰,此次深圳發佈會上,華為推出了面向端-邊-雲全場景按需協同、統一的AI訓練推理框架MindSpore。源於

全產業的最佳實踐,全場景AI計算框架MindSpore為開發者帶來編程更簡單、調試更輕鬆、性能更卓越、部署更靈活的體驗,降低用AI門檻。

在去年華為全聯接大會上,華為提出,AI框架應該是開發態友好(例如顯著減少訓練時間和成本)和運行態高效(例如最少資源和最高能效比),更重要的是,要能適應每個場景包括端、邊緣和雲。經過近一年的努力,全場景AI計算框架MindSpore在這三個方面都取得了顯著進展。

針對不同的運行環境,MindSpore框架架構上支持可大可小,適應全場景獨立部署。MindSpore框架通過協同經過處理後的、不帶有隱私信息的梯度、模型信息,而不是數據本身,以此實現在保證用戶隱私數據保護的前提下跨場景協同。通過MindSpore框架自身的技術創新及其與昇騰處理器協同優化,有效克服AI計算的複雜性和算力的多樣性挑戰,實現了運行態的高效,大大提高了計算性能。除了昇騰處理器,MindSpore同時也支持GPU、CPU等其它處理器。

好消息是,為了更好促進AI的應用,徐直軍在會上宣佈“MindSpore將在2020年Q1開源”,助力每一位開發者,促進AI產業生態發展。

在AI應用如此廣泛的今天,選擇統一架構來開發也是非常重要的一環。為了實現AI在多平臺多場景之間的協同,去年,華為推出了自研AI芯片架構——達芬奇。對此,華為官方微信近日也對達芬奇架構做了詳盡的介紹,說到AI計算,其核心就是矩陣乘法運算,典型的神經網絡模型計算量都非常大,這其中99%的計算都需要用到矩陣乘,所以如果能夠提高矩陣乘的運算效率,就能最大程度上提升AI算力——這也是達芬奇架構設計的核心:以最小的計算代價增加矩陣乘的算力,實現更高的AI能效。

"

去年10月,華為在全聯接大會2018上,首次宣佈了華為的AI的戰略,併發布了基於達芬奇架構的自研“昇騰(Ascend )”系列AI芯片,向全球首次發了華為自研的昇騰310 AI處理器,並預告了昇騰910 AI處理器的相關參數,這兩款芯片也被業界看作為“華為面向AI華麗的轉身”。時隔不到一年,華為在AI的戰略領地再上一層樓,8月23日,華為在深圳阪田基地正式發佈了算力最強的AI處理器Ascend 910,及全場景AI計算框架MindSpore,用更快的速度、更低的功耗、以及更自由的使用度,支撐人類對未來的創新與探索。

昇騰910 AI處理器正式商用

此次正式發佈的AI芯片是昇騰910,屬於Ascend-max系列。在HC2018上已經發布了其技術規格。而實際測試結果表明,在算力方面,昇騰910完全達到了設計規格,即:半精度 (FP16)算力達到256 Tera-FLOPS,整數精度 (INT8) 算力達到512 Tera-OPS,重要的是,達到規格算力所需功耗僅310W,明顯低於設計規格的350W。徐直軍表示:昇騰910總體技術表現超出預期,作為算力最強AI處理器,當之無愧。

AI戰略說到做到!華為最強AI芯片啟動暴力計算

昇騰910

將昇騰910用於實際AI訓練任務。比如,在典型的ResNet50 網絡的訓練中,昇騰910與MindSpore配合,與現有主流訓練單卡配合TensorFlow相比,顯示出接近2倍的性能提升。面向未來,針對不同的場景,包括邊緣計算、自動駕駛車載計算、訓練等場景,華為將持續投資,推出更多的AI處理器,面向全場景持續提供更充裕、更經濟、更適配的AI算力。

華為公司輪值董事長徐直軍在發佈會上表示:華為自2018年10月發佈AI戰略以來,穩步而有序地推進戰略執行、產品研發及商用進程。昇騰910、MindSpore的推出,標誌著華為已完成全棧全場景AI解決方案(Portfolio)的構建,也標誌著華為AI戰略的執行進入了新的階段。

會上有記者提問:華為之前談到,芯片要自主可控,又談及開放合作,那麼芯片會否成為獨立的業務?對此,徐直軍表示,不會把昇騰作為獨立芯片面向市場。不僅如此,我們還希望,與其它AI芯片開發企業探討合作,讓他們的芯片運用於我們多樣化的場景中。

華為AI芯片的進階之路

華為目前的昇騰AI系列芯片覆蓋終端、邊緣及數據中心所有領域的產品及服務。

2017年,華為在業內重磅推出手機AI芯片麒麟970,麒麟970是業界首顆帶有獨立NPU專用硬件處理單元的手機芯片,華為終端官方微博稱,相較於四個Cortex-A73核心,處理相同 AI任務,新的異構計算架構擁有約50倍能效和25倍性能優勢,圖像識別速度可達到約2000 張/分鐘。在傳統的手機 SoC 上,額外增加一顆專門為 AI 相關運算定製的芯片(NPU),全面提升了智能手機的用戶體驗,也讓AI專用硬件處理單元的設計成為了行業的發展趨勢。

2018年8月,華為繼續乘勝追擊,在德國IFA展上重磅發佈新一代的手機AI芯片麒麟980,

麒麟980創下的“六個全球首款”,包括全球首款商用7nm手機SoC芯片;全球首款ARM Cortex-A76架構CPU;全球首款雙核NPU;全球首款Mali-G76 GPU;全球首款1.4Gbps Cat.21調制解調器;全球首款支持2133MHz LPDDR4X的手機SoC芯片。麒麟980是華為最新的手機AI芯片,主要面向手機終端,為用戶提供基於端側AI運算的應用,帶給消費者更多豐富、智慧的手機使用體驗。

如今,人工智能已經進入高速發展時期,傳統的雲端及中心側計算已經無法滿足移動設備及其他智能終端的需求,AI向邊緣側及端側發展成為必然趨勢,2018年10月10日,在全聯接大會2018上,華為發佈了自研雲端AI芯片“昇騰(Ascend )”系列,基於達芬奇架構,

首批推出12nm的昇騰310,助力AI向端側及邊緣側延伸。Ascend 310是業界面向邊緣計算場景最強算力的AI SoC,Ascend 310採用針對AI計算特點而設計的全新Da Vinci計算架構,以高性能3D Cube計算引擎為基礎,針對矩陣運算進行加速,大幅提高單位功耗下的AI算力,每個AI Core可以在一個時鐘週期內實現4096個MAC操作,相比傳統的CPU和GPU實現數量級的提升。徐志軍表示,在已經商用Ascend 310基礎上,計劃2021年將推出Ascend 320。

AI戰略說到做到!華為最強AI芯片啟動暴力計算

Ascend 310已獲得廣泛商用

2019年8月9日,華為在東莞召開的2019 年度的華為開發者大會上,餘承東表示真正的AI全場景智慧時代正在來臨,華為所倡導的智能家居,萬物互聯、萬物智能時代 IoT,所有家電都要智能化。華為也是業界第一家在智能終端中引入 AI,從麒麟970到980,引入AI處理器、NPU。還發展AI生態,打造Hi-AI開放平臺,引領AI體驗創新。隨著昇騰910 AI處理器以及 MindSpore全場景AI計算框架的推出,華為全棧全場景AI解決方案各重要組成部分悉數登場,因此可以說,華為已完成了全棧全場景AI解決方案的構建。

華為這些年一直注重AI人才的吸引和培育,在此次會議上,徐直軍表示,華為正在努力點亮“人才燈塔”。最近華為推出天才少年計劃,希望全球的天才少年加入華為,這是華為吸納人才的措施之一。昇騰芯片投資立項並不是自上而下,而是自下而上,這正是人才發揮的價值。

生態鏈的構建是重中之重

只有芯片提供算力還不夠,重要的是構建開發者生態。

前有谷歌TensorFlow、Facebook PyTorch以及百度的PaddlePaddle在先,華為還是想要打造屬於自己的整套軟硬件統一框架,從底層算法到應用,從訓練到部署,從雲端到終端完全打通,華為的雄心只增不減。

為了助力開發者與產業更加從容地應對人工智能時代的面臨的系統級挑戰,此次深圳發佈會上,華為推出了面向端-邊-雲全場景按需協同、統一的AI訓練推理框架MindSpore。源於

全產業的最佳實踐,全場景AI計算框架MindSpore為開發者帶來編程更簡單、調試更輕鬆、性能更卓越、部署更靈活的體驗,降低用AI門檻。

在去年華為全聯接大會上,華為提出,AI框架應該是開發態友好(例如顯著減少訓練時間和成本)和運行態高效(例如最少資源和最高能效比),更重要的是,要能適應每個場景包括端、邊緣和雲。經過近一年的努力,全場景AI計算框架MindSpore在這三個方面都取得了顯著進展。

針對不同的運行環境,MindSpore框架架構上支持可大可小,適應全場景獨立部署。MindSpore框架通過協同經過處理後的、不帶有隱私信息的梯度、模型信息,而不是數據本身,以此實現在保證用戶隱私數據保護的前提下跨場景協同。通過MindSpore框架自身的技術創新及其與昇騰處理器協同優化,有效克服AI計算的複雜性和算力的多樣性挑戰,實現了運行態的高效,大大提高了計算性能。除了昇騰處理器,MindSpore同時也支持GPU、CPU等其它處理器。

好消息是,為了更好促進AI的應用,徐直軍在會上宣佈“MindSpore將在2020年Q1開源”,助力每一位開發者,促進AI產業生態發展。

在AI應用如此廣泛的今天,選擇統一架構來開發也是非常重要的一環。為了實現AI在多平臺多場景之間的協同,去年,華為推出了自研AI芯片架構——達芬奇。對此,華為官方微信近日也對達芬奇架構做了詳盡的介紹,說到AI計算,其核心就是矩陣乘法運算,典型的神經網絡模型計算量都非常大,這其中99%的計算都需要用到矩陣乘,所以如果能夠提高矩陣乘的運算效率,就能最大程度上提升AI算力——這也是達芬奇架構設計的核心:以最小的計算代價增加矩陣乘的算力,實現更高的AI能效。

AI戰略說到做到!華為最強AI芯片啟動暴力計算

達芬奇架構,是華為自研的面向AI計算特徵的全新計算架構,具備高算力、高能效、靈活可裁剪的特性,是實現萬物智能的重要基礎。不同於以往的標量、矢量運算模式,華為達芬奇架構以高性能3D Cube計算引擎為基礎,針對矩陣運算進行加速,大幅提高單位面積下的AI算力,充分激發端側AI的運算潛能。

基於達芬奇架構的昇騰AI系列芯片分為5個系列,Max、Lite、Mini、Tiny、Nano。Ascend-Nano可以用於耳機電話等IoT設備的使用場景;Ascend-Tiny和Ascend-Lite用於智能手機的AI運算處理;在筆記本電腦等算力需求更高的便攜設備上,由Ascend 310(Ascend-Mini)提供算力支持;而邊緣側服務器上則需要由Multi-Ascend 310完成AI計算;至於超複雜的雲端數據運算處理,則交由算力最高可達256 TFLOPS@FP16的Ascend 910(Ascend-Max)來完成。正是由於達芬奇架構靈活可裁剪、高能效的特性,才能實現對多種複雜場景的AI運算處理。

除此之外,統一架構優勢很明顯,那就是對廣大開發者非常利好。基於達芬奇架構的統一性,開發者在面對雲端、邊緣側、端側等全場景應用開發時,只需要進行一次算子開發和調試,就可以應用於不同平臺,大幅降低了遷移成本。

結語

大會最後,徐直軍預告,在即將開幕的華為全聯接大會2019,將有更多震撼的AI新品提出。事實證明,只有擁有自研AI技術、芯片和開發者生態的公司,才是能走得長遠的公司。隨著昇騰910 AI處理器以及MindSpore全場景AI計算框架的發佈,對華為AI,這是一個新的里程碑,更是一個新的開始。

"

相關推薦

推薦中...