以色列初創AI芯片公司Habana Labs發佈AI訓練芯片

面向對高性能AI芯片擁有剛需的數據中心領域,Habana Labs已經將其產品組合從AI推理處理器擴展到AI訓練處理器,以高性能、低功耗、可擴展、可編程等特性,提供又一種新的雲端AI芯片選擇。

以色列初創AI芯片公司Habana Labs發佈AI訓練芯片

以色列AI芯片公司Habana Labs上週宣佈,推出人工智能處理器Gaudi,專供機器學習訓練(inference)任務。公司首席執行官David Dahan 稱Gaudi“帶來了業界最高的性能”,基於Gaudi訓練系統,可實現比擁有相同數量的GPU系統高近四倍的處理能力。

此前在2018年,Habana Labs推出Goya推理處理器。至此Habana Labs在AI處理芯片的訓練、推理兩端初步形成完整產品線。在訓練端,Gaudi將對英偉達旗下GPU產品形成威脅。

Habana Labs創立於2016年,總部位於以色列特拉維夫,全球擁有約150名員工。官方介紹稱該公司專精於使用人工智能提升芯片處理效能,同時降低芯片成本與電力消耗。2018年11月,在英特爾旗下創投基金英特爾資本(Intel Capital)的領投下,該公司完成7500萬美元的B輪募資,迄今募資約1.2億美元。

AI計算大致分為兩個層面,首先是對模型進行訓練(training),整個過程可能耗時數天;之後是訓練出的模型響應實際請求,做出推理(inference)。目前,英偉達旗下的GPU(圖形處理器)佔據訓練市場,多數推理任務則仍由傳統的英特爾CPU承擔。

“人工智能處理器的性能包括兩點,計算性能和延遲。” Habana Labs首席商務官艾坦·麥地那 (Eitan Medina)認為,,原用於通用計算的GPU和CPU,適用於人工智能計算處理時,在架構上存在“先天不足”。從性能端來看,針對AI計算的專用芯片存在優勢。

以色列初創AI芯片公司Habana Labs發佈AI訓練芯片

艾坦·麥地那表示,AI模型訓練所需的計算能力每年呈指數增長。因此,提高生產率和可擴展性,解決數據中心和雲計算對算力的迫切需求成為至關重要的任務。“為什麼客戶要選擇Gaudi?第一,Gaudi給客戶提供了更強的處理能力,以及更好的性能功耗,第二,就是我們通過內置RDMA以太網處理單元,給客戶提供了一種以前無法實現的可拓展能力。”

在AI訓練中,可擴展能力主要與網絡相關。在拓展性方面,Habana Labs稱,由於Gaudi處理器集成RoCE v2(RDMA over Converged Ethernet)網絡規範,並可搭載最多20個以太網接口,架構上可幾乎實現無限擴展。“與Habana的標準設計相比,基於GPU的系統依賴於專有的系統接口,對系統設計人員來說,這從本質上限制了可擴展性和選擇性。” 艾坦·麥地那說。

Gaudi也將支持主流深度學習框架,包括谷歌開發的TensorFlow、Facebook開發的PyTorch和MXNet等。軟件端,通過Habana Labs自有的SynapseAI軟件棧對訓練模型輸入進行分析和優化,其工具鏈保持開放,供客戶添加專有內核。同時,Habana Labs也添加了Linux驅動支持。

在過去,數據中心裡的計算芯片幾乎都由英特爾、英偉達等芯片大廠供應。11年前英偉達推出了CUDA,作為用GPU做並行計算的框架體系。2012年之後的人工智能浪潮,把英偉達推到了一個獨特地位。鑑於GPU芯片在AI計算市場如此成功,全球不斷有公司試圖進入,打破英偉達市場地位。

隨著谷歌在2016年專門為機器學習打造了TPU(張量處理器),並在自家雲平臺上展現出獨特優勢後,AI定製芯片層出不窮。亞馬遜AWS於2018年11月發佈了公司定製設計的AI芯片AWS Inferentia,用於AI推理。華為、阿里、百度等中國科技巨頭也公佈了各自AI芯片計劃。

對於市場競爭,艾坦·麥地那向媒體表示,AI的應用才剛剛開始,市場前景巨大,目前主旋律不是競爭,而是共同把蛋糕做大。

艾坦·麥地那認為,面向對高性能AI芯片擁有剛需的數據中心領域,Habana Labs已經將其產品組合從AI推理處理器擴展到AI訓練處理器,以高性能、低功耗、可擴展、可編程等特性,提供又一種新的雲端AI芯片選擇。他預計,在未來的人工智能計算應用上,Habana Labs旗下產品可從CPU和GPU中獲得一定市場。

相關推薦

推薦中...