'硬件架構走向多元化,英特爾要以oneAPI一“統”天下?'

"

科技界被一個“快”字裹挾很久了。更高的生產效率和毫不妥協的性能,成為任何一家科技公司的追求。

隨著邁入以數據為中心的時代,我們看到的不僅是數據量的爆發,更是有數據形態的巨大變化:從傳統的文本、圖形數據,到現在的視頻、音頻、社交等非結構化數據,未來還有包括聯網汽車數據、神經網絡數據、基因數據等更多形態的數據。

這種海量數據的多樣性,首先對計算能力提出了巨大的挑戰,由此帶來了數據處理方式和計算架構的延伸。未來十年我們將看到比過去五十年中多得多的架構

與此同時,軟件的重要性被提到了前所未有的高度。英特爾曾提出,對於全新硬件架構的每一個數量級的性能提升潛力,軟件能帶來兩個數量級的性能提升。

為了簡化編程流程、提升效率,英特爾於去年12月宣佈推出oneAPI項目,並將於今年第四季度發佈開發者測試版本。日前,<電子發燒友>在英特爾的溝通會上,率先了解了oneAPI的技術細節和戰略意義。

oneAPI:

跨架構、跨廠商,向全行業開放

在解決計算問題時,過去幾代產品的答案几乎一直是晶體管密度,並且摩爾定律發揮主導作用。但隨著製程節點發展速度相較於過去幾十年呈現出減緩的態勢,現代計算又提出更多更新的需求,需要結合晶體管、架構研究、連接性提升、更快速的內存系統和軟件等眾多因素,共同推動創新。

oneAPI既是英特爾的一種產品,同時又是一種行業規範”,英特爾架構、圖形與軟件部副總裁兼計算性能與開發者產品部門總經理Bill Savage介紹,“oneAPI是從軟件層面來簡化和統一跨SVMS架構的創新。它可以簡化並且統一跨不同架構、跨不同廠商之間的編程,是一個鼓勵社區和行業支持的一種開放、標準的解決方案。”


"

科技界被一個“快”字裹挾很久了。更高的生產效率和毫不妥協的性能,成為任何一家科技公司的追求。

隨著邁入以數據為中心的時代,我們看到的不僅是數據量的爆發,更是有數據形態的巨大變化:從傳統的文本、圖形數據,到現在的視頻、音頻、社交等非結構化數據,未來還有包括聯網汽車數據、神經網絡數據、基因數據等更多形態的數據。

這種海量數據的多樣性,首先對計算能力提出了巨大的挑戰,由此帶來了數據處理方式和計算架構的延伸。未來十年我們將看到比過去五十年中多得多的架構

與此同時,軟件的重要性被提到了前所未有的高度。英特爾曾提出,對於全新硬件架構的每一個數量級的性能提升潛力,軟件能帶來兩個數量級的性能提升。

為了簡化編程流程、提升效率,英特爾於去年12月宣佈推出oneAPI項目,並將於今年第四季度發佈開發者測試版本。日前,<電子發燒友>在英特爾的溝通會上,率先了解了oneAPI的技術細節和戰略意義。

oneAPI:

跨架構、跨廠商,向全行業開放

在解決計算問題時,過去幾代產品的答案几乎一直是晶體管密度,並且摩爾定律發揮主導作用。但隨著製程節點發展速度相較於過去幾十年呈現出減緩的態勢,現代計算又提出更多更新的需求,需要結合晶體管、架構研究、連接性提升、更快速的內存系統和軟件等眾多因素,共同推動創新。

oneAPI既是英特爾的一種產品,同時又是一種行業規範”,英特爾架構、圖形與軟件部副總裁兼計算性能與開發者產品部門總經理Bill Savage介紹,“oneAPI是從軟件層面來簡化和統一跨SVMS架構的創新。它可以簡化並且統一跨不同架構、跨不同廠商之間的編程,是一個鼓勵社區和行業支持的一種開放、標準的解決方案。”


硬件架構走向多元化,英特爾要以oneAPI一“統”天下?

英特爾架構、圖形與軟件部副總裁兼計算性能與開發者產品部門總經理Bill Savage

英特爾產品覆蓋的計算架構包括標量(Scalar)、矢量(Vector)、矩陣(Matrix)和空間(Spatial),分別主要應用於CPU、GPU、AI加速器和FPGA產品。英特爾指出,在接下來五到十年中最重要的現代工作負載,就是這種標量、矢量、矩陣和空間架構的組合,英特爾稱之為SVMS架構

"

科技界被一個“快”字裹挾很久了。更高的生產效率和毫不妥協的性能,成為任何一家科技公司的追求。

隨著邁入以數據為中心的時代,我們看到的不僅是數據量的爆發,更是有數據形態的巨大變化:從傳統的文本、圖形數據,到現在的視頻、音頻、社交等非結構化數據,未來還有包括聯網汽車數據、神經網絡數據、基因數據等更多形態的數據。

這種海量數據的多樣性,首先對計算能力提出了巨大的挑戰,由此帶來了數據處理方式和計算架構的延伸。未來十年我們將看到比過去五十年中多得多的架構

與此同時,軟件的重要性被提到了前所未有的高度。英特爾曾提出,對於全新硬件架構的每一個數量級的性能提升潛力,軟件能帶來兩個數量級的性能提升。

為了簡化編程流程、提升效率,英特爾於去年12月宣佈推出oneAPI項目,並將於今年第四季度發佈開發者測試版本。日前,<電子發燒友>在英特爾的溝通會上,率先了解了oneAPI的技術細節和戰略意義。

oneAPI:

跨架構、跨廠商,向全行業開放

在解決計算問題時,過去幾代產品的答案几乎一直是晶體管密度,並且摩爾定律發揮主導作用。但隨著製程節點發展速度相較於過去幾十年呈現出減緩的態勢,現代計算又提出更多更新的需求,需要結合晶體管、架構研究、連接性提升、更快速的內存系統和軟件等眾多因素,共同推動創新。

oneAPI既是英特爾的一種產品,同時又是一種行業規範”,英特爾架構、圖形與軟件部副總裁兼計算性能與開發者產品部門總經理Bill Savage介紹,“oneAPI是從軟件層面來簡化和統一跨SVMS架構的創新。它可以簡化並且統一跨不同架構、跨不同廠商之間的編程,是一個鼓勵社區和行業支持的一種開放、標準的解決方案。”


硬件架構走向多元化,英特爾要以oneAPI一“統”天下?

英特爾架構、圖形與軟件部副總裁兼計算性能與開發者產品部門總經理Bill Savage

英特爾產品覆蓋的計算架構包括標量(Scalar)、矢量(Vector)、矩陣(Matrix)和空間(Spatial),分別主要應用於CPU、GPU、AI加速器和FPGA產品。英特爾指出,在接下來五到十年中最重要的現代工作負載,就是這種標量、矢量、矩陣和空間架構的組合,英特爾稱之為SVMS架構

硬件架構走向多元化,英特爾要以oneAPI一“統”天下?

為什麼底層接口如此重要?Bill Savage表示,數百萬的開發者在最上層創造越來越多的應用,他們所使用的大量中間件以及框架來自數萬的中間件開發者。oneAPI在最接近硬件的底層,對整個軟件堆棧會產生更大的影響,針對硬件使用統一接口,對軟件開發者來講這也是一個很好的價值主張。oneAPI所能發揮的價值在於——通過跨CPU、GPU、AI加速器和FPGA產品架構,統一併簡化編程,被廣泛的生態系統採用,為開發者帶來更高的生產效率和性能。


"

科技界被一個“快”字裹挾很久了。更高的生產效率和毫不妥協的性能,成為任何一家科技公司的追求。

隨著邁入以數據為中心的時代,我們看到的不僅是數據量的爆發,更是有數據形態的巨大變化:從傳統的文本、圖形數據,到現在的視頻、音頻、社交等非結構化數據,未來還有包括聯網汽車數據、神經網絡數據、基因數據等更多形態的數據。

這種海量數據的多樣性,首先對計算能力提出了巨大的挑戰,由此帶來了數據處理方式和計算架構的延伸。未來十年我們將看到比過去五十年中多得多的架構

與此同時,軟件的重要性被提到了前所未有的高度。英特爾曾提出,對於全新硬件架構的每一個數量級的性能提升潛力,軟件能帶來兩個數量級的性能提升。

為了簡化編程流程、提升效率,英特爾於去年12月宣佈推出oneAPI項目,並將於今年第四季度發佈開發者測試版本。日前,<電子發燒友>在英特爾的溝通會上,率先了解了oneAPI的技術細節和戰略意義。

oneAPI:

跨架構、跨廠商,向全行業開放

在解決計算問題時,過去幾代產品的答案几乎一直是晶體管密度,並且摩爾定律發揮主導作用。但隨著製程節點發展速度相較於過去幾十年呈現出減緩的態勢,現代計算又提出更多更新的需求,需要結合晶體管、架構研究、連接性提升、更快速的內存系統和軟件等眾多因素,共同推動創新。

oneAPI既是英特爾的一種產品,同時又是一種行業規範”,英特爾架構、圖形與軟件部副總裁兼計算性能與開發者產品部門總經理Bill Savage介紹,“oneAPI是從軟件層面來簡化和統一跨SVMS架構的創新。它可以簡化並且統一跨不同架構、跨不同廠商之間的編程,是一個鼓勵社區和行業支持的一種開放、標準的解決方案。”


硬件架構走向多元化,英特爾要以oneAPI一“統”天下?

英特爾架構、圖形與軟件部副總裁兼計算性能與開發者產品部門總經理Bill Savage

英特爾產品覆蓋的計算架構包括標量(Scalar)、矢量(Vector)、矩陣(Matrix)和空間(Spatial),分別主要應用於CPU、GPU、AI加速器和FPGA產品。英特爾指出,在接下來五到十年中最重要的現代工作負載,就是這種標量、矢量、矩陣和空間架構的組合,英特爾稱之為SVMS架構

硬件架構走向多元化,英特爾要以oneAPI一“統”天下?

為什麼底層接口如此重要?Bill Savage表示,數百萬的開發者在最上層創造越來越多的應用,他們所使用的大量中間件以及框架來自數萬的中間件開發者。oneAPI在最接近硬件的底層,對整個軟件堆棧會產生更大的影響,針對硬件使用統一接口,對軟件開發者來講這也是一個很好的價值主張。oneAPI所能發揮的價值在於——通過跨CPU、GPU、AI加速器和FPGA產品架構,統一併簡化編程,被廣泛的生態系統採用,為開發者帶來更高的生產效率和性能。


硬件架構走向多元化,英特爾要以oneAPI一“統”天下?


全新編程語言DPC++專門針對多元化架構

在一個多元化的架構中進行編程的話,很可能需要多種不同工具以及不同語言。這就意味著在軟件開發過程中需要多支團隊,他們各自要學習很多不同專業的技能,這顯然不是一種最高效的軟件開發方式

在oneAPI項目中,英特爾攜手行業開發了一種叫做Data Parallel C++(DPC++)的全新語言,以支持實現橫跨SVMS架構的數據並行編程。這是一種基於標準的開放式跨行業語言,可替代單一架構專有語言。

為什麼需要一種全新的語言呢?畢竟這個世界上已經有這麼多語言了。英特爾架構、圖形與軟件部副總裁兼編譯器與語言部門總經理Alice Chan指出,現有的眾多語言各有侷限所在:例如眾所周知的C++,它雖然是可移植的,而且底層性能非常好,但是本身缺乏了一些並行語言的特徵,很難很好地用於並行架構;MATLAB更多集中在頂層,如果想在底層得到很好的性能較難;英偉達的CUDA能夠進行並行架構的編程,也可以把負載轉移到加速器,但是它只能用在英偉達自己的硬件上;還有其他語言例如OpenCL也能實現並行編程,但是圍繞它的社群和整體行業的活躍度並不高。


"

科技界被一個“快”字裹挾很久了。更高的生產效率和毫不妥協的性能,成為任何一家科技公司的追求。

隨著邁入以數據為中心的時代,我們看到的不僅是數據量的爆發,更是有數據形態的巨大變化:從傳統的文本、圖形數據,到現在的視頻、音頻、社交等非結構化數據,未來還有包括聯網汽車數據、神經網絡數據、基因數據等更多形態的數據。

這種海量數據的多樣性,首先對計算能力提出了巨大的挑戰,由此帶來了數據處理方式和計算架構的延伸。未來十年我們將看到比過去五十年中多得多的架構

與此同時,軟件的重要性被提到了前所未有的高度。英特爾曾提出,對於全新硬件架構的每一個數量級的性能提升潛力,軟件能帶來兩個數量級的性能提升。

為了簡化編程流程、提升效率,英特爾於去年12月宣佈推出oneAPI項目,並將於今年第四季度發佈開發者測試版本。日前,<電子發燒友>在英特爾的溝通會上,率先了解了oneAPI的技術細節和戰略意義。

oneAPI:

跨架構、跨廠商,向全行業開放

在解決計算問題時,過去幾代產品的答案几乎一直是晶體管密度,並且摩爾定律發揮主導作用。但隨著製程節點發展速度相較於過去幾十年呈現出減緩的態勢,現代計算又提出更多更新的需求,需要結合晶體管、架構研究、連接性提升、更快速的內存系統和軟件等眾多因素,共同推動創新。

oneAPI既是英特爾的一種產品,同時又是一種行業規範”,英特爾架構、圖形與軟件部副總裁兼計算性能與開發者產品部門總經理Bill Savage介紹,“oneAPI是從軟件層面來簡化和統一跨SVMS架構的創新。它可以簡化並且統一跨不同架構、跨不同廠商之間的編程,是一個鼓勵社區和行業支持的一種開放、標準的解決方案。”


硬件架構走向多元化,英特爾要以oneAPI一“統”天下?

英特爾架構、圖形與軟件部副總裁兼計算性能與開發者產品部門總經理Bill Savage

英特爾產品覆蓋的計算架構包括標量(Scalar)、矢量(Vector)、矩陣(Matrix)和空間(Spatial),分別主要應用於CPU、GPU、AI加速器和FPGA產品。英特爾指出,在接下來五到十年中最重要的現代工作負載,就是這種標量、矢量、矩陣和空間架構的組合,英特爾稱之為SVMS架構

硬件架構走向多元化,英特爾要以oneAPI一“統”天下?

為什麼底層接口如此重要?Bill Savage表示,數百萬的開發者在最上層創造越來越多的應用,他們所使用的大量中間件以及框架來自數萬的中間件開發者。oneAPI在最接近硬件的底層,對整個軟件堆棧會產生更大的影響,針對硬件使用統一接口,對軟件開發者來講這也是一個很好的價值主張。oneAPI所能發揮的價值在於——通過跨CPU、GPU、AI加速器和FPGA產品架構,統一併簡化編程,被廣泛的生態系統採用,為開發者帶來更高的生產效率和性能。


硬件架構走向多元化,英特爾要以oneAPI一“統”天下?


全新編程語言DPC++專門針對多元化架構

在一個多元化的架構中進行編程的話,很可能需要多種不同工具以及不同語言。這就意味著在軟件開發過程中需要多支團隊,他們各自要學習很多不同專業的技能,這顯然不是一種最高效的軟件開發方式

在oneAPI項目中,英特爾攜手行業開發了一種叫做Data Parallel C++(DPC++)的全新語言,以支持實現橫跨SVMS架構的數據並行編程。這是一種基於標準的開放式跨行業語言,可替代單一架構專有語言。

為什麼需要一種全新的語言呢?畢竟這個世界上已經有這麼多語言了。英特爾架構、圖形與軟件部副總裁兼編譯器與語言部門總經理Alice Chan指出,現有的眾多語言各有侷限所在:例如眾所周知的C++,它雖然是可移植的,而且底層性能非常好,但是本身缺乏了一些並行語言的特徵,很難很好地用於並行架構;MATLAB更多集中在頂層,如果想在底層得到很好的性能較難;英偉達的CUDA能夠進行並行架構的編程,也可以把負載轉移到加速器,但是它只能用在英偉達自己的硬件上;還有其他語言例如OpenCL也能實現並行編程,但是圍繞它的社群和整體行業的活躍度並不高。


硬件架構走向多元化,英特爾要以oneAPI一“統”天下?


英特爾架構、圖形與軟件部副總裁兼編譯器與語言部門總經理Alice Chan

那麼,英特爾如何確保DPC++能夠如預期一樣發揮出最佳性能?70年代Cray就做到了矢量化,90年代的時候超算也做到了單程序多數據(SPMD),2006年英偉達推出CUDA語言的時候就提出了細粒度的SPMD。現在,DPC++語言將上述三種技術思路融會貫通,使用底層虛擬機按照有序的結構進行編譯。據瞭解,英特爾開始這個項目已經有一段時間了,目前試驗證明性能至少是優於或者等同於之前的這些技術和方式的,DPC++能夠跨結構實現所需的特性和抽象


"

科技界被一個“快”字裹挾很久了。更高的生產效率和毫不妥協的性能,成為任何一家科技公司的追求。

隨著邁入以數據為中心的時代,我們看到的不僅是數據量的爆發,更是有數據形態的巨大變化:從傳統的文本、圖形數據,到現在的視頻、音頻、社交等非結構化數據,未來還有包括聯網汽車數據、神經網絡數據、基因數據等更多形態的數據。

這種海量數據的多樣性,首先對計算能力提出了巨大的挑戰,由此帶來了數據處理方式和計算架構的延伸。未來十年我們將看到比過去五十年中多得多的架構

與此同時,軟件的重要性被提到了前所未有的高度。英特爾曾提出,對於全新硬件架構的每一個數量級的性能提升潛力,軟件能帶來兩個數量級的性能提升。

為了簡化編程流程、提升效率,英特爾於去年12月宣佈推出oneAPI項目,並將於今年第四季度發佈開發者測試版本。日前,<電子發燒友>在英特爾的溝通會上,率先了解了oneAPI的技術細節和戰略意義。

oneAPI:

跨架構、跨廠商,向全行業開放

在解決計算問題時,過去幾代產品的答案几乎一直是晶體管密度,並且摩爾定律發揮主導作用。但隨著製程節點發展速度相較於過去幾十年呈現出減緩的態勢,現代計算又提出更多更新的需求,需要結合晶體管、架構研究、連接性提升、更快速的內存系統和軟件等眾多因素,共同推動創新。

oneAPI既是英特爾的一種產品,同時又是一種行業規範”,英特爾架構、圖形與軟件部副總裁兼計算性能與開發者產品部門總經理Bill Savage介紹,“oneAPI是從軟件層面來簡化和統一跨SVMS架構的創新。它可以簡化並且統一跨不同架構、跨不同廠商之間的編程,是一個鼓勵社區和行業支持的一種開放、標準的解決方案。”


硬件架構走向多元化,英特爾要以oneAPI一“統”天下?

英特爾架構、圖形與軟件部副總裁兼計算性能與開發者產品部門總經理Bill Savage

英特爾產品覆蓋的計算架構包括標量(Scalar)、矢量(Vector)、矩陣(Matrix)和空間(Spatial),分別主要應用於CPU、GPU、AI加速器和FPGA產品。英特爾指出,在接下來五到十年中最重要的現代工作負載,就是這種標量、矢量、矩陣和空間架構的組合,英特爾稱之為SVMS架構

硬件架構走向多元化,英特爾要以oneAPI一“統”天下?

為什麼底層接口如此重要?Bill Savage表示,數百萬的開發者在最上層創造越來越多的應用,他們所使用的大量中間件以及框架來自數萬的中間件開發者。oneAPI在最接近硬件的底層,對整個軟件堆棧會產生更大的影響,針對硬件使用統一接口,對軟件開發者來講這也是一個很好的價值主張。oneAPI所能發揮的價值在於——通過跨CPU、GPU、AI加速器和FPGA產品架構,統一併簡化編程,被廣泛的生態系統採用,為開發者帶來更高的生產效率和性能。


硬件架構走向多元化,英特爾要以oneAPI一“統”天下?


全新編程語言DPC++專門針對多元化架構

在一個多元化的架構中進行編程的話,很可能需要多種不同工具以及不同語言。這就意味著在軟件開發過程中需要多支團隊,他們各自要學習很多不同專業的技能,這顯然不是一種最高效的軟件開發方式

在oneAPI項目中,英特爾攜手行業開發了一種叫做Data Parallel C++(DPC++)的全新語言,以支持實現橫跨SVMS架構的數據並行編程。這是一種基於標準的開放式跨行業語言,可替代單一架構專有語言。

為什麼需要一種全新的語言呢?畢竟這個世界上已經有這麼多語言了。英特爾架構、圖形與軟件部副總裁兼編譯器與語言部門總經理Alice Chan指出,現有的眾多語言各有侷限所在:例如眾所周知的C++,它雖然是可移植的,而且底層性能非常好,但是本身缺乏了一些並行語言的特徵,很難很好地用於並行架構;MATLAB更多集中在頂層,如果想在底層得到很好的性能較難;英偉達的CUDA能夠進行並行架構的編程,也可以把負載轉移到加速器,但是它只能用在英偉達自己的硬件上;還有其他語言例如OpenCL也能實現並行編程,但是圍繞它的社群和整體行業的活躍度並不高。


硬件架構走向多元化,英特爾要以oneAPI一“統”天下?


英特爾架構、圖形與軟件部副總裁兼編譯器與語言部門總經理Alice Chan

那麼,英特爾如何確保DPC++能夠如預期一樣發揮出最佳性能?70年代Cray就做到了矢量化,90年代的時候超算也做到了單程序多數據(SPMD),2006年英偉達推出CUDA語言的時候就提出了細粒度的SPMD。現在,DPC++語言將上述三種技術思路融會貫通,使用底層虛擬機按照有序的結構進行編譯。據瞭解,英特爾開始這個項目已經有一段時間了,目前試驗證明性能至少是優於或者等同於之前的這些技術和方式的,DPC++能夠跨結構實現所需的特性和抽象


硬件架構走向多元化,英特爾要以oneAPI一“統”天下?


高性能庫如何推動人工智能的發展?

人工智能的發展進一步推動了對算力的渴求,硬件架構的世界已經發生了極大的顛覆,英特爾自身就有SVMS架構,華為、阿里、百度以及非常多的AI初創公司各有自己的芯片戰略。

對此,英特爾架構、圖形與軟件部首席工程師Eric Lin表示,沒有軟件芯片無法使用,需要大量的開發者去將它表達為用戶真正所需。這其中需要非常深厚的經驗,英特爾希望將硬件能力抽象出來,把最重要的算法融於oneAPI,使開發者不再需要針對硬件做開發,更容易發揮出硬件的所有潛力。這是英特爾提供計算庫的根本原因。


"

科技界被一個“快”字裹挾很久了。更高的生產效率和毫不妥協的性能,成為任何一家科技公司的追求。

隨著邁入以數據為中心的時代,我們看到的不僅是數據量的爆發,更是有數據形態的巨大變化:從傳統的文本、圖形數據,到現在的視頻、音頻、社交等非結構化數據,未來還有包括聯網汽車數據、神經網絡數據、基因數據等更多形態的數據。

這種海量數據的多樣性,首先對計算能力提出了巨大的挑戰,由此帶來了數據處理方式和計算架構的延伸。未來十年我們將看到比過去五十年中多得多的架構

與此同時,軟件的重要性被提到了前所未有的高度。英特爾曾提出,對於全新硬件架構的每一個數量級的性能提升潛力,軟件能帶來兩個數量級的性能提升。

為了簡化編程流程、提升效率,英特爾於去年12月宣佈推出oneAPI項目,並將於今年第四季度發佈開發者測試版本。日前,<電子發燒友>在英特爾的溝通會上,率先了解了oneAPI的技術細節和戰略意義。

oneAPI:

跨架構、跨廠商,向全行業開放

在解決計算問題時,過去幾代產品的答案几乎一直是晶體管密度,並且摩爾定律發揮主導作用。但隨著製程節點發展速度相較於過去幾十年呈現出減緩的態勢,現代計算又提出更多更新的需求,需要結合晶體管、架構研究、連接性提升、更快速的內存系統和軟件等眾多因素,共同推動創新。

oneAPI既是英特爾的一種產品,同時又是一種行業規範”,英特爾架構、圖形與軟件部副總裁兼計算性能與開發者產品部門總經理Bill Savage介紹,“oneAPI是從軟件層面來簡化和統一跨SVMS架構的創新。它可以簡化並且統一跨不同架構、跨不同廠商之間的編程,是一個鼓勵社區和行業支持的一種開放、標準的解決方案。”


硬件架構走向多元化,英特爾要以oneAPI一“統”天下?

英特爾架構、圖形與軟件部副總裁兼計算性能與開發者產品部門總經理Bill Savage

英特爾產品覆蓋的計算架構包括標量(Scalar)、矢量(Vector)、矩陣(Matrix)和空間(Spatial),分別主要應用於CPU、GPU、AI加速器和FPGA產品。英特爾指出,在接下來五到十年中最重要的現代工作負載,就是這種標量、矢量、矩陣和空間架構的組合,英特爾稱之為SVMS架構

硬件架構走向多元化,英特爾要以oneAPI一“統”天下?

為什麼底層接口如此重要?Bill Savage表示,數百萬的開發者在最上層創造越來越多的應用,他們所使用的大量中間件以及框架來自數萬的中間件開發者。oneAPI在最接近硬件的底層,對整個軟件堆棧會產生更大的影響,針對硬件使用統一接口,對軟件開發者來講這也是一個很好的價值主張。oneAPI所能發揮的價值在於——通過跨CPU、GPU、AI加速器和FPGA產品架構,統一併簡化編程,被廣泛的生態系統採用,為開發者帶來更高的生產效率和性能。


硬件架構走向多元化,英特爾要以oneAPI一“統”天下?


全新編程語言DPC++專門針對多元化架構

在一個多元化的架構中進行編程的話,很可能需要多種不同工具以及不同語言。這就意味著在軟件開發過程中需要多支團隊,他們各自要學習很多不同專業的技能,這顯然不是一種最高效的軟件開發方式

在oneAPI項目中,英特爾攜手行業開發了一種叫做Data Parallel C++(DPC++)的全新語言,以支持實現橫跨SVMS架構的數據並行編程。這是一種基於標準的開放式跨行業語言,可替代單一架構專有語言。

為什麼需要一種全新的語言呢?畢竟這個世界上已經有這麼多語言了。英特爾架構、圖形與軟件部副總裁兼編譯器與語言部門總經理Alice Chan指出,現有的眾多語言各有侷限所在:例如眾所周知的C++,它雖然是可移植的,而且底層性能非常好,但是本身缺乏了一些並行語言的特徵,很難很好地用於並行架構;MATLAB更多集中在頂層,如果想在底層得到很好的性能較難;英偉達的CUDA能夠進行並行架構的編程,也可以把負載轉移到加速器,但是它只能用在英偉達自己的硬件上;還有其他語言例如OpenCL也能實現並行編程,但是圍繞它的社群和整體行業的活躍度並不高。


硬件架構走向多元化,英特爾要以oneAPI一“統”天下?


英特爾架構、圖形與軟件部副總裁兼編譯器與語言部門總經理Alice Chan

那麼,英特爾如何確保DPC++能夠如預期一樣發揮出最佳性能?70年代Cray就做到了矢量化,90年代的時候超算也做到了單程序多數據(SPMD),2006年英偉達推出CUDA語言的時候就提出了細粒度的SPMD。現在,DPC++語言將上述三種技術思路融會貫通,使用底層虛擬機按照有序的結構進行編譯。據瞭解,英特爾開始這個項目已經有一段時間了,目前試驗證明性能至少是優於或者等同於之前的這些技術和方式的,DPC++能夠跨結構實現所需的特性和抽象


硬件架構走向多元化,英特爾要以oneAPI一“統”天下?


高性能庫如何推動人工智能的發展?

人工智能的發展進一步推動了對算力的渴求,硬件架構的世界已經發生了極大的顛覆,英特爾自身就有SVMS架構,華為、阿里、百度以及非常多的AI初創公司各有自己的芯片戰略。

對此,英特爾架構、圖形與軟件部首席工程師Eric Lin表示,沒有軟件芯片無法使用,需要大量的開發者去將它表達為用戶真正所需。這其中需要非常深厚的經驗,英特爾希望將硬件能力抽象出來,把最重要的算法融於oneAPI,使開發者不再需要針對硬件做開發,更容易發揮出硬件的所有潛力。這是英特爾提供計算庫的根本原因。


硬件架構走向多元化,英特爾要以oneAPI一“統”天下?


英特爾架構、圖形與軟件部首席工程師Eric Lin

有了這個計算庫之後,能夠提供給更多的框架開發者所使用,例如TensorFlow、 PaddlePaddle、MXNet等等。由於框架主要是給數據科學家所使用,他們往往缺少硬件知識,英特爾的策略是將計算庫集成到框架中,再提供給數百萬數據科學家、算法工程師,達到為開發者屏蔽硬件複雜性的目的。

由此看來,一個計算庫服務數萬個框架開發者,服務數百萬甚至更多的數據科學家,打通了從硬件到應用的道路

oneAPI集成的計算庫堪稱業內“豪華配置“,包括快速、使用廣泛的數學函數庫MKL、使用經典機器學習算法的英特爾數據分析加速庫DAAL,以及面向深度神經網絡的英特爾數學核心函數庫MKL-DNN等。

OpenVINO——oneAPI在深度學習方面的“小現實”

對於深度學習來說,數據分析過程基本包括四步:第一,獲取數據;第二,建立數學模型,並且用這些數據去訓練;第三,根據部署場景有針對性地優化模型;第四是推理,真正地讓各種各樣的開發者,把他們的服務、產品推向用戶。如何讓這個工作流程的所有開發者、參與者更有效率,是英特爾當前的重點之一。

去年8月,英特爾面向中國市場推出了專注於加速深度學習的OpenVINO工具包,能夠幫助企業在邊緣側快速實現高性能計算機視覺與深度學習的開發。作為為客戶解決問題的優化推理引擎,OpenVINO補充了深度學習框架,支持應用程序開發者以統一接口跨SVMS架構進行開發。據Eric介紹:“OpenVINO就是目前的一個商業部署,它所做的事情就是讓開發者直接用一個統一的API,幫開發者完成簡單的開發、簡單的維護、並帶來高性能,它展示了oneAPI願景的現實。”

在沒有OpenVINO之前,開發者如何進行部署?以英特爾自己為例,各種各樣的庫,有針對CPU的、顯卡的、計算棒的、FPGA的……每一次開發的時候,各個庫API不一樣,性能調優不一樣,Debug不一樣,數據的預處理不一樣,開發成本非常高。OpenVINO實現了無論是哪種類型的硬件,讓開發者用一個統一API。

根據已公佈的應用來看,雲從的人臉識別智能設備、中科英泰的智能零售方案、阿里巴巴在AliOS 互聯網汽車道路感知算法優化方面、宇視科技的全融合智能解決方案UniAI等,都基於OpenVINO工具包。

對標英偉達CUDA?

NVIDIA公司於2007年正式發佈的CUDA(ComputeUnified Device Architecture,統一計算架構),是第一種不需藉助圖形學API就可以使用類C語言進行通用計算的開發環境和軟件體系,是建立在GPU基礎之上的通用計算開發平臺。由於在性能、成本和開發時間上較傳統的CPU解決方案有顯著優勢,當時在學術界和產業界引起了熱烈反響。現在,CUDA已經在金融、石油、天文學、流體力學、信號處理、電磁仿真、模式識別、圖像處理、視頻壓縮等領域獲得廣泛應用,並取得了豐碩的成果。

oneAPI的推出,似有異曲同工之妙。對此,Bill Savage表示,oneAPI開放給所有包括英偉達在內的硬件廠商,行業也需要這樣一種開放的、對於現有解決方案之外的另一種選擇。英特爾致力於向所有的、多樣的架構來提供支持,使它們能夠很好地一起協作。

英特爾已對DPC++一些開源項目在GitHub上進行託管,但一個顯然存在的問題是,GitHub一些開源項目都是基於原有的如英偉達的GPU而實施,如果現在用oneAPI,開發者將會面臨重新學習的問題。對此,Bill Savage表示,英特爾在設計DPC++的時候,語言本身已經和CUDA非常接近,對於開發人員來講學習相對比較容易。至於程序員的遷移問題,英特爾會在年底發佈測試版本的時候分享更多工具,來幫助遷移更容易

"

相關推薦

推薦中...