AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

[PConline雜談]今天,AMD歷史性在同一天裡發佈了全新的銳龍3000系列處理器及RX 5700系列顯卡,這是很少見的,只不過這兩類產品給人的感覺是不一樣的——銳龍3000處理器是AMD從優秀走向卓越的開始,而RX 57000系列顯卡則更像是剛補完課的學生,有進步,但還不至於能趕超學霸。

在7nm Navi架構的RX 5700上市之前,AMD在中高端GPU市場上落後太多了,儘管AMD在獨顯GPU上的份額比X86 CPU份額高得多,但是給玩家的感受是不一樣的,很大原因就是過去幾年中AMD推的幾代顯卡,特別是高端顯卡表現不盡如人意,從Fury到Vega都是如此。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

深究起來,這跟AMD多年來堅持使用GCN架構有關,從28nm的HD 7970到今年共計7年了,即便AMD多次改名稱之為GCN 1.0、GCN 2.0再到GCN 5.0,但GCN架構的整體變化並不大,高端顯卡4096個處理器單元的規模從2015年的Fury X到RX Vega 64都是如此,只能說GCN廉頗老矣,曾經被人稱讚的性能、能效雙重優勢也有落後的時候。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

好在隨著7nm Navi架構的問世,AMD顯卡最煎熬的日子總算過去了,往大了說AMD的Radeon GPU現在是全平臺覆蓋,除了PC、Mac、主機之外還擴展到了雲遊戲及移動設備上,谷歌、三星分別在今年初、今年中跟AMD達成了戰略合作,而微軟、索尼新一代主機也會用上Navi架構的GPU。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

早在去年福布斯網站就有一篇文章揭露過AMD近幾代GPU開發都不是專門為PC玩家準備的,而是要為主機定製,所以在PC平臺上總是有一些這樣或者那樣的不足,這件事也適用於Navi架構,使得Navi並不是一個追求最高性能最先進技術的GPU架構,之前傳聞命名是RX 680而已。

說了這麼多背景及鋪墊,為的就是讓大家在看Navi架構上的一些改變時能夠理解AMD入了什麼、為什麼這麼做。根據官方的信息,Navi GPU架構上的主要亮點是7nm工藝、RDNA架構、GDDR6顯存,這是最重要的幾點,而PCIe 4.0、顯示、多媒體上的改進屬於次要,其中PCIe 4.0雖然是新技術,但象徵意義更大,實用價值並不高。

Radeon RX 5700系列顯卡改進之一:7nm工藝

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

與AMD的銳龍3000系列處理器一樣,AMD的Navi GPU也進入了7nm節點,畢竟主機上的CPU及GPU核心也是Zen2+Navi的搭配,保持同代工藝很有必要。

至於7nm的優點,AMD在多個場合介紹的都差不多,相比14nm工藝晶體管密度翻倍,同性能下功耗降低50%,同功耗下性能提升25%,這方面跟銳龍3000的變化是一樣的。

很顯然,Navi架構能效大增的首要功臣就是7nm工藝,實現了1.5倍的每瓦性能比。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

除了能效1.5倍變化之外,7nm還使得Navi GPU的核心面積大降,只有251mm2,晶體管只有103億個,而14nm Vega核心是495mm2,晶體管125億,所以Navi核心面積只有原來的一半左右,差距非常明顯。不過也要說清楚,Vega的CU流處理器單元規模比Navi還是大很多的,64vs.40組的差別。

Radeon RX 5700系列顯卡改進之二:全新RDNA架構

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

Navi之前的顯卡使用的是GCN架構,RX Vega上是GCN 5.0架構,而Navi是RDNA架構,全稱是Radeon DNA架構,官方表示它是專為新一代高效率、高性能遊戲而設計。它是為你的遊戲提供動力的 DNA、讓你的遊戲生動逼真的 DNA、不斷髮展進化的 DNA。

需要重點說明的是,儘管早前傳聞Navi是最後一代GCN架構,但AMD不僅是改了新架構的命名方式,還極力否認RDNA架構跟GCN有關係,強調RDNA是全新開發的架構,跟GCN沒啥關係,不是GCN升級也不是GCN混合,唯一有關的就是指令集繼承了,使得現有技術可以兼容,避免軟件、遊戲重新為RNDA開發一遍。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

在RDNA架構上,AMD的主要目標有四個——性能上要適應現代的遊戲負載,能效上要優化功耗和帶寬利用率,功能上要增強生態系統,並行擴展上要適應移動到雲端遊戲,畢竟三星前不久談的GPU授權也是基於Navi的。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

讓很多人糾結Navi架構沒脫離GCN體系的一個重要原因就是Navi上依然是1個CU單元包含64組SIMD陣列,這點跟最初的GCN架構相比都沒變化,不過AMD表示Navi上的CU單元重新設計了,2倍的標量單元、2倍的調度單元、單循環發射、雙模執行單元,同時實現了資源合併,2個CU單元可以當做一個工作組處理器。

具體來說,Navi完整核心有40組CU單元,每組CU有2個標量單元、64個流處理器單元、4個64位雙線性過濾單元,共計2560個流處理器、80個標量單元和160個64位雙線性過濾單元。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

與GCN架構相比,CU單元雖然都是64個流處理器單元,但具體結構是不一樣的,GCN是4組SIM16陣列、4組SIMD4固定陣列,Navi是2組SIMD32、2組SIMD8陣列,而且支持Wave32、Wave64雙模執行,這部分減少實際上是提高了效率,使得指令不需要頻繁拆分,提高了單線程性能及單元利用率。

與此同時,RDNA的共享矢量、標準單元又翻倍到2組,簡單粗暴提升了吞吐量,進而提升性能。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

除了CU單元大升級之外,AMD在RDNA架構上還改進了多級緩存一致性,每個雙CU組合內都有自己的L0緩存,與ALU單元的載入帶寬翻番,增加了四組新的16-way 128KB L1緩存,降低了L2緩存(16-way 4MB)的擁堵,使得延遲和功耗大大減低。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

從AMD公佈的信息來看,L0級緩存延遲降低了21%,L1、L2緩存劫持降低了23%,內存延遲降低了8%。

RDNA架構第三點改進與圖形渲染管線有關,增強了4個ACE異步計算引擎,帶有4個原語單元的中心幾何處理器可以統一處理矢量複用、原語彙編等命令。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

通過對圖形渲染管線的改進,AMD在RDNA架構上實現了更高的性能,更低高的能效。值得一提的是,與之前的Vega GPU一樣,Navi架構上依然獲得了AMD Zen架構團隊的友情技術支援,特別是在時鐘門控電路上,所需的開關電路、門控電路分別減少了40%、12%。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

最終這麼一整套改進與優化下來,RDNA架構在性能及性能上有了全面的進步,每瓦性能比提升了50%,每時鐘效率提升了25%。

Radeon RX 5700系列顯卡改進之三:FideltiFX畫質優化套裝

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

前面介紹的工藝、架構改進使得RDNA架構已經脫胎換骨了,AMD還在遊戲畫質上帶來了新的技術FideltiFX,準確來說FideltiFX是AMD伴隨RDNA架構推出的一系列後期特效技術的打包,裡面又分為CAS、RIS、Anti-Lag等等。

跟AMD其他技術一樣,FideltiFX技術也會開源,並且已經得到了Unity、逆水寒(NVIDIA出新技術網易跟進,AMD這邊也不放過)、卡普空、育碧等引擎及遊戲開發商的支持。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

FideltiFX技術中的CAS(Content Adaptive Shading,內容自適應著色技術)不算新鮮了,之前NVIDIA在圖靈GPU中也有類似的技術,最初叫NVIDIA自適應著色技術,簡稱NAS,

簡單來說,CAS技術允許遊戲根據不同的需要,通過對畫面非主要元素(比如賽車中快速移動的側景)進行像素合併,從而減少著色器的渲染量,以便部分提高幀數。

當然,CAS技術也可以增加渲染內容,這樣可以提高畫質,不過會導致性能下降,具體如何選擇看遊戲廠商,下面是CAS的畫質對比。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

除了CAS,FideltiFX技術中第二項畫質技術是“Radeon Image Sharpening”,簡稱RIS,它的開發者也是赫赫有名,NVIDIA之前主導的TXAA抗鋸齒也是來自於這位高手。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

既然跟TXAA很有淵源,RIS也是有類似的效果,這是一種動態適應的後期抗鋸齒技術,畫面更銳利、細節更清晰的同時還可以最大化保留性能。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

從AMD公佈的測試來看,RIS對遊戲性能的影響在0.5到1%左右,可以說非常小了,完全可以忽略不計了,這也是目前對性能影響最小的抗鋸齒技術了。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

此外,FideltiFX技術還有一項絕技就是Anti-Lag抗延遲技術,簡稱RAL,很多人不知道的是遊戲延遲不僅僅與畫面輸出有關,鼠標、鍵盤等也會有延遲,RAL就可以縮短鼠標點擊到遊戲響應之間的延遲時間,官方測試減少幅度在23%到35%之間,差不多就是減少了1/3左右的延遲。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

Radeon RX 5700系列顯卡改進之四:顯卡設計、PCIe4、GDDR6

接下來簡單介紹下7nm Navi架構的最終成果及其他先進技術。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

顯存方面,AMD在Navi放棄了HBM2顯存,雖然HBM技術的顯存優點多多,但是成本還是太貴,搭配2顆HBM2的話就像RX Vega 64那樣,帶寬沒優勢,搭配4顆HBM2的話,就像Radeon VII顯卡那樣,16GB成本又承受不了,索性還是放棄了,只用於頂級顯卡或者加速卡市場。

GDDR6顯存的優勢不用說了,製造工藝基本上與GDDR5兼容,但頻率大幅提升,相比常見的8Gbps GDDR5,GDDR6顯存可以輕鬆達到14Gbps,帶寬提升75%,Navi使用256bit 14Gbps的GDDR6,帶寬就已經有448GB/s,不輸RX Vega 64的HBM2帶寬了。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

Navi顯卡上的PCIe 4.0也是消費級最早支持的,雖然7nm Vega上就已經支持PCIe 4.0技術,但是Radeon VII顯卡沒有實裝,RX 5700才是第一個支持PCIe 4.0的桌面顯卡。

與現在的PCIe 3.0相比,PCIe 4.0的信號速率翻倍到了16GT/s,帶寬也翻倍提升,不過這個技術雖然新鮮,但是用於顯卡的話,玩遊戲是體驗不出來的,PCIe 3.0都不是瓶頸。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

基於7nm Navi核心,AMD推出了3款顯卡——RX 5700、RX 5700 XT及RX 5700 XT 50週年紀念版,實際上最後一款型號外觀、設計跟RX 5700 XT沒區別,就是頻率更高,還有蘇媽簽名,屬於信仰升級版,價格也略貴。

具體來說,RX 5700 XT是完整版40組CU單元,、2560個流處理器、64個ROP單元、256個紋理單元,基礎頻率1605MHz,遊戲加速頻率1755MHz,極限加速頻率1905MHz,浮點性能9.75TFLOPS,搭配8GB GDDR6顯存,14Gbps,TDP功耗225W,8+6pin供電。

RX 5700顯卡是36組CU單元,、2304個流處理器、144個紋理單元、64個ROP單元,基礎頻率1465MHz,遊戲加速頻率1625MHz,極限加速頻率1725MHz,浮點性能7.95TFLOPS,TDP功耗180W,搭配8GB 14Gbps GDDR6顯存,8+6pin供電。

至於Radeon RX 5700 XT 50週年紀念版,它也是40組計算單元、2560個流處理器、GPU核心基礎頻率1680MHz,遊戲頻率1830MHz,加速頻率1980MHz,浮點性能10.14TFLOPS,顯存位寬256-bit 8GB GDDR6,頻率維持14GHz,TDP 235W。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

值得注意的是,RX 5700 XT與RX 5700顯卡的公版設計不完全相同,RX 5700 XT最具識別性的是它頂部的凹痕,除了裝飾作用還有改善風流及噪音的作用,不過處女座可能有點不能忍。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

RX 5700系列顯卡在顯示輸出接口也有不少變化,3個DP 1.4接口、1個HDMI 2.0b接口,支持4K 240Hz、4K HDR 120Hz或者8K 60Hz輸出,還支持了DSC 1.2a色彩壓縮規範,與華碩推出的一款43寸4K DSC顯示器是絕配。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

多媒體方面,RX 5700系列顯卡變化也比較大,增加了新的H.265 HDR/WCG編碼器,全面支持H.264 1080p600、4K150、8K30解碼和1080p360、4K90編碼,H.265 1080p360、4K90、8K24解碼和1080p360、4K60編碼,VP9 4K90、8K24解碼,整體編碼速度加快40%。

Radeon RX 5700系列顯卡畫大餅之光線追蹤、RDNA2架構

AMD在RX 5700系列顯卡的官方PPT中還對比了與友商RTX 20系列顯卡的性能,當然這種情況顯然是RX 5700及RX 5700 XT贏了,不過這裡就不列官方測試成績了,一方面是因為這些遊戲性能還需要實際檢測,另一方面是隨著NVIDIA推出RTX 20 Siper系列顯卡,RX 5700系列顯卡的競爭對手都變了,AMD的官方測試已經沒多少意義了。

通過前面有關Navi核心7nm工藝、RDNA架構的介紹,我們可以說7nm Navi GPU真的是一場及時雨,讓AMD擺脫了差不多成為負資產的GCN架構的束縛,在性能及能效方面有了長足進步,使得AMD顯卡在面對友商產品時有了十足的底氣。

不過Navi核心依然不能說是完美的,不支持光線追蹤就是槽點之一,但是在光追這件事上,AMD也跟NVIDIA有著不同的理念。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

準確來說,GCN及RDNA架構其實也是支持跑DXR光追的,就好比GTX顯卡也能跑RTX光追一樣,但它們都是通過渲染器跑的,效率不高而已,AMD現在Radeon Ray、ProRenders等軟件中就已經支持了光追了。

在下一代RDNA架構中,AMD才會加入專用的硬件加速光追單元,類似NVIDIA在圖靈GPU中的RT Core一樣,好處是性能更高,不過AMD最終的目標是雲端光追,他們希望把光線追蹤這種耗費大量資源的運算放到雲上,提供全場景的雲端解決方案,這個會很有意思,不過目前還是大餅。

AMD 7nm Navi顯卡技術解析:雪中送炭的RDNA全新架構

Navi上有一些槽點的關鍵就在於它還是第一代RDNA架構,AMD還在準備新一代的RDNA2架構,製程工藝也會升級到7nm+,按照路線圖應該是明年問世,跟銳龍4000系列處理器是同一代了。

在RNDA2架構上,AMD應該會推出傳聞的Navi 20高端核心了,不僅支持硬件加速光追,CU單元也要大幅超越現在的Navi,性能水平要達到RTX 2080 Ti或者更高級別的,畢竟明年NVIDIA也要推出傳聞中的7nm安培GPU了。

相關推薦

推薦中...