前言
AMD於一個月多前的臺北電腦展上發佈了新的Zen2架構銳龍3000系列處理器,代號“Matisse”。雖然之前大家已經收到許多消息,包括7nm工藝的進步,Zen2架構的chiplet多Die設計,IPC的提升等,但是對新處理器性能的表現還是有很大的期待。現在新的銳龍處理器3900X、3700X和X570主板已經來到PCEVA評測室,我們就一起來看看它的效能表現。
Zen2架構的設計
在實際測試前,還是要把理論過一遍。這次大家看到最明顯的變化是Zen2架構所採用的chiplet多芯片封裝的設計。在7 3800X及以下的8核心CPU中,封裝包含一個7nm的CPU Die(CCD)和12nm的IO Die(cIOD)。在8核心以上的銳龍9 CPU中,每個CPU有兩個7nm的CCD和一個12nm的cIOD。
其中,每個CCD含兩個CCX,每個CCX四個核心,所以是8核心,這個設計和以前一樣,此外每個CCX有16MB的共享排除式L3緩存,每個Die共32MB,比Zen、Zen+架構翻倍。更大的L3緩存可以降低內存延遲,對遊戲性能的提升也有一定幫助。
Zen2每個核心內部的設計也有所變化。指令緩存由原先的64KB縮減到32KB,但位寬翻倍,分支預測系統也經過重新設計,可減少30%的誤判率。L2緩存還是和原先一樣512KB每個核心,同時AGU增加一個,達到和Intel一樣4ALU+3AGU的設計,兩組乘加器位寬從128bit上升至256bit,也就是原生支持AVX2,並且乘法器的延遲從4個週期下降至3個。
CIOD中實際上就是把多年來集成在CPU內部的傳統“北橋”又拿出來,包括內存控制器、PCIE控制器和部分IO、負責電源管理的晶體管等等。肯定有人要問為什麼要把北橋又挪到核心外面來?這應該是AMD權衡利弊之後的結果,眼下更重要的是7nm的良品率,把CPU Core單獨拿出來使用7nm製造,可以更好提升每瓦效能,而cIOD這種沒必要使用7nm的,優先使用更加成熟的12nm,這樣整體的良品率都可以更好的把控;並且,把這些Die連在一起的Infinity Fabric總線已經更新到第二代,位寬從256bit翻倍達到512bit,把北橋拿出來不會對CPU、內存通訊造成太大的延遲。
在Sisoftware Sandra測試中,我們把3700X和2700X同時鎖定4GHz,內存鎖定DDR4-3400,可以看到3700X的內存緩存延遲均比2700X有明顯下降。
Zen2處理器的周邊提升
內存控制器現在挪到了cIOD,並且也是重新設計過的,內存和IF總線新增一個2:1的模式。在傳統的1:1模式下,內存延遲比較低,在甜點DDR4-3733C17下大約可以達到67ns的水平;如果使用2:1模式,內存頻率可以繼續提升,帶寬也會繼續提升,但內存延遲略有升高,根據AMD的描述,DDR4-4200+可以輕鬆達到,目前在空冷下可達DDR4-5133的內存頻率,這點對目前的Intel平臺來講也是難度很大的。所以,可見AMD的內存控制器設計已經趕上了Intel,並且更有彈性,是要帶寬還是要延遲,AMD把選擇權留給了用戶自己。
Precision Boost升級到第二代,現在可以在XFR的最大頻率基礎上讓單核頻率再一次突破,最大可達200MHz,因此現在PBO可以說是成了名副其實的自動超頻。這可以讓銳龍 5 3600的Cinebench R20單線程性能由483分提升至504分,而高端型號的單線程頻率會更高,因此提升相對就少點。
X570芯片組與PCIE4.0總線
PCIE4.0也是大家關注的重頭戲,這也是AMD在PCIE總線速度上首次領先Intel。PCIE 4.0帶寬提升到64GB/s雙向,對顯卡而言目前PCIE 3.0x16在絕大多數3D遊戲和應用當中已經富餘,所以PCIE 4.0x16對普通用戶來說可能並不是可以直接提升遊戲性能的要素,而是可以適應未來更快的SSD。例如這次群聯發佈的E16主控,可以做到5GB/s的讀取,在不久的將來還會有更快的主控和固態硬盤,速度達到PCIE 4.0 x4的6.4GB/s上限。銳龍 3000系列處理器除了16條供顯卡使用的PCIE 4.0通道外,SOC部分同樣提供了兩組4條PCIE 4.0通道,一組作為與芯片組通訊的總線,另一組可以直連高速固態硬盤。
我們使用海盜船MP600 1TB固態硬盤測試,讀取速度達到5GB/s,寫入速度4.4GB/s,全面超越PCIE3.0的旗艦。
使用技嘉AORUS NVMe Gen4 2TB固態硬盤測試,情況類似。
使用AMD Radeon RX 5700XT顯卡運行3DMark PCI Express Feature Test,跑的是PCIE X16單向的帶寬,可以看到開啟PCIE4.0後帶寬達到24.93GB/s,而PCIE3.0模式下帶寬是14.02GB/s。
X570芯片組也是銳龍3000系列處理器的新座駕,它同樣提供PCIE4.0的支持,並且額外提供8條PCIE4.0通道,此外還提供4個SATA6Gbps接口、8個USB3.2 Gen2接口和4個USB2.0接口。但是主板廠商可能會因為板型限制,不會做足全部的接口。
銳龍3000處理器規格介紹
銳龍3000系列處理器可以說是AMD再一次升級主流平臺的核戰爭,現在加入了銳龍 9系列,最大核心數提高到16個,AMD本次最高只發布到12核心的銳龍 9 3900X,由於Intel主流平臺目前只有8核心的9900K,實際上銳龍 9 3900X已經威脅到HEDT了,所以16核心的銳龍 9 3950X還要留在後面,以應對Intel將來發布的10核心CometLake主流平臺處理器。
得益於7nm工藝,這代銳龍處理器比上代頻率都有了顯著提升,最大加速頻率全面超越4GHz,按照AMD的說法,Zen2比Zen+單線程效能提升21%,當中有15%是IPC的提升,6%是頻率提升的貢獻。此外,三級緩存翻倍,對遊戲性能提升有較大幫助,尤其是銳龍 9,因為有兩個CCD,三級緩存達到64MB,相當於上代的四倍。AMD也把這個緩存叫GameCache(遊戲高速緩存)。
這次發佈的銳龍3000系列處理器盒裝型號都會附帶散熱器,銳龍 7以上的型號附帶的是Wraith Prism RGB,銳龍 5附帶的是Wraith Spire。
定價方面,銳龍3000系列處理器還是繼續走良心定價策略,銳龍 9 3900X的價格3999元,多四個核心比Intel i9 9900K還便宜100元,8核心的3700X價格2599元起,比上代2700X上市價格便宜100元,6核心的銳龍 5價格全面在2000元以下。
銳龍3000處理器和X570主板圖賞
本次我們共收到兩顆處理器,銳龍 7 3700X和銳龍 9 3900X,以及兩張X570主板——華擎X570太極和技嘉AORUS X570 Master,同時還有一套芝奇8GBx2的皇家戟DDR4-3600C16內存,以及一塊2TB的技嘉AORUS NVMe Gen4 SSD。
首先看我們的主角銳龍 7 3700X和銳龍 9 3900X,兩顆CPU的包裝盒正面還是醒目的銳龍 LOGO,但是兩者包裝盒外觀不盡相同,銳龍 7 3700X是和上代近似的普通紙盒包裝,銳龍 9 3900X的紙皮則要更厚一些,開啟方式也是向上抽取式。
銳龍 9 3900X的CPU從頂部可以看到,打開封條後把上半部分取出,就可以很容易拿出CPU。可以看到在CPU包裝盒內部有各國語言寫的“專注性能,為贏而生”,不知道是不是AMD自信銳龍 9 3900X能打贏Intel i9 9900K的表現。
取出CPU包裝盒內所有物品,除CPU外,還包括一個Wraith Prism RGB散熱器,對應的RGB控制線,以及一本說明書。
CPU本體以及銳龍 9的貼紙。
CPU本體,生產週期19年22周,可見是最近才出廠的。
背面,和上代一樣的AM4接口,能看出區別的地方只有中間無針腳處的走線不一樣。
銳龍 7 3700X本體以及貼紙。
銳龍 3000系列的內存控制器有了進步,所以我們這次使用的內存也提升到3600的頻率,使用芝奇皇家戟DDR4-3600C16 8GBx2內存,三星B Die顆粒。
本次測試使用的華擎X570太極主板,這是華擎X570系列中的高端型號,我們簡單介紹一下這張主板。
供電方案採用ISL69147(X+Y=7相)+ISL6617倍相的方案,這裡配置成6+1相,等效12+2相供電,在使用非APU的銳龍處理器時,12相給核心供電,2相給SOC供電。該主板配備3個M.2接口,都可以支持PCIE 4.0 X4 64Gbps的帶寬,其中最靠近CPU的一個為CPU SOC直出,其餘兩個為芯片組提供,第三個可支持到22110規格,但與最後一條PCIE插槽共享x4帶寬。
AMD X570芯片組,TDP達到11W,所以很多主板都做了風扇用主動散熱的方案,華擎X570太極也不例外。
測試平臺及CPU-Z識別信息
測試平臺:
CPU:
AMD 銳龍 9 3900X
AMD 銳龍 7 3700X
主板:華擎X570 太極
內存:G.SKILL F4-3600C16D-16GTZR
顯卡:MSI RTX 2080 VENTUS
硬盤:
LITEON 800NAS PCEVA定製版
Corsair MP600 1TB
散熱器:Corsair H115i Platinum RGB
電源:Enermax Revolution 85+ 1050W
CPU-Z識別信息:銳龍 9 3900X,步進MTS-B0
CPU-Z識別信息:銳龍 7 3700X
CPU理論性能測試
根據規格來看,銳龍 7 3700X PK的是Intel酷睿i7 9700K,銳龍9 3900X PK 的是酷睿i9 9920X。但9920X價格太高了,而且很難找到,因此再測試中對比的是9900K。
首先看3900X和9900K的對比。多線程測試中3900X憑藉多50%的核心線程數和提升的IPC完勝9900K,單線程測試Cinebench R20也勝過9900K,R15也基本打平9900K,整數運算的SuperPI和國際象棋還是比9900K略遜一些。功耗方面,在全默認狀態下,銳龍 9 3900X在銳龍 Master裡可以看到功耗限制是142W,所以滿載功耗帶上供電損耗跑到了155W左右屬於正常水平,開啟PBO之後解鎖TDP可以跑到210W。而9900K在Z390主板上默認就解鎖了TDP限制,所以功耗也跑到了185W。3700X和9700K的對比也是類似情況,只不過3700X的功耗限制是88W,加上供電損耗也不過100W,這對8核心處理器來講是相當舒服了。
至於兩顆處理器的功耗限制都比TDP增加了35%,不知道是AMD有意為之還是主板所為,有待後續確認。
再看3700X和上代2700X的對比。同樣8核心16線程,頻率3700X略高。可以看到整數和浮點效能都提升了20%以上,符合AMD說的21%性能提升。尤其值得注意的是7-Zip和國際象棋,提升幅度相當大,得益於緩存的優化和架構上的改進。
此外,針對幾個紅色的數據說明一下,國際象棋只支持16個線程,所以銳龍 9 3900X無法跑到滿載,分數和3700X差不多;另外3700X的AIDA64內存寫入也有問題,原因是AMD這次把內存從CCD寫入cIOD的帶寬由32B/Cycle改成了16B/Cycle,而AIDA64默認的算法是32B/Cycle,所以實際上跑出來的數值只有一半,針對這個問題,AMD已經和AIDA64在溝通並改進當中。
應用軟件測試
AIDA64 CPU AES是一項基於SSE指令集的128bit浮點計算,AMD銳龍處理器由於向量運算單元設計上與Intel酷睿架構有所不同,可以同時做2x128bit的加法與乘法,所以實際上AMD銳龍處理器在運行AES時每個時鐘週期可以達到Intel兩倍的理論算力。從滿載頻率來說3700X應該比2700X高不了多少,但是性能提升7%還是比較可觀的。
用Adobe Photoshop自帶的Camera RAW把100張佳能6D拍攝的RAW文件轉為JPG,可見Photoshop 2019對超線程的優化還是不太好,9900K比9700K慢很多,但是3900X和3700X表現不錯,比2700X提升明顯。
再做一些視頻轉碼的測試,我們把一段松下GH5拍攝的4K視頻用PR 2019轉成1080P H264格式,碼率50Mbps,PR 2019對新處理器的優化還是沒有到位,3900X的12個核心似乎沒有發揮作用,用時和3700X都是一樣的,但也比2700X有明顯提升。
用小丸工具箱把上面GH5拍攝的同一視頻用H264編碼進行壓縮,可見小丸工具箱對多線程優化還是可以的,3900X僅用時68秒完成,3700X用時97秒,比9900K慢,但比9700K和2700X都快。
總的來說,銳龍處理器在一些現有應用軟件上已經表現出不俗的性能,可以和Intel的處理器對標,但同時這些軟件對新的銳龍CPU優化還沒有到位,相信之後隨著軟件版本的更新,還會有進一步提升的空間。
遊戲性能測試
得益於IPC的提升和高速遊戲緩存,我們再來對比一下銳龍3000系列處理器和Intel平臺的遊戲性能差異。我們挑選幾個網遊和單機遊戲,使用3900X和3700X對比9900K,顯卡使用AMD Radeon RX 5700XT,分辨率1080P。
《古墓麗影:暗影》是一款對CPU優化較好的DX12遊戲,自帶Benchmark,這款遊戲三個CPU跑出來的幀數基本相同,都是115的平均幀。
《地鐵:離去》,原本打算去年隨著NVIDIA RTX顯卡一塊發售,結果跳票到今年才推出的遊戲,對硬件要求很高,但是對CPU並不敏感,三顆CPU基本上都在40幀。
《全面戰爭:三國》,今年推出的一款很多單位的即時策略遊戲,配置彈性相當大,但總體還是比較吃CPU的,銳龍 9 3900X稍微領先9900K,但是差距都不大。
《CS:GO》,經典FPS遊戲,對CPU主頻和內存延遲要求比較高,這些都還是Intel的傳統優勢,所以9900K要更快。
DOTA2,和CS: GO情況類似。
PUBG,之前在銳龍二代平臺上跑,幀數很吃虧,銳龍三代得益於IPC的提升,和Intel的差距已經縮小了許多。
總體來說,銳龍三代的遊戲性能有進步,在大部分遊戲中基本可以達到和Intel齊平的水準。 而且我們會在之後再進行多任務狀況下的遊戲性能測試,比如現在很常見的遊戲直播,還可以加入直播錄像,重點比較銳龍3000系列掉幀多還是酷睿掉幀多。
超頻與穩定性測試
在默認狀態下運行Prime95 Small FFT烤機,3900X的最高溫度達到72.3度,功耗被限制在140W左右,所以頻率也只有3.6-3.7G。
3700X更舒服,只有88W的功耗限制,但是不知道為什麼跑P95 Small FFT會報錯,我們跑Blend模式,溫度只有51.5度,全核可以跑在4.25GHz,距離最大加速頻率4.4G只有一步之遙,真的不用超頻了。
我們知道,銳龍處理器在手動超頻後會自動解鎖TDP,並禁用自動加速頻率和XFR,而銳龍3000的默認加速頻率都相當高,例如3900X的最大加速頻率達到4.6GHz,所以手動超頻會損失單核心最大加速頻率,有些得不償失。
其實銳龍處理器在默認狀態下已經是調教到最好的能效比狀態,因此超頻建議只超內存就好。如果不考慮功耗的話,建議開啟精準頻率提升(PBO)解鎖功耗限制,這樣可以保持單核心加速頻率的基礎上稍微提升一下多核心頻率。銳龍 Master現在已經可以很方便地開啟PBO,你不需要進BIOS去做任何改動,只要在它內置的兩個Profile裡點其中一個,再開啟精準頻率提升或Auto Overclocking(其實也就是PBO2)即可。
但是在華擎X570太極主板上,針對銳龍 3000系列的PBO功能似乎做得並不是很好,首先Auto Overclocking加0.2G的功能似乎並不生效,其次解掉功耗和電流限制後全核加速也相當保守,哪怕TDP、TDC和EDC都沒有觸發限制,CPU在滿載時頻率並沒有比不開PBO提升太多,所以從前面的測試中,可以看到PBO2開啟後多核心性能僅提升了1-3%。
在銳龍 Master裡開啟Auto Overclocking後再次用Prime95烤機,由於TDP限制解開,滿載頻率上升至4GHz以上,這時候3900X的滿載溫度上升到92.5度,功耗來到230-240W,帶上供電損耗可達270W,但也就只是相當於9900K默認的水平而已,別忘了3900X還多四個核心呢。
3700X開啟PBO之後,跑P95 Small FFT就不報錯了,這時候全核頻率大約在4.1G,CPU溫度來到將近90度,功耗在150-160W左右。
內存超頻方面,我們建議保持1:1的IF總線頻率,以獲得最小的內存延遲,尤其是針對遊戲玩家而言,至於銳龍 Master裡的遊戲模式和創作者模式,在Win10 1903專門針對銳龍優化線程調度之後已經可以無視了。我們這顆3900X可以在內存超頻到DDR4-3800時保持1900MHz的IF總線頻率,但是在華擎X570太極的BIOS裡,你需要手動把IF頻率調到1900MHz,如果IF頻率是自動,在超過DDR4-3733後IF總線會自動跳到2:1模式。例如我們鎖定處理器頻率4GHz,IF總線從1900MHz降到950MHz,除了導致內存帶寬小幅下降,L3緩存讀取速度小幅下降之外,還導致內存延遲從65ns左右上升至76.2ns。
總結
毫無疑問,銳龍3000系列處理器的性能表現給我們交出了滿意的答卷,得益於7nm工藝、chiplet設計和改良的zen2架構,銳龍3000處理器的核心數、頻率、IPC的全面提升,遊戲性能也已經趕上Intel,再加上Win10 1903已經對銳龍的線程調度做出針對性優化,現在說銳龍3000系列處理器全面超越9代酷睿已不為過。同時定價上銳龍3000系列更有性價比,12核心殺入4000元以下,8核心繼續保持與上代相近的價格,無縫升級的AM4主板,使得主流家用平臺擁有更快的8核心以上處理器很容易成為現實,超線程方面又令人省心,不會時不時冒一些嚴重漏洞出來。總之,還有什麼可猶豫的呢?在intel沒有更好的CPU推出前,毋庸置疑民用級裝機首選這代銳龍。
至於X570主板,毫無疑問最大的亮點就是PCIE4.0的支持,補足了前兩代銳龍平臺芯片組只有PCIE2.0的短板,讓多個高速M.2設備可以在銳龍平臺上更好發揮實力,同時對未來更快的設備提供超前支持,哪怕是未來主流級的B550主板,也會有PCIE3.0的支持。當然,X570主板全新上市,BIOS上肯定還有一些不成熟,也導致了我們的評測尤其是超頻上沒辦法正常發揮,相信再給廠商一段時間,這些問題會逐步改進。