當(dāng)NVIDIA基于新一代Ampere安培架構(gòu)的GeForce RTX 30系列顯卡發(fā)布之時(shí),幾乎在所有玩家的內(nèi)心都默默的宣判了AMD的死刑。
因?yàn)榇饲霸诹?a target="_blank">處理器數(shù)量相同的情況下,同時(shí)代的NVIDIA顯卡性能是遠(yuǎn)強(qiáng)于AMD顯卡,就算是RDNA構(gòu)架也不能難幸免。RX 5700 XT無法戰(zhàn)勝擁有相同2560個(gè)流處理器數(shù)量的RTX 2070 Super,前者是7nm,后者是12nm。
新一代RTX 3090一上來就宣告擁有10496個(gè)流處理器,帶來的震撼可想而知!至于傳說中的RDNA2,很早之前大家就知道了,它最多擁有5120個(gè)流處理器。恐怕那時(shí)沒人會(huì)覺得RNDA2會(huì)威脅到RTX 3090,甚至RTX 3080都可以高枕無憂。
不過如同Zen3處理器帶給大家的震撼一樣,10月29日發(fā)布的RDNA2 GPU的實(shí)際性能表現(xiàn)幾乎超出了所有人的預(yù)料!
RDNA 2雖然是RDNA架構(gòu)的更新版本,并不是完全重新設(shè)計(jì)。但在RDNA原有的基礎(chǔ)上,RDNA2性能提升1倍,能效提升至少50%,ROP單元翻倍,完整支持DX12 Ultimate等技術(shù)特性,支持硬件光線追蹤。
可以發(fā)現(xiàn)整體布局沒有太大變化,當(dāng)然各個(gè)功能模塊都是調(diào)整優(yōu)化過的,而最突出的,一是增加了獨(dú)立的Infinity Cache高速緩存,二是在每個(gè)計(jì)算單元內(nèi)加入了專用的光追加速器Ray Accelerator。
至于RDNA 2架構(gòu)的底層細(xì)節(jié),比如說計(jì)算單元的變化,AMD這次沒有給出更多資料,只是簡單提到了幾點(diǎn),包括精簡TLB以降低延遲、重新設(shè)計(jì)32位像素流水線并支持HDR格式、優(yōu)化幾何分派與曲面細(xì)分、全方位精細(xì)時(shí)鐘門控、頻率樹分離與門控、最小化數(shù)據(jù)轉(zhuǎn)移、重新平衡流水線、高性能庫等等,但沒有任何圖示。
以下是RDNA2構(gòu)架新技術(shù)解析:
1、Smart Access Memory (SAM)顯存智取技術(shù)
在游戲運(yùn)行的時(shí)候,CPU是不能一次性訪問全部顯存的,比如RTX 3090有24GB顯存,而CPU只能訪問其中的256MB。于是有大量數(shù)據(jù)會(huì)回到內(nèi)存后給CPU處理器完成后再轉(zhuǎn)移到顯存,此時(shí)不僅浪費(fèi)了帶寬也造成了無謂的資源浪費(fèi)。
Smart Access Memory (SAM)可以讓搭載AMD 500系列芯片組在搭載Zen3 CPU和RDNA2 GPU的時(shí)候,讓Zen3 CPU可以完整訪問全部顯存,而且?guī)掃€是PCIe 4.0的速度,理論上最多可以讓游戲性能提升13%。
2、Ray Accelerator單元
在RDNA2構(gòu)架中,加入了硬件光追單元Ray Accelerator!與NVIDIA的完全專用RT Core相比,RDNA2的Ray Accelerator緊密集成到了RNDA2的CU之中,并可以共享很多在光追中通常未被充分利用到的現(xiàn)有HW。
這是AMD放出的RNA 2光追渲染效果圖,可以看到RDNA2實(shí)時(shí)光線追蹤效果與傳統(tǒng)光柵化渲染的差別。
AMD聲稱,相比于軟件方案,RDNA 2架構(gòu)的硬件加速光追性能,可以提升10倍之多,同時(shí)給出了部分游戲的實(shí)際性能,2K分辨率下《使命召喚:現(xiàn)代戰(zhàn)爭》可以跑出95FPS,《孤島危機(jī)重制版》可達(dá)90FPS,《戰(zhàn)地5》能有70FPS。
3、全局Infinity Cache
在大容量三級(jí)緩存的加持下,Zen3的IPC性能獲得了巨大的性能提升。如今AMD將這個(gè)理念帶入了GPU領(lǐng)域。
傳統(tǒng)的GPU構(gòu)架中,一般只有1.5~4MB的緩存,RDNA2除了4MB的L2緩存之外,還加入了128MB的全局Infinity Cache緩存,所有的CU單元均可以訪問。
AMD Infinity Cache 作為一個(gè)巨大的帶寬放大器,其有效帶寬可以達(dá)到256 位 16 Gbps GDDR6 顯存的 4 倍。在Infinity Cache的帶動(dòng)下,512GB/s帶寬的RX 6900 XT的性能表現(xiàn)足以媲美936GB/s帶寬的RTX 3090。
4、Fidelity FX超分辨率抗鋸齒技術(shù)
針對(duì)NVIDIA DLSS深度學(xué)習(xí)超采樣抗鋸齒技術(shù),AMD也提出了超分辨率(FidelityFX Super Resolution),簡稱FSR。目前這個(gè)技術(shù)正在開發(fā)中,不久之后會(huì)在新驅(qū)動(dòng)中提供支持
歷代AMD顯卡在ROP單元數(shù)量上都非常保守,最頂級(jí)型號(hào)的GPU最多就只有64個(gè)ROP。這一次AMD非常的激進(jìn),RX 6800 XT直接就配備了128個(gè)ROP,也是GPU歷史上第一款擁有128個(gè)ROP的顯卡。
責(zé)任編輯:pj
-
處理器
+關(guān)注
關(guān)注
68文章
19802瀏覽量
233520 -
amd
+關(guān)注
關(guān)注
25文章
5560瀏覽量
135866 -
cpu
+關(guān)注
關(guān)注
68文章
11033瀏覽量
215978
發(fā)布評(píng)論請(qǐng)先 登錄
主板上的顯卡的特點(diǎn)是什么?能用來干什么?
如何在Ubuntu上安裝NVIDIA顯卡驅(qū)動(dòng)?

DLPC350燒寫的時(shí)候,總是卡在3%,為什么?
RDNA 4顯卡定在3月發(fā)售 AMD解釋原因
國產(chǎn)顯卡品牌有那些?
AMD確認(rèn)2025年推出RDNA 4顯卡,光追與AI性能大幅提升
AMD與NVIDIA GPU優(yōu)缺點(diǎn)
AMD Radeon RX 7000系列移動(dòng)顯卡賦能筆記本電腦卓越性能
簡單認(rèn)識(shí)AMD Radeon RX 6750 GRE系列顯卡

AMD Radeon RX 7700 XT顯卡的主要特性

如何維修一張電腦顯卡型號(hào)是amd的rx580 燒壞的部位?
C2000 DCSM ROM代碼片段/ROP漏洞

評(píng)論