存儲器子系統(tǒng)的主要功能是在云計算和人工智能 (AI)、汽車和移動等廣泛應(yīng)用中盡可能快速可靠地為主機(CPU 或 GPU)提供必要的數(shù)據(jù)或指令。片上系統(tǒng) (SoC) 設(shè)計人員可以選擇多種類型的存儲器技術(shù),每種技術(shù)都具有不同的特性和高級功能。雙數(shù)據(jù)速率 (DDR) 同步動態(tài)隨機存取存儲器 (SDRAM) 已成為主系統(tǒng)存儲器最主流的存儲器技術(shù),因為它使用電容器作為存儲元件來實現(xiàn)高密度和簡單架構(gòu)、低延遲和高性能、無限存取耐力和低功耗。
選擇正確的存儲器技術(shù)通常是實現(xiàn)最佳系統(tǒng)性能的最關(guān)鍵決策。本文介紹了不同的存儲器技術(shù),旨在幫助 SoC 設(shè)計人員選擇最適合其應(yīng)用要求的正確存儲器解決方案。
DDR DRAM標準
設(shè)計人員不斷為他們的 SoC 添加更多內(nèi)核和功能;然而在保持低功耗和較小硅尺寸的同時提高性能仍然是一個至關(guān)重要的目標。DDR SDRAM(簡稱 DRAM)通過在雙列直插式存儲模塊 (DIMM) 或分立式 DRAM 解決方案中提供密集、高性能和低功耗的存儲器解決方案,以滿足此類存儲器要求。JEDEC 定義并開發(fā)了以下三種 DRAM 標準類別,幫助設(shè)計人員滿足目標應(yīng)用的功耗、性能和規(guī)格要求:
標準 DDR?面向服務(wù)器、云計算、網(wǎng)絡(luò)、筆記本電腦、臺式機和消費類應(yīng)用,支持更寬的通道寬度、更高的密度和不同的形狀尺寸。自 2013 年以來,DDR4 一直是這一類別中最常用的標準;預(yù)計 DDR5 設(shè)備會在不久的將來上市。
移動 DDR?面向移動和汽車這些對規(guī)格和功耗非常敏感的領(lǐng)域,提供更窄的通道寬度和多種低功耗運行狀態(tài)。今天最主流的標準是 LPDDR4,預(yù)計在不久的將來會推出 LPDDR5 設(shè)備。
圖形 DDR?面向需要極高吞吐量的數(shù)據(jù)密集型應(yīng)用程序,例如圖形相關(guān)應(yīng)用程序、數(shù)據(jù)中心加速和 AI。圖形 DDR (GDDR) 和高帶寬存儲器 (HBM) 是這一類型的標準。
上述三種 DRAM 類別使用相同的 DRAM 陣列進行存儲,以電容器作為基本存儲元件。但是,每個類別都提供獨特的架構(gòu)功能,旨在最好地滿足目標應(yīng)用程序的要求。這些功能包括數(shù)據(jù)速率和數(shù)據(jù)寬度自定義、主機和 DRAM 之間的連接選項、電氣規(guī)格、I/O(輸入/輸出)端接方案、DRAM 電源狀態(tài)、可靠性特性等。圖 1 展示了 JEDEC 的三類 DRAM 標準。
圖 1:JEDEC 定義了三類 DRAM 標準,以滿足各種應(yīng)用的設(shè)計要求
標準 DDR
標準 DDR DRAM 在企業(yè)服務(wù)器、數(shù)據(jù)中心、筆記本電腦、臺式機和消費類應(yīng)用等應(yīng)用領(lǐng)域隨處可見,可提供高密度和高性能。DDR4 是這一類別中最常用的標準,與其前代產(chǎn)品 DDR3 和 DDR3L(DDR3 的低功耗版本)相比具有多項性能優(yōu)勢:
與運行速度最高為 2133Mbps 的 DDR3 相比,它的數(shù)據(jù)速率更高,最高可達 3200Mbps
工作電壓更低(相較于 DDR3 的 1.5V 和 DDR3L 的 1.35V,它只有 1.2V)
性能更高(例如存儲體組)、功耗更低(例如數(shù)據(jù)總線反轉(zhuǎn)),并且可靠性、可用性和可維護性 (RAS) 特性更優(yōu)(例如包裝后修復(fù)和數(shù)據(jù)循環(huán)冗余檢查)
由于各個 DRAM 晶圓尺寸從 4Gb 增加到 8Gb 和 16Gb,因此密度更高
正在 JEDEC 開發(fā)的 DDR5 預(yù)計將在 1.1V 的工作電壓下將運行數(shù)據(jù)速率提高到 4800Mbps。DDR5 新增多種架構(gòu)和 RAS 特性,可有效處理這些高速運行,同時盡量縮短因存儲器錯誤導(dǎo)致的系統(tǒng)停機時間。模塊上的集成穩(wěn)壓器、更好的刷新方案、旨在提高通道利用率的架構(gòu)、DRAM 上的內(nèi)部糾錯碼 (ECC)、用于提高性能的更多存儲體組以及更高的容量只是 DDR5 的一小部分關(guān)鍵特性。
移動 DDR
與標準 DDR DRAM 相比,移動 DDR(也稱為低功耗 DDR (LPDDR) DRAM)具有一些可以降低功耗的附加功能,而降低功耗正是移動/電池供電應(yīng)用(如平板電腦、移動電話和汽車系統(tǒng),以及 SSD 卡)的核心要求。LPDDR DRAM 可以比標準 DRAM 運行得更快,以實現(xiàn)高性能并提供低功耗狀態(tài),幫助提高電源效率和延長電池壽命。
與標準 DDR DRAM 通道(64 位寬)相比,LPDDR DRAM 通道通常為 16 位或 32 位寬。與標準 DRAM 產(chǎn)品一樣,每個連續(xù)的 LPDDR 標準產(chǎn)品都瞄準了比其前代產(chǎn)品更高的性能和更低的功耗目標,并且任何兩個 LPDDR 產(chǎn)品都不會彼此兼容。
LPDDR4 是這個類別中最常用的標準,在 1.1V 的工作電壓下的數(shù)據(jù)速率最高可達 4267Mbps。LPDDR4 DRAM 通常是雙通道設(shè)備,支持兩個 x16(16 位寬)通道。各個通道都是獨立的,因此具有自己的專用命令/地址 (C/A) 引腳。雙通道架構(gòu)為系統(tǒng)架構(gòu)人員提供了靈活性,同時將 SoC 主機連接到 LPDDR4 DRAM。
LPDDR4X 是 LPDDR4 的一種變體,與 LPDDR4 完全相同,只是能夠通過將 I/O 電壓 (VDDQ) 從 1.1 V 降低到 0.6 V 來額外降低功耗。LPDD4X 設(shè)備也可以實現(xiàn)高達 4267Mbps 的速率。
LPDDR5 是 LPDDR4/4X 的后續(xù)產(chǎn)品,預(yù)計運行速率高達 6400Mbps,并且正在 JEDEC 進行積極開發(fā)。LPDDR5 DRAM 有望提供許多新的低功耗和可靠性特性,使其成為移動和汽車應(yīng)用的理想選擇。其中一種重要特性就是用于延長電池壽命的“深度睡眠模式”,有望顯著節(jié)省空閑條件下的功耗。此外,還有一些新的架構(gòu)特性使 LPDDR5 DRAM 能夠以低于 LPDDR4/4X 的工作電壓在此類高速條件下無縫運行。
圖形 DDR
針對高吞吐量應(yīng)用(例如顯卡和 AI)的兩種不同的存儲器架構(gòu)是 GDDR 和 HBM。
GDDR 標準
GDDR DRAM 是專為圖形處理器 (GPU) 和加速器設(shè)計的。數(shù)據(jù)密集型系統(tǒng)(如顯卡、游戲控制臺和高性能計算,包括汽車、AI 和深度學(xué)習)是 GDDR DRAM 設(shè)備常用的一些應(yīng)用。GDDR 標準 (GDDR6/5/5X) 被架設(shè)為點對點 (P2P) 標準,能夠支持高達 16Gbps 的速率。GDDR5 DRAM 一直用作離散的 DRAM 解決方案,能夠支持高達 8Gbps 的速率,經(jīng)過配置后可在設(shè)備初始化期間檢測到的 ×32 模式或 ×16(折疊)模式下運行。
GDDR5X 的目標是每個引腳的傳輸速率為 10 到 14Gbps,幾乎是 GDDR5 的兩倍。GDDR5X 和 GDDR5 DRAM 的主要區(qū)別在于 GDDR5X DRAM 擁有的預(yù)加載為 16N,而不是 8N。與 GDDR5 每個芯片使用 170 個引腳相比,GDDR5X 每個芯片使用 190 個引腳。因此,GDDR5 和 GDDR5X 標準需要不同的 PCB。GDDR6 是最新的 GDDR 標準,支持在 1.35V 的較低工作電壓下運行高達 16Gbps 的更高數(shù)據(jù)速率,而 GDDR5 需要 1.5V 才能達到該速率。
HBM/HBM2 標準
HBM 是 GDDR 存儲器的替代品,可用于 GPU 和加速器。GDDR 存儲器旨在以較窄的通道提供更高的數(shù)據(jù)速率,進而實現(xiàn)必要的吞吐量,而 HBM 存儲器通過 8 條獨立通道解決這一問題,其中每條通道都使用更寬的數(shù)據(jù)路徑(每通道 128 位),并以 2Gbps 左右的較低速度運行。因此,HBM 存儲器能夠以更低的功耗提供高吞吐量,而規(guī)格上比 GDDR 存儲器更小。HBM2 是目前該類別中最常用的標準,支持高達 2.4Gbps 的數(shù)據(jù)速率。
HBM2 DRAM 最多可疊加 8 個 DRAM 晶圓(包括一個可選的底層晶圓),可提供較小的硅片尺寸。晶圓通過 TSV 和微凸塊相互連接。通??捎玫拿芏劝總€ HBM2 封裝 4 或 8GB。
除了支持更多的通道外,HBM2 還提供了一些架構(gòu)更改,以提高性能并減少總線擁塞。例如,HBM2 具有“偽通道”模式,該模式將每個 128 位通道分成兩個 64 位的半獨立子通道。它們共享通道的行和列命令總線,卻單獨執(zhí)行命令。增加通道數(shù)量可以通過避免限制性時序參數(shù)(例如 tFAW)以在每單位時間激活更多存儲體,從而增加整體有效帶寬。標準中支持的其他功能包括可選的 ECC 支持,可為每 128 位數(shù)據(jù)啟用 16 個錯誤檢測位。
預(yù)計 HBM3 將在幾年內(nèi)上市,并提供更高的密度、更大的帶寬 (512GB/s)、更低的電壓和更低的成本。表 1 顯示了 GDDR6 和 HBM2 DRAM 的高級別比較結(jié)果:
表格 1:GDDR6 和 HBM2 為系統(tǒng)架構(gòu)人員帶來獨特的優(yōu)勢
AMD認為GDDR5無法跟上GPU性能的增長速度,同時,GDDR5不斷上升的功耗可能很快就會大到阻止圖形性能的增長。相比之下,GDDR5需要更多的芯片和電路電壓才能達到高帶寬。
NAND、DRAM和Optics等技術(shù)將受益于片上集成技術(shù),而且在技術(shù)上并不兼容。HBM是一種低功耗、超寬帶通信通道的新型存儲芯片。它使用垂直堆疊的存儲芯片,通過被稱為“硅透”(TSV)的線相互連接,HBM突破了現(xiàn)有的性能限制。
此外,HBM相比GDDR5,減少了通信成本,單位帶寬能耗更低,制作工藝更高,所以極大減少晶元空間。
總結(jié)
為了提供具有獨特功能和優(yōu)勢的各種 DRAM 技術(shù),JEDEC 為 DDR 定義并制定了三大類標準:標準 DDR、移動 DDR 和圖形 DDR。標準 DDR 面向服務(wù)器、數(shù)據(jù)中心、網(wǎng)絡(luò)、筆記本電腦、臺式機和消費類應(yīng)用,支持更大的通道寬度、更高的密度和不同的外形尺寸。移動 DDR 或 LPDDR 面向非常注重規(guī)格和功耗的移動和汽車應(yīng)用,提供更窄的通道寬度和幾種低功耗 DRAM 狀態(tài)。圖形 DDR 面向需要極高吞吐量的數(shù)據(jù)密集型應(yīng)用。JEDEC 已將 GDDR 和 HBM 定義為兩種圖形 DDR 標準。SoC 設(shè)計人員可以在各種存儲器解決方案或標準中挑選,以滿足其目標應(yīng)用的需求。選定的存儲器解決方案會影響其 SoC 的性能、功耗和規(guī)格要求。
審核編輯:湯梓紅
評論