傳統上講,LRDIMM(低負載雙列直插存儲器模塊) 和 RDIMM(雙列直插存儲器模塊) 為數據中心企業服務器提供補充解決方案——LRDIMM 針對需要更深存儲器的應用,而 RDIMM 則針對需要更高數據帶寬的應用。然而,隨著 8Gb DRAM 的推出,LRDIMM 已提供出色的備選解決方案,能同時滿足更深存儲器和更高數據帶寬需求。
尤其是基于8Gb DDR4 DRAM 的 32GB 2RX4 LRDIMM 已證明在服務器內存容量和帶寬方面全面超越 32GB 2RX4 RDIMM。
需要同時具備更深存儲器和更高數據帶寬
越來越多的互聯網應用,例如內存數據庫 (IMDB),正受益于更深存儲器和更高數據帶寬。更大的 IMDB意味著更多的數據可以存儲在高速 DDR4 DRAM 存儲器中,從而減少數據處理過程中與較慢存儲介質的數據交換。減少與較慢存儲介質的數據交換意味著內存密集型應用將運行得更快。IMDB 應用包括數據分析、金融算法、游戲和搜索算法。圖 1 給出了一些實例。
圖1
LRDIMM 的優勢
在 8Gb DRAM 之前,32GB LRDIMM 基于采用比較昂貴的DDP1 封裝的 4Gb DRAM 構建而成,如圖 2 所示。
圖 2
在基于 4Gb DRAM 的 32GB 4RX4 LRDIMM 中,來自前側 DDP 的兩路 DRAM 數據負載和來自后側 DDP 的兩路 DRAM 數據負載共享相同的數據總線。這四路 DRAM 數據負載經 LRDIMM 的獨特數據緩沖架構進一步縮減為一路數據緩沖器負載。
采用這種數據負載減少技術后,當在一條內存通道中放置三個 LRDIMM 時,只會出現三路負載。 此外,九個數據緩沖器位于距離邊緣連接器非常近的位置,能減少數據傳輸短截線長度 (transmission stublength)。減少傳輸短截線長度和數量能提高信號完整性。圖 3 給出了用 3 個 LRDIMM (3 DPC) 配置的內存控制器通道 (MCH)。提高信號完整性可增加更多的信號裕度,因此在將數千個存儲器模塊放置在典型數據中心的數千臺服務器中時,能夠提高服務器系統的可靠性。
圖 3
與 32GB 4RX4 LRDIMM 不同,32GB 4RX4 RDIMM 并未得到開發,因為在沒有用于減少負載的數據緩沖器的情況下,4 路 DRAM 數據負載都會出現在 MCH 通道中,這樣每個 MCH 配置中的 3 個 RDIMM 中總共會有 12 路負載(4 路 DRAM 負載 x 3 個 RDIMM)。
此外,在沒有數據緩沖器的情況下,從 DRAM 到邊緣連接器的信號距離就會增加。傳輸短截線的長度和數量的增加意味著信號完整性變差。這也就是為什么基于 4Gb DRAM 的 RDIMM 會止步于 16GB 2RX4 內存容量,而 LRDIMM 則能達到 32GB 4RX4 內存容量。
由于應用不斷地受益于內存容量的增加,而 8Gb DRAM 能夠讓 RDIMM“最佳效點”的存儲器模塊從16GB 增加至 32GB。16GB RDIMM 基于 4Gb DRAM,采用 2RX4 配置構建而成。這樣,就可通過相同的2RX4 配置利用 8Gb DRAM 構建出 32GB RDIMM,因為每個 DRAM 都提供雙倍的內存容量。同樣,可使用8Gb DRAM 以 2RX4 配置構建出 32GB LRDIMM,而不必使用昂貴的 DDP 通過 4RX4 配置來構建。利用 8GbDRAM 將 RDIMM 內存容量從 16GB 增加至 32GB,以及取代以前使用昂貴的 DDP 來構建 32GB LRDIMM,對于完全填充的系統來說哪種是更好的選擇—— 32GB LRDIMM 還是 32GB RDIMM?我們的實驗室測量結果表明 32GB 2RX4 LRDIMM 比 32GB 2RX4 RDIMM 具有明顯優勢,您可在更高帶寬下受益于更大的內存。
對比 32GB LRDIMM 和 32GB RDIMM
典型的企業級服務器可具備多達 24 個存儲器模塊,如圖 4 所示。一臺服務器具有 24 個存儲器模塊,每個模塊 32GB,那么將擁有 768Gb 內存(24 x 32GB)。
圖 4
哪種 32GB 存儲器模塊解決方案在總服務器內存和數據帶寬方面更甚一籌—— LRDIMM 還是RDIMM? IDT 通過以下過程來判斷:
1) 針對完全填充的 3DPC 系統配置確定 MCH 通道上模塊的信號完整性
2) 以可接受的信號完整性為 LRDIMM 和 RDIMM 選擇最高的速度
3) 在最高速度下對比帶寬,以確定 LRDIMM 還是 RDIMM 具有更高的內存帶寬
在兩個位置測量數據信號完整性,如圖 5 中所示的 V+ 和 V-。電壓測量值 V+ 更正且 V- 更負,說明信號完整性越好。這兩個值都是衡量實際數據眼圖信號與數據眼圖波罩之間有多少電壓裕度。無論采用什么樣的數據信號圖案、DIMM、服務器主板和微處理器,數據眼圖信號都不能進入數據眼圖波罩之內的區域。如果數據眼圖信號進入數據眼圖波罩區域,必須將數據值“1” 解讀為“0”,反之亦然。
圖 5
接收和發送方向的四個測量結果表明,2400 MT/s 運行速度下的 3DPC LRDIMM 信號完整性優于 3DPCRDIMM 在 2400 MT/s 和 2133MT/s 速度下的信號完整性。圖 6 中給出了所測量的信號完整性數據,3DPCRDIMM 測量結果為琥珀色,3DPC LRDIMM 的測量結果為綠色。2400 MT/s 下的 LRDIMM 具有更正的 V+和更負的 V-,表明整體信號完整性更好。
圖 6
由于 3DPC RDIMM 在 2400 MT/s 的速度下電壓裕度很低,因此 IDT 認為這樣的 RDIMM 速度和密度組合不適合服務器,可以忽略。盡管 3DPC RDIMM 在 2133 MT/s 的速度下仍表現出較低的電壓裕度,但在沒有 2400 MT/s 這種速度選擇的情況下,IDT 還是選用 2133 MT/s 速度配置與在 2400 MT/s 的速度下工作的32GB LRDIMM 進行帶寬比較。
IDT 使用 Membw2 來比較帶寬。Membw 是一款用于內存帶寬測試的公用軟件。Membw 通過所有內存通道用讀和寫操作對存儲器模塊施壓。這種基準測試所采用的服務器具有兩個 Intel 多核微處理器,每個都有 4 個內存通道,以及用 3 DPC 共容納 24 個存儲器模塊。Membw 基準測量結果表明,2400 MT/s 下的3DPC LRDIMM 帶寬比 2133 MT/s 下的 3DPC RDIMM 帶寬高 8%。
圖 7
結論
不斷發展的企業級服務器應用將受益于帶寬和存儲器模塊容量的提高。IDT 將采用 3DPC 配置的 32GB2RX4 LRDIMM 與 32GB 2RX4 RDIMM 進行信號完整性和讀/ 寫帶寬方面的性能對比。與相同配置下采用24 個運行速率為 2133 MT/s 的 32GB RDIMM 相比,完全填充的服務器采用 24 個運行速率為 2400 MT/s 的32GB LRDIMM 時具備更出色的信號完整性。工作在 2400 MT/s 的 LRDIMM 比工作在 2133 MT/s 的 RDIMM帶寬高 8%。
即使在主流模塊密度下,DDR4 LRDIMM 也可讓您實現比 RDIMM 更高的內存帶寬。
評論