數據中心持續演進,性能、擴展性與運維效率,面臨新一輪挑戰,如何在有限空間內實現更強算力與靈活部署?作為戴爾科技面向核心場景打造的全新2U服務器,Dell PowerEdge R770首發支持Xeon 6處理器家族,并引入OCP DC-MHS模塊化標準,這款“設計有變,性能有料”的重磅新品,在專業評測機構StorageReview的實測中表現如何?讓我們一探究竟!
戴爾PowerEdge R7x0系列服務器長期以來一直是數據中心的核心設備,其以卓越的制造質量、周到的設計、性能、密度和可靠性以及多功能的2U外形而聞名。如今,隨著戴爾PowerEdge R770的推出,該系列服務器實現了重大飛躍。
R770首次搭載英特爾全新至強6處理器系列,包括至強6500和6700P核心及E核心處理器。這標志著戴爾首次在其主流服務器產品線中全面采用OCP數據中心模塊化硬件系統(DC MHS)標準。這兩項改進共同預示著其性能和設計理念的重大革新。
滿足現代數據中心需求
R770的推出正值數據中心面臨多重挑戰之際,工作負載變得愈發多樣化和復雜化。數據的持續增長推動著對強大分析功能和數據庫的需求。
與此同時,能源效率和總擁有成本(TCO)的優化也備受關注。此外,業界越來越傾向于開放標準,以促進創新、增強互操作性,并盡可能減少供應商鎖定。R770配備全新處理器選項,并采用OCP DC MHS標準,旨在正面應對這些挑戰。
模塊化設計與OCP DC MHS的全面支持
PowerEdge R770在物理設計和組件架構方面實現了重大進步,采用了開放計算項目(Open Compute Project)的數據中心模塊化硬件系統(OCP DC MHS)標準。
R770延續R7x0系列的優良傳統,提供豐富的配置選項,以滿足多樣化部署需求。該系列的一大亮點是支持傳統的后置I/O配置和前I/O冷通道可訪問配置,從而為不同數據中心布局和可維護性需求提供更大靈活性。
存儲選項同樣豐富多樣,從專注于計算且本地存儲極少,或沒有本地存儲的節點,到支持40個E3.S硬盤的高密度配置,滿足以存儲為中心的工作負載。
為了滿足日益增長的加速計算需求,R770擁有強大擴展能力。根據機箱和擴展槽配置,服務器最多可支持6個Gen5 x16全高全長PCIe插卡,并可安裝兩塊雙寬GPU,使其成為一個能夠勝任各種任務的平臺。通過OCP 3.0 Mezzanine插槽,還可選擇x8或x16的網絡適配器。
戴爾還實施了多項設計改進,旨在提高可維護性和可靠性。例如,BOSS(啟動優化存儲解決方案)卡從原先通過線纜連接并集成在PCIe擴展槽中的形式,升級為符合OCP標準的獨立卡片,直接連接主板,減少了線纜復雜性。
這款新BOSS控制器配備了更快的NVMe M.2驅動器,并配備散熱器,以確保啟動設備在理想溫度下運行。此外,在維護操作方面,從傳統跳線更換為更易用的DIP開關,例如用于清除NVRAM。
最深遠的架構變革是完全采用OCP DC MHS 標準。戴爾在上一代產品中已引入部分OCP元素(如OCP 3.0網絡插槽),而R770進一步擴展。包括主板(HPM)、擴展槽(M-XIO接口)等關鍵組件都采用了OCP規范,提升了靈活性與可升級性。iDRAC(管理控制器)也以OCP DC-SCM(服務器控制模塊)標準實現。
此外,R770引入了全新的PICPWR電源接口,用于為GPU和背板等外設供電。該接口顯著簡化了供電方案,并集成了在線功耗監控功能。這種深度集成使各個子系統的接口和外形尺寸標準化。
新一代iDRAC 10
戴爾PowerEdge R770在原有功能豐富、廣受歡迎的iDRAC 9基礎上,引入了新一代iDRAC 10,通過與數據中心安全控制模塊(DC-SCM)的無縫集成,進一步增強了系統管理能力。
這種集成支持更高效的固件更新與配置管理,確保整個數據中心操作的一致性與可擴展性。iDRAC 10同時具備高級自動化與監控能力,使IT管理員能夠在不犧牲性能或可靠性的前提下,高效管理大規模部署。
安全性是R770管理功能的基石,戴爾實施了強大的預啟動和啟動驗證機制。借助基于硅的信任根技術,iDRAC 10確保包括BIOS與自身在內的所有固件在執行前均經加密驗證。這種基于硬件的不可篡改的安全措施可防止惡意軟件篡改和供應鏈攻擊,為系統運行提供安全的基礎。
此外,R770還集成了量子安全啟動協議,以應對未來可能出現的加密威脅,進一步鞏固關鍵基礎設施的安全性。
戴爾對供應鏈安全的承諾在R770的設計中得到了充分體現。其采用完整的信任鏈認證流程,所有硬件組件在制造過程中嵌入加密簽名,并在部署前進行驗證,確保系統僅運行授權固件與正品部件,從而降低未經授權更改或仿冒部件帶來的風險。
Dell PowerEdge R770性能測試
作為戴爾的旗艦主力服務器系統,R770將部署于眾多不同的應用環境。因此,StorageReview對該平臺進行了多項基準測試,以展示其在不同場景下的性能表現。在部分測試中,還加入了其他廠商服務器的對比數據,以體現高端E核與P核CPU在性能上的差異。
系統配置
CPU:2顆Intel Xeon 6787P(每顆86核)
內存:32xMicron64 GB雙Rank DDR5 6400MT/s,總容量2TB
電源:2xDelta 1500W
GPU:1xNVIDIA L4
網卡:DELL BRCM 4P 25G SFP 57504S OCP網卡
BOSS卡:BOSS-N1 DC-MHS,磁盤0和1 為SK hynix 480 GB Dell NVMe ISE PE9010 RI M.2 SSD
磁盤:背板1上的磁盤槽位0-5配置為三星 6.4TB,Dell NVMe PM1745 MU E3.S SSD(6.4TB)
#01GPU Direct Storage(GDS)
GPU Direct Storage是一種繞過CPU和系統內存,在存儲設備和GPU之間實現直接數據傳輸的技術。在傳統的數據傳輸流程中,數據首先從存儲中讀取至CPU內存,再從CPU內存復制到GPU內存。這一過程涉及多次數據拷貝,帶來延遲增加和性能下降的問題。而GDS通過允許存儲設備直接訪問GPU內存,有效消除了這一瓶頸。
StorageReview基于一個包含16塊硬盤的存儲系統進行了GDSIO負載分析,逐步增加參與的硬盤數量,以評估在R770平臺上該系統的存儲性能以及其對PCIe Gen5 GPU帶寬飽和度的影響。
讀取測試圖表顯示,隨著所用KIOXIA CD8P SSD數量從1塊增至4塊,總讀取吞吐量快速上升,最高達到約50.2GiB/s。這表明,僅需3至4塊驅動器即可充分利用PCIe Gen5 x16鏈路帶寬,滿足GPU數據加載需求。而當硬盤數量超過5塊后,總吞吐量趨于平臺期,新增硬盤對性能提升效果不大。
與此同時,每塊硬盤的平均讀取吞吐量在前4塊時保持穩定,但在繼續添加硬盤后出現下降。這一現象的原因在于,更多的硬盤共享有限的PCIe總線帶寬,導致單塊硬盤的讀取能力被分攤。
與讀取相比,這些硬盤的寫入性能偏低。在寫入測試中,必須使用全部16塊硬盤才能達到46.7GiB/s的寫入帶寬,而各硬盤的平均寫入速度基本保持不變。這是因為所用的KIOXIA CD8系列屬于較低寫入性能容量版本,若采用大容量版本或其他PCIe Gen5 SSD,寫入表現可能會更好。
#02HammerDB TPROC-C數據庫
基準測試
StorageReview使用HammerDB的TPROC-C基準測試對四款流行的開源數據庫進行了評估,分別是MariaDB 11.4.4、MySQL 8.4.4、MySQL 5.7.44和PostgreSQL 17.2。該測試模擬了覆蓋500個倉庫的OLTP(聯機事務處理)工作負載。
在此次評測中,MariaDB表現最為出色,尤其是在雙路處理器配置下,其可擴展性優秀,實現了最高的事務吞吐量。MySQL 8.4.4相較舊版的5.7.44有顯著性能提升,體現了新版在性能優化方面的進步。PostgreSQL 17.2表現穩定,但略遜于MariaDB和MySQL 8.4.4。
在單路CPU情況下,MariaDB實現了315萬TPM(每分鐘事務數)在雙路CPU配置中,MariaDB達到了580萬TPM,在兩個場景中都領先其他數據庫。
盡管R770搭載了強大的硬件(每顆CPU配備86 個核心,包含性能核和效率核),但沒有數據庫在橫跨雙路CPU時表現出明顯的性能增益。這也反映出開源數據庫普遍更傾向于在單路處理器上運行,以獲得更好的核心局部性(核心調度更貼近數據)和更低的內存訪問延遲。
因此,根據測試結果,R770更適合在虛擬化環境中運行多個數據庫實例,而不是橫向擴展單個實例。其架構更適合支撐高密度、混合數據庫的負載,能夠有效利用性能核與效率核,實現多個實例的穩定吞吐。
#037-Zip基準測試
7-Zip是一款流行的壓縮工具,它自帶的內存基準測試可以評估系統在數據壓縮與解壓縮任務中的CPU和內存性能,反映系統對數據密集型工作負載的處理能力。
在此次測試中:
壓縮性能方面,R770得分266.425 GIPS,并且CPU使用率略低,表現出更優的壓縮效率。
解壓縮性能方面,對比系統表現更強,得分288.457 GIPS,高于戴爾的256.154 GIPS,但CPU使用率也相對更高。
總體評分,戴爾系統以261.290 GIPS略高,展現出在壓縮和解壓縮任務中更均衡的效率表現。
#04y-cruncher性能測試
y-cruncher是一款廣受歡迎的基準測試和壓力測試工具,特別適合用于測試大核心數平臺,并揭示單路與雙路平臺在計算能力上的差異。
本次y-cruncher基準測試結果顯示:隨著數據集規模擴大,R770(搭載性能核心P-core的CPU)與對比系統(采用能效核心E-core的CPU)之間的性能差距顯著拉大。這不是簡單比較哪臺系統更強,而是更側重展示不同CPU架構在此類計算負載下的表現差異。
在較小計算規模下,R770就已領先:計算10億位圓周率時,僅用2.753秒,而對比系統耗時5.997秒,幾乎是兩倍。
工作負載繼續擴大時,差距進一步擴大:在100億位測試中,R770耗時34.873秒,而對比系統需要81.046秒,R770快了一半以上。
當計算規模達到500億位時,R770用時221.255秒,對比系統則為476.826秒,R770快了53%。
最終,在1000億位計算中,由于對比系統配置僅為512GB內存,無法完成測試;而內存達到2TB的R770系統則順利完成任務,僅用491.737秒,展現出強大的內存容量和計算性能協同能力。
#05Blender OptiX性能測試
Blender是一款開源的3D建模與渲染應用。此次測試使用Blender Benchmark工具進行,測試結果以“每分鐘采樣數”計量,數值越高表示性能越好。
測試結果顯示,在CPU渲染方面,R770相較對比系統具備明顯的性能優勢:
在Monster場景下,R770達到了1706.002 samples/min,比對比系統的1432.09 samples/min高出約19%。
在Junkshop場景測試中,R770為1169.370 samples/min,而對比系統僅為914.75 samples/min,差距擴大至28%。
在Classroom場景中,R770成績為791.475 samples/min,對比系統為656.68 samples/min,領先20%。
值得注意的是,對比系統系統未配置GPU,因此無法參與基于GPU的渲染測試。而R770搭載的NVIDIA L4GPU在GPU渲染測試中表現如下:
Monster場景:1895.71samples/min
Junkshop場景:950.42samples/min
Classroom場景:968.43samples/min
R770不僅在CPU渲染方面表現出色,在GPU渲染方面同樣具備強勁的能力,適合高負載的圖形渲染場景。
#06Cinebench R23基準測試
Cinebench R23是一款評估系統CPU性能的工具,通過渲染復雜的3D場景來測試處理器的計算能力。它分別測量單核性能和多核性能,可全面反映CPU在3D渲染任務中的表現。
在Cinebench R23測試中,R770與對比系統在CPU性能上表現出明顯差異,尤其是在核心數量方面:
多核測試中,對比系統搭載2顆Intel Xeon 6780E(每顆144核,共計288核),在多線程工作負載中占據優勢,得分99266分,高于戴爾的74710分(R770配置為2顆Xeon 6787P,每顆86核,共172核)。顯示出在多核測試中內核數量多少的重要性。
在單核測試中,R770表現更佳,得分為1272分,超越對比系統的894分,凸顯了R770雖然核心數較少,但單線程效率卻更勝一籌。
#07Cinebench 2024 基準測試
Cinebench 2024是Cinebench R23的擴展版本,新增了對GPU性能的評估,在延續CPU測試的基礎上,加入了GPU加速渲染的測試項目。
GPU性能測試中,R770的GPU得分為12996分,展現出其處理GPU加速渲染任務的能力。而對比系統因未配置獨立GPU,未參與此項測試。
CPU多核測試中,對比系統得分2884分,略高于R770的2831分,再次印證其在核心數量上的優勢。
CPU單核測試中,R770依舊領先,得分71分,高于對比系統的53分,說明其在單線程任務上依然具備更高效的處理能力,適合對響應速度和單核性能要求較高的應用場景。
#08Geekbench 6基準測試
Geekbench 6是一款跨平臺的系統性能測試工具,用于評估系統整體計算能力,并可通過Geekbench瀏覽器對比不同設備的表現。
測試結果顯示,R770與對比系統在性能上存在明顯差異:
CPU單核性能測試:R770得分1797,對比系統得分1173,R770領先53%,顯示出其在單線程任務中的更強計算效率。
CPU多核性能測試:R770得分15880,高于對比系統的13868,擁有14%的優勢,表明R770的Xeon 6787P處理器在多核任務中表現更優,適合并行計算場景。
GPU OpenCL測試:R770憑借NVIDIA L4 GPU取得148730分,對比系統未搭載GPU。
性能測試
Blackmagic RAW Speed Test是一款用于評估系統在使用Blackmagic RAW編解碼格式下處理高清視頻能力的工具。它分別測試CPU與GPU解碼視頻時的幀率表現。
CPU視頻解碼測試:R770實現了141幀/秒(FPS),高于對比系統的120FPS,說明戴爾在基于CPU的視頻處理任務上效率更高。
GPU視頻解碼測試:戴爾憑借NVIDIA GPU,取得了157FPS。對比系統未搭載GPU。
#10Blackmagic磁盤讀寫性能測試
Blackmagic Disk Speed Test專注于磁盤讀寫速度測試,常用于評估存儲系統是否滿足視頻編輯對4K/8K內容流暢播放和剪輯的要求。
在該測試中,R770配備的BOSS卡(含兩塊SK hynix 480GB NVMe,構成鏡像RAID)達到了:
讀取速度:3010.3 MB/s
寫入速度:976.3 MB/s
該成績表明,R770在高分辨率視頻工作流中具備出色的存儲響應能力。
結 論
戴爾PowerEdge R770令人振奮,不僅因為其搭載了最前沿的硬件配置,更重要的是它全面采用了OCP數據中心模塊化硬件系統(DC-MHS)標準。
這一標準的引入帶來了諸多優勢,包括:
● 更強的模塊化設計
● 更便捷的運維能力
● 以及通過標準化帶來的潛在成本降低
這種設計理念在系統的各個方面均有體現,從將iDRAC實現為OCP DC-SCM模塊,到每一個接口的布局設計,無不體現出對開放性和高可維護性的高度重視。
R770在存儲方面同樣表現出色,單個2U機箱最多可支持40塊E3.S硬盤,為高存儲需求工作負載提供了理想選擇。此外,其靈活的配置選項也為多樣化的數據中心布局提供支持,例如支持前置I/O的冷通道可維護架構,進一步提升運維效率與部署適應性。
憑借對多款GPU的廣泛支持以及搭載英特爾Xeon 6性能核心(Performance-core)處理器,R770可謂是一款集算力、靈活性與擴展性于一體的強大平臺,非常適合用于應對現代數據中心中的多種場景需求,包括人工智能、HPC高性能計算,以及傳統企業級工作負載。其領先的硬件架構、模塊化設計理念與穩健的安全特性,使得PowerEdge R770成為企業部署新一代數據中心平臺時極具吸引力的選擇。
-
處理器
+關注
關注
68文章
19808瀏覽量
233575 -
戴爾
+關注
關注
5文章
658瀏覽量
40617 -
服務器
+關注
關注
13文章
9693瀏覽量
87292
原文標題:服務器新品PowerEdge R770,測試結果火熱出爐!
文章出處:【微信號:戴爾企業級解決方案,微信公眾號:戴爾企業級解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
服務器如何測試穩定性能好壞?4步終極測試指南
戴爾PowerEdge XR7620邊緣服務器的性能實測

華為云彈性云服務器 FlexusX 實例下的 Nginx 性能測試

云服務器 Flexus X 實例,鏡像切換與服務器壓力測試

評論