DPU(數(shù)據(jù)處理器)將服務(wù)器和存儲(chǔ)之間的 IOPS 性能提升至 4100 萬以上,超過之前世界紀(jì)錄的四倍。
數(shù)據(jù)中心需要超高速存儲(chǔ)訪問,而目前還沒有哪個(gè) DPU 的速度能比 NVIDIA BlueField-2 更快。
NVIDIA 近期測試顯示,兩個(gè) BlueField-2 DPU(數(shù)據(jù)處理器)的每秒輸入/輸出(IOPS)性能達(dá)到 4150 萬次,超過任何其他 DPU 性能的 4 倍。
BlueField-2 DPU 使用標(biāo)準(zhǔn)網(wǎng)絡(luò)協(xié)議和開源軟件打破性能紀(jì)錄,使用業(yè)界常用的存儲(chǔ)介質(zhì)訪問方法 NVMe over Fabrics(NVMe-oF)以及最通用的互聯(lián)網(wǎng)協(xié)議之一 TCP 網(wǎng)絡(luò),其 4KB IOPS 性能超過 500 多萬,而 512B IOPS 則達(dá)到 700 萬至 2000 萬以上。
為了加速 AI、大數(shù)據(jù)和高性能計(jì)算應(yīng)用,BlueField 還支持流行的 RoCE 網(wǎng)絡(luò)傳輸選項(xiàng)以提供更高的存儲(chǔ)性能。
在測試中,initiator 端和 target 端都部署了 BlueField,使用不同類型的存儲(chǔ)軟件庫和不同的應(yīng)用來模擬真實(shí)世界的存儲(chǔ)配置,都展現(xiàn)出超強(qiáng)的性能。BlueField 在 InfiniBand 網(wǎng)絡(luò)上還支持快速存儲(chǔ)連接,而 InfiniBand 是許多 HPC 和 AI 應(yīng)用的首選網(wǎng)絡(luò)架構(gòu)。
測試方法
BlueField 所達(dá)到的 4150 萬 IOPS,是之前使用專有存儲(chǔ)產(chǎn)品創(chuàng)造的 1000 萬 IOPS 世界紀(jì)錄的 4 倍多。這一性能是通過連接兩臺快速 Hewlett Packard Enterprise Proliant DL380 Gen 10 Plus 服務(wù)器實(shí)現(xiàn)的,其中的一臺作為應(yīng)用服務(wù)器(存儲(chǔ) initiator),另一臺作為存儲(chǔ)系統(tǒng)(存儲(chǔ) target)。
每臺服務(wù)器均配備兩個(gè)英特爾 “Ice Lake” 至強(qiáng)白金 2.3GHz 8380 處理器,支持 160 個(gè)超線程核以及 512GB 的 DRAM、120MB 的 L3 緩存(每個(gè)處理器60MB)和 PCIe Gen4 總線。
為了加速網(wǎng)絡(luò)和 NVMe-oF,每臺服務(wù)器均配備了兩塊 NVIDIA BlueField-2 P系列 DPU 卡,每塊卡帶有兩個(gè) 100Gb 以太網(wǎng)端口,在 initiator 和 target 之間有四個(gè)網(wǎng)絡(luò)端口合計(jì) 400Gb/s 線速帶寬,并通過 NVIDIA LinkX 100GbE Direct-Attach Copper(DAC)無源電纜背對背連接。兩臺服務(wù)器均安裝 Red Hat Enterprise Linux(RHEL)8.3 版本。
對于存儲(chǔ)系統(tǒng)軟件,測試 SPDK 和標(biāo)準(zhǔn) upstream Linux 內(nèi)核 target,使用默認(rèn)內(nèi)核 4.18 和最新內(nèi)核之一 5.15。對三種不同的存儲(chǔ) initiator 進(jìn)行了基準(zhǔn)測試,分別為 SPDK、標(biāo)準(zhǔn)內(nèi)核存儲(chǔ) initiator 和 SPDK FIO 插件。使用 FIO 和 SPDK 生成負(fù)載并進(jìn)行測量,使用 4KB 和 512B 這兩種常見的中型和小型存儲(chǔ) I/O 大小來測試。
在網(wǎng)絡(luò)傳輸層使用了 TCP 和 RoCE 兩種協(xié)議來測試 NVMe-oF 存儲(chǔ),每種配置都在全雙向網(wǎng)絡(luò)的條件下以 100% 讀取、100% 寫入和 50/50 讀取/寫入負(fù)載模型進(jìn)行測試。
測試顯示 BlueField DPU 還具有以下性能特點(diǎn):
用較小的 512B I/O 大小測試,結(jié)果顯示 IOPS 更高,但吞吐量低于端口線速,而用 4KB I/O大小測試,結(jié)果顯示吞吐量很高,而 IOPS 有所降低。
100% 讀取和100% 寫入兩種負(fù)載的 IOPS 和吞吐量性能類似,而 50/50 讀/寫混合負(fù)載由于充分使用網(wǎng)絡(luò)連接的兩個(gè)方向產(chǎn)生了更高的性能。
使用 SPDK 測試,得出的性能高于內(nèi)核軟件性能,但同時(shí)帶來了更高的服務(wù)器 CPU 利用率,這是因?yàn)?SPDK 在用戶空間中運(yùn)行并不斷進(jìn)行輪詢,因此這一情況在預(yù)期之內(nèi)。
由于 Linux 社區(qū)會(huì)定期加入存儲(chǔ)改進(jìn),因此較新的 Linux 5.15 內(nèi)核比 4.18 內(nèi)核表現(xiàn)更好。
創(chuàng)紀(jì)錄的 DPU 存儲(chǔ)性能
為存儲(chǔ)安全提供了性能保障
在如今的存儲(chǔ)領(lǐng)域,絕大多數(shù)云和企業(yè)部署都需要快速、分布式、通過以太網(wǎng)或 InfiniBand 訪問的網(wǎng)絡(luò)閃存。更快的服務(wù)器、GPU、網(wǎng)絡(luò)和存儲(chǔ)介質(zhì)都要求服務(wù)器的 CPU 能夠跟上,而最好的方法就是部署具有存儲(chǔ)功能的 DPU。
BlueField-2 DPU 所展現(xiàn)的驚人存儲(chǔ)性能,使整個(gè)數(shù)據(jù)中心的應(yīng)用服務(wù)器和存儲(chǔ)設(shè)備都具有更高的性能和效率。
在快速存儲(chǔ)訪問的基礎(chǔ)上,BlueField 還支持對以太網(wǎng)存儲(chǔ)流量和存儲(chǔ)介質(zhì)本身的硬件加速加密和解密,這有助于防止數(shù)據(jù)被盜或外泄。
它能以高達(dá) 100Gb/s 的速度卸載 IPsec(線上數(shù)據(jù)),以及高達(dá) 200Gb/s 的速度卸載 256 位 AES-XTS(靜態(tài)數(shù)據(jù)),能夠在對手入侵存儲(chǔ)網(wǎng)絡(luò)或者物理存儲(chǔ)驅(qū)動(dòng)器被盜、被出售或被不當(dāng)處置的情況下,減少數(shù)據(jù)被盜的風(fēng)險(xiǎn)。
客戶和領(lǐng)先的安全軟件廠商正在使用最近更新的 BlueField 的 NVIDIA DOCA 框架,以在 DPU 上運(yùn)行分布式防火墻,或提供微分段的安全組等網(wǎng)絡(luò)安全應(yīng)用,來進(jìn)一步提高計(jì)算服務(wù)器的應(yīng)用和網(wǎng)絡(luò)安全,降低服務(wù)器存儲(chǔ)的不當(dāng)訪問或數(shù)據(jù)修改風(fēng)險(xiǎn)。
原文標(biāo)題:NVIDIA BlueField 再創(chuàng) DPU 性能世界紀(jì)錄
文章出處:【微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5238瀏覽量
105749 -
存儲(chǔ)
+關(guān)注
關(guān)注
13文章
4499瀏覽量
87054 -
DPU
+關(guān)注
關(guān)注
0文章
390瀏覽量
24686
原文標(biāo)題:NVIDIA BlueField 再創(chuàng) DPU 性能世界紀(jì)錄
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
第三屆NVIDIA DPU黑客松開啟報(bào)名
STM32L431RCT6主芯片 搭配 SD NAND-動(dòng)態(tài)心電圖設(shè)備存儲(chǔ)解決方案
英偉達(dá)GTC2025亮點(diǎn):NVIDIA認(rèn)證計(jì)劃擴(kuò)展至企業(yè)存儲(chǔ)領(lǐng)域,加速AI工廠部署
NVIDIA 與行業(yè)領(lǐng)先的存儲(chǔ)企業(yè)共同推出面向 AI 時(shí)代的新型企業(yè)基礎(chǔ)設(shè)施

賽昉科技RISC-V家庭云解決方案:NAS存儲(chǔ)性能升級,隱私安全雙保障

NVIDIA Spectrum-X網(wǎng)絡(luò)平臺助力提升AI存儲(chǔ)性能
如何用mac電腦搭建云存儲(chǔ),怎么用Mac電腦搭建云存儲(chǔ)呢?

EMMC存儲(chǔ)如何影響設(shè)備性能
辦公電腦云存儲(chǔ),辦公電腦云存儲(chǔ)安全嗎?

影響存儲(chǔ)系統(tǒng)性能的因素
如何優(yōu)化emc存儲(chǔ)性能
emc存儲(chǔ)解決方案的優(yōu)勢
曙光存儲(chǔ)實(shí)現(xiàn)世界級性能突破
IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書
基于DPU的Ceph存儲(chǔ)解決方案

評論