通過采用英特爾 DPDK,并將 DPDK Vhost 的數(shù)據(jù)包拷貝操作從 CPU 卸載到英特爾 DSA,我們有效提升了云平臺(tái)的網(wǎng)絡(luò)性能,釋放更多的 CPU 核心用于上層業(yè)務(wù)。結(jié)合 ZStack Cloud 在平臺(tái)層面的底層創(chuàng)新,能夠助力用戶更高效處理海量數(shù)據(jù),應(yīng)對(duì)不斷增長的業(yè)務(wù)壓力,更好地 釋放數(shù)據(jù)價(jià)值。
— 王為
ZStack 首席技術(shù)官
"挑戰(zhàn) ●如何提升云平臺(tái)的網(wǎng)絡(luò)服務(wù)能力,支撐大規(guī)模的數(shù)據(jù)傳輸與數(shù)據(jù)處理● 如何通過軟件加速負(fù)載運(yùn)行,降低 CPU 等硬件的占用率● 如何提升性能密度,降低總體擁有成本 (TCO)
概 述
作為云服務(wù)的重要基礎(chǔ)資源,網(wǎng)絡(luò)性能對(duì)于大規(guī)模數(shù)據(jù)的傳輸與處理有著重要意義。為了提升網(wǎng)絡(luò)性能,云軸科技 ZStack 采用第四代英特爾 至強(qiáng) 可擴(kuò)展處理器集成的英特爾 Data Streaming Accelerator(英特爾 DSA)加速器,以及英特爾 數(shù)據(jù)平面開發(fā)套件(英特爾 DPDK)進(jìn)行加速,將網(wǎng)絡(luò)性能提升了高達(dá) 1.117 倍1 。
解決方案
ZStack Cloud 云平臺(tái)是遵循“簡單、彈性、健壯、智能”的“4S”特性的私有云和無縫混合云產(chǎn)品。ZStack Cloud 產(chǎn)品已適配第四代英特爾 至強(qiáng) 可擴(kuò)展處理器,可快速完成云平臺(tái)整體部署。ZStack Cloud 基于高可用和分布式架構(gòu),面向中小型企業(yè)以及云計(jì)算服務(wù)提供商等多種用戶,能夠有效地幫助用戶構(gòu)建和維護(hù)穩(wěn)定的多云環(huán)境,提高故障處理效率,降低運(yùn)維成本。
圖 1. ZStack Cloud 云平臺(tái)架構(gòu)圖
為提升網(wǎng)絡(luò)性能,ZStack Cloud 采用了第四代英特爾 至強(qiáng) 可擴(kuò)展處理器進(jìn)行加速。第四代英特爾 至強(qiáng) 可擴(kuò)展處理器提供了出色性能和安全性,可根據(jù)用戶的業(yè)務(wù)需求進(jìn)行擴(kuò)展。英特爾 數(shù)據(jù)流加速器(英特爾 DSA)是第四代英特爾 至強(qiáng) 可擴(kuò)展處理器中的高性能數(shù)據(jù)移動(dòng)和轉(zhuǎn)換加速器,為數(shù)據(jù)移動(dòng)提供了高帶寬和低延時(shí),可用于卸載 DPDK Vhost 中的數(shù)據(jù)包拷貝操作。
圖 2. 由英特爾 DSA 賦能的物理機(jī)-虛擬機(jī)-物理機(jī)數(shù)據(jù)傳輸路徑
在實(shí)際應(yīng)用中,ZStack Cloud 在 DPDK Vhost 中將數(shù)據(jù)包拷貝操作從 CPU 卸載到英特爾 DSA,使得 Vhost 的處理內(nèi)核可以避免進(jìn)行繁重的數(shù)據(jù)包拷貝。
圖 3. ZStack Cloud 將數(shù)據(jù)包拷貝操作卸載到英特爾 DSA
通過使用英特爾 DSA 加速器卸載 DPDK 下的數(shù)據(jù)包拷貝,ZStack Cloud 云平臺(tái)在同節(jié)點(diǎn)通信下的網(wǎng)絡(luò)帶寬性能得到了 1.117 倍的性能提升,在跨節(jié)點(diǎn)通信場景下的網(wǎng)絡(luò)帶寬性能得到了 1.092 倍的性能提升2 。
圖 4. OVS-DPDK 在啟用英特爾 DSA 前后的吞吐性能對(duì)比(越高越好)3
測試結(jié)果表明,當(dāng)數(shù)據(jù)包大小超過 256 字節(jié)時(shí),英特爾 DSA 可以為 DPDK Vhost 帶來顯著的性能提升。當(dāng)數(shù)據(jù)包大小超過 1K 字節(jié)時(shí),英特爾 DSA 搬運(yùn)數(shù)據(jù)的效率全面優(yōu)于使用內(nèi)核。在媒體流服務(wù)器和分布式數(shù)據(jù)處理服務(wù)器等應(yīng)用場景中,英特爾 DSA 加速的 OVS-DPDK 均能夠提供高效透明(虛擬機(jī)內(nèi)應(yīng)用無感知)的底層優(yōu)化。
收 益 顯著提升網(wǎng)絡(luò)性能,加速虛擬機(jī)典型實(shí)例之間的數(shù)據(jù)移動(dòng),滿足網(wǎng)絡(luò) 密集型應(yīng)用的需求,例如,其有助于降低流媒體業(yè)務(wù)的網(wǎng)絡(luò)帶寬抖動(dòng),在影視渲染場景中加快渲染節(jié)點(diǎn)和存儲(chǔ)節(jié)點(diǎn)之間傳輸,在 AI 訓(xùn)練場景中實(shí)現(xiàn)云內(nèi)網(wǎng)絡(luò)進(jìn)行高速互聯(lián); 將 ZStack Cloud 底層的數(shù)據(jù)包拷貝工作從 CPU 核心卸載到英特爾 DSA 模塊,釋放更多的 CPU 核心用于上層業(yè)務(wù),有助于降低硬件投入,提升投資收益; 可有效利用英特爾 DSA,無需對(duì)上層業(yè)務(wù)進(jìn)行定制改造,即可提供高帶寬和低延時(shí)的網(wǎng)絡(luò)服務(wù); 通過開放式架構(gòu)可以實(shí)現(xiàn)橫向擴(kuò)展,不受硬件型號(hào)限制,實(shí)現(xiàn)橫向 擴(kuò)容。
展 望
本次驗(yàn)證顯示,英特爾 DSA 可在虛擬機(jī)實(shí)例數(shù)據(jù)移動(dòng)等應(yīng)用中,發(fā)揮出色的數(shù)據(jù)傳輸加速作用。ZStack 與英特爾將在此合作基礎(chǔ)上,進(jìn)一步探索利用第四代英特爾 至強(qiáng) 可擴(kuò)展處理器的不同加速器加速負(fù)載運(yùn)行,助力客戶加快云平臺(tái)變革。
參考資料:1 截止 ZStack 和英特爾 2023 年 7 月的測試結(jié)果。測試配置:雙路英特爾 至強(qiáng) 金牌 6426Y 處理器,384 GB 總內(nèi)存 (12*32 GB 4800 MHz),1*1.92 TB 固態(tài)盤,1*英特爾 以太網(wǎng)控制器 E810-XXV(25G 雙端口),2*英特爾 以太網(wǎng)控制器 X710(10G 雙 端口)。
2,3 截止 ZStack 和英特爾 2023 年 7 月的測試結(jié)果。測試配置:雙路英特爾 至強(qiáng) 金牌 6426Y 處理器,384 GB 總內(nèi)存 (12*32 GB 4800 MHz),1*1.92 TB 固態(tài)盤,1*英特爾 以太網(wǎng)控制器 E810-XXV (25G 雙端口),2*英特爾 以太網(wǎng)控制器 X710(10G 雙端口)。
實(shí)際性能受使用情況、配置和其他因素的差異影響。更多信息請見 www.Intel.com/PerformanceIndex
性能測試結(jié)果基于配置信息中顯示的日期進(jìn)行測試,且可能并未反映所有公開可用的安全更新。詳情請參閱配置信息披露。沒有任何產(chǎn)品或組件是絕對(duì)安全的。
具體成本和結(jié)果可能不同。
英特爾技術(shù)可能需要啟用硬件、軟件或激活服務(wù)。
英特爾未做出任何明示和默示的保證,包括但不限于,關(guān)于適銷性、適合特定目的及不侵權(quán)的默示保證,以及在履約過程、交易過程或貿(mào)易慣例中引起的任何保證。
英特爾并不控制或?qū)徲?jì)第三方數(shù)據(jù)。請您審查該內(nèi)容,咨詢其他來源,并確認(rèn)提及數(shù)據(jù)是否準(zhǔn)確。
-
英特爾
+關(guān)注
關(guān)注
61文章
10194瀏覽量
174659 -
cpu
+關(guān)注
關(guān)注
68文章
11076瀏覽量
217015
原文標(biāo)題:英特爾? DSA 助力云軸科技網(wǎng)絡(luò)性能提升,海量數(shù)據(jù)傳輸游刃有余
文章出處:【微信號(hào):英特爾中國,微信公眾號(hào):英特爾中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評(píng)論請先 登錄

SPI數(shù)據(jù)傳輸緩慢問題求解
適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)
英特爾至強(qiáng)6處理器助力數(shù)據(jù)中心整合升級(jí)
英特爾以太網(wǎng)新品:高性能與能效并重,帶來多樣化選擇
英特爾推出具備高性能和能效的以太網(wǎng)解決方案

評(píng)論