DPU自2019年開始由英偉達(dá)正式提出,如今已被大家逐漸接受,并且把它變成行業(yè)術(shù)語(yǔ)繼續(xù)去使用。誕生3年之久,DPU行業(yè)的應(yīng)用度逐漸上升,在DPU的行業(yè)應(yīng)用方面,最先部署DPU的是一些云服務(wù)商,如BAT、京東、頭條、微軟等等公司,他們大量的數(shù)據(jù)需要DPU來幫助其提前處理和做安全問題。而且英偉達(dá)預(yù)計(jì),明年開始將會(huì)有更多類型的企業(yè)加大對(duì)DPU的采用。
在DPU領(lǐng)域,英偉達(dá)正在攜手行業(yè)合作伙伴不斷構(gòu)建完好的開發(fā)者生態(tài)。而一大利器就是其DOCA軟件,沒有軟件的芯片就是沒有靈魂的沙子,這幾年英偉達(dá)的DOCA軟件為其NVIDIA BlueField DPU注入了靈魂,也幫助英偉達(dá)DPU解鎖了更多的應(yīng)用空間。
數(shù)據(jù)中心面臨的四大挑戰(zhàn)
據(jù)NVIDIA 網(wǎng)絡(luò)技術(shù)專家崔巖的介紹,當(dāng)下數(shù)據(jù)中心主要面臨四大挑戰(zhàn):
一是如AI工作負(fù)載等現(xiàn)代應(yīng)用程序?qū)⒊掷m(xù)產(chǎn)生和處理大量數(shù)據(jù),這對(duì)數(shù)據(jù)中心的性能和數(shù)據(jù)的處理能力提出了巨大的挑戰(zhàn)。
二是現(xiàn)在很多應(yīng)用對(duì)分布式基礎(chǔ)設(shè)施的需求不斷增加,它們的部署并不是運(yùn)行在數(shù)據(jù)中心中的某一臺(tái)服務(wù)器,會(huì)運(yùn)行在多臺(tái)服務(wù)器上,甚至分布在不同的物理位置的微服務(wù)給客戶提供應(yīng)用。不僅僅部署在數(shù)據(jù)中心,在網(wǎng)絡(luò)邊緣和多云架構(gòu)里也是非常普遍的現(xiàn)象。這對(duì)數(shù)據(jù)中心基礎(chǔ)設(shè)施運(yùn)營(yíng)也會(huì)有比較大的挑戰(zhàn)。
三是基礎(chǔ)設(shè)施服務(wù)消耗了大量的CPU容量,使得CPU服務(wù)于客戶應(yīng)用的資源減少。
四是東西向流量不斷增加,安全攻擊面成為威脅。所謂東西向流量,主要是很多應(yīng)用程序會(huì)由分布在數(shù)據(jù)中心甚至不同物理位置上的微服務(wù)程序提供,他們之間就會(huì)產(chǎn)生相應(yīng)的數(shù)據(jù)流的數(shù)據(jù)交互。由于相互之間的流量增多,就會(huì)導(dǎo)致存在跨服務(wù)器或者數(shù)據(jù)中心內(nèi)部的橫向攻擊和一些威脅,甚至有的客戶會(huì)把一個(gè)網(wǎng)絡(luò)上的應(yīng)用程序下載到數(shù)據(jù)中心里應(yīng)用,這些都會(huì)有潛在的安全風(fēng)險(xiǎn)帶入到數(shù)據(jù)中心中,如果安全策略或者安全方式模型不能有效的抵御這種攻擊, 會(huì)造成比較大的威脅和相應(yīng)的損失。
為了解決數(shù)據(jù)中心的這些挑戰(zhàn),英偉達(dá)與VMware近年來一直保持緊密合作,以期借助VMware的軟件架構(gòu)一起重新構(gòu)想虛擬的基礎(chǔ)設(shè)施。基于NVIDIA BlueField DPU可以實(shí)現(xiàn)如下三大方面的功能:1)簡(jiǎn)化基礎(chǔ)設(shè)施和工作負(fù)載管理2)提高基礎(chǔ)設(shè)施運(yùn)行效率,主要體現(xiàn)在性能和功能增強(qiáng)上3)借助零信任安全模式加強(qiáng)基礎(chǔ)設(shè)施安全性。
Project Monterey重構(gòu)一個(gè)現(xiàn)代的數(shù)據(jù)中心
在今年的VMware Explore大會(huì)上,NVIDIA、VMware和戴爾聯(lián)合發(fā)布Project Monterey的平臺(tái)。Project Monterey將vSphere 8企業(yè)工作負(fù)載平臺(tái)、NVIDIA BlueField DPU進(jìn)行結(jié)合,在戴爾Power Edge服務(wù)器或VxRail超融合架構(gòu)一體機(jī)上做運(yùn)行,這樣就可以有效的把NVIDIA BlueField DPU、GPU和NVIDIA Enterprise AI軟件,針對(duì)vSphere 8做負(fù)載優(yōu)化,在運(yùn)行一些AI軟件時(shí),也可以把vSphere 8的一些功能,卸載、加速和隔離到NVIDIA BlueField DPU,Project Monterey為未來的AI和現(xiàn)代應(yīng)用程序工作負(fù)載重新構(gòu)建一個(gè)現(xiàn)代的數(shù)據(jù)中心。它既有用于GPU的vSphere 8上的新功能來去支持更強(qiáng)大的AI和機(jī)器學(xué)習(xí)的模型,更快的訓(xùn)練速度,同時(shí)也能夠簡(jiǎn)化云和邊緣環(huán)境上的管理。
下圖是完整的Project Monterey的架構(gòu)。最底下是VMware Hypervisor整個(gè)虛擬化管理軟件系統(tǒng),相當(dāng)于把vSphere中NSX的網(wǎng)絡(luò)和安全相關(guān)的服務(wù),還有vSAN存儲(chǔ)服務(wù)、主機(jī)管理服務(wù)這些原來需要CPU干預(yù)介入的基礎(chǔ)設(shè)施的操作,卸載到NVIDIA BlueField DPU之上。由于DPU的介入會(huì)在主機(jī)CPU和DPU之間形成一個(gè)隔離層,來去保障主機(jī)內(nèi)部的安全性。如果有主機(jī)上層被應(yīng)用程序進(jìn)行黑客攻擊,它不會(huì)通過隔離層、通過DPU攻擊到其他的服務(wù)器。所以,它會(huì)對(duì)多租戶、多虛機(jī)環(huán)境有很有效的幫助。后續(xù)在Linux系統(tǒng)或者Windows系統(tǒng)的裸金屬服務(wù)器上進(jìn)行進(jìn)一步的開發(fā)。
Project Monterey架構(gòu)
目前該項(xiàng)目還在進(jìn)行之中,現(xiàn)在只是把vSphere 里面Cloud Foundation的功能卸載到了NVIDIA BlueField DPU上,同時(shí)支持VMware NSX下一代防火墻技術(shù),未來可能還會(huì)有一些安全策略的功能會(huì)在日后的版本中支持。后面還會(huì)支持vSAN數(shù)據(jù)存儲(chǔ)功能,這些都正在緊密研發(fā)之中。
那么,NVIDIA BlueField DPU在vSphere體系中運(yùn)行的情況。在傳統(tǒng)的服務(wù)器中,對(duì)基礎(chǔ)設(shè)施管理、存儲(chǔ)、安全、網(wǎng)絡(luò)都是CPU承擔(dān)工作負(fù)載的。當(dāng)采用了DPU之后,CPU可以零介入基礎(chǔ)設(shè)施的部分,上述講的四大功能就卸載到了DPU。這里主要和vSphere配合的是有軟件定義的安全、軟件定義的網(wǎng)絡(luò)和整體性能加速的部分,將給上層應(yīng)用提供更好的基礎(chǔ)設(shè)施的支撐。因此,CPU資源會(huì)更好的支撐客戶業(yè)務(wù)應(yīng)用,有更多支持虛機(jī)和容器的能力。
除了很好的支持vSphere8之外,NVIDIA BlueField DPU在NSX網(wǎng)絡(luò)和安全的組件上也有很好的支撐,現(xiàn)在已經(jīng)實(shí)現(xiàn)了將NSX下一代防火墻功能卸載到了DPU之上,后續(xù)的入侵檢測(cè)、入侵防御等安全策略功能也會(huì)逐漸在DPU上實(shí)現(xiàn),這將和VMware整個(gè)多云架構(gòu)、企業(yè)應(yīng)用有更加緊密的解決方案,能夠讓企業(yè)用戶直接采用,享受DPU帶來的性能上的回報(bào)。
DPU:用的越多,省的越多
那么,DPU采用和不采用在收益和效果上有何差異呢?對(duì)此,英偉達(dá)通過兩個(gè)案例對(duì)NVIDIA BlueField DPU進(jìn)行了網(wǎng)絡(luò)基準(zhǔn)測(cè)試:
案例一:下圖是在VMware體系上運(yùn)行NGINX Web服務(wù)器的應(yīng)用,如果傳統(tǒng)用標(biāo)準(zhǔn)智能網(wǎng)卡和CPU介入的方式下,需要有8個(gè)CPU內(nèi)核管理跟運(yùn)營(yíng)基礎(chǔ)設(shè)施的相關(guān)操作。當(dāng)采用了DPU之后,這8個(gè)內(nèi)核完全被釋放了,不需要CPU的任何介入,DPU就會(huì)把這些基礎(chǔ)設(shè)施管理相關(guān)的加速能力直接體現(xiàn)出來。
案例二:在NVIDIA BlueField和VMware體系之上跑Redis內(nèi)存鍵值存儲(chǔ),是非SQL數(shù)據(jù)庫(kù)的基準(zhǔn)測(cè)試,如果采用CPU和標(biāo)準(zhǔn)智能網(wǎng)卡上跑應(yīng)用需要12個(gè)CPU內(nèi)核介入,當(dāng)采用DPU之后這12個(gè)內(nèi)核完全被釋放,直接由DPU承擔(dān)這些工作負(fù)載。從吞吐量的角度來看,原來是8.8,當(dāng)采用DPU后性能得到加速,會(huì)變成12,整體有12個(gè)內(nèi)核的減少,相當(dāng)于減少CPU 20%的內(nèi)核釋放;而且在不使用任何CPU資源的情況下性能將提升36%。對(duì)客戶而言,既節(jié)省了CPU上的資源消耗,可以拿更多CPU資源支撐業(yè)務(wù)應(yīng)用,同時(shí)在整個(gè)網(wǎng)絡(luò)性能上也得到了提升。
所以總體來看,能得出的結(jié)論是,在NVIDIA BlueField DPU上運(yùn)行vSphere,用的越多,省的越多。在整個(gè)服務(wù)器效率方面會(huì)整體提升22%,在3年Roi角度測(cè)算帶來5倍的投資回報(bào)率。780臺(tái)安裝有NVIDIA BlueField DPU的服務(wù)器,相當(dāng)于1000臺(tái)安裝有標(biāo)準(zhǔn)智能網(wǎng)卡的服務(wù)器。每臺(tái)服務(wù)器的TCO(總體投入)可節(jié)省8,200美元,3年內(nèi)通過提升效率可節(jié)省180萬美元。所以,這對(duì)于企業(yè)用戶來講,雖然可能在DPU采用上做一定投入,但實(shí)際上,在CPU資源占用和性能提升上將帶來長(zhǎng)期穩(wěn)定的回報(bào)。
通過 NVIDIA LaunchPad試用在NVIDIA BlueField DPU上運(yùn)行vSphere現(xiàn)已開放。在NVIDIA托管環(huán)境中已可用:介紹和現(xiàn)場(chǎng)演示Introduction & Live Demo;通過 LaunchPad 體驗(yàn) Monterey。點(diǎn)擊文末“閱讀原文”申請(qǐng)LaunchPad 試用。
2022 秋季NVIDIA DPU中國(guó)黑客松競(jìng)賽即將開幕
在人工智能和機(jī)器學(xué)習(xí)的熱潮技術(shù)驅(qū)動(dòng)下,有很多從業(yè)者對(duì)人工智能就緒的數(shù)據(jù)中心基礎(chǔ)設(shè)施產(chǎn)生了濃厚的興趣,尤其是學(xué)生。NVIDIA DPU黑客松活動(dòng)從開辦以來受到學(xué)生和創(chuàng)業(yè)者等的歡迎。DPU黑客松活動(dòng)會(huì)介紹NVIDIA BlueField DPU、NVIDIA DOCA軟件框架的最新進(jìn)展和基礎(chǔ)開發(fā)的知識(shí),介紹跟競(jìng)賽有關(guān)的用例和應(yīng)用場(chǎng)景,這些都會(huì)讓學(xué)生和行業(yè)的開發(fā)者能夠盡快的熟悉這些硬件和軟件的部分,同時(shí)掌握相應(yīng)的開發(fā)技能,通過參加競(jìng)賽,他們可以進(jìn)行實(shí)操體驗(yàn)。
2022 秋季NVIDIA DPU中國(guó)黑客松競(jìng)賽將于10月19日開帷幕。此次黑客松和上次不同的是,題目聚焦在“使用NVIDIA BlueField DPU和NVIDIA DOCA實(shí)現(xiàn)RDMA加速的存儲(chǔ)與AI 解決方案”。這是基于InfiniBand上實(shí)現(xiàn)的RDMA技術(shù),能夠很容易的通過NVIDIA BlueField DPU去訪問CPU和GPU的內(nèi)存,而不需要CPU和操作系統(tǒng)的干預(yù),這會(huì)大大提高整個(gè)數(shù)據(jù)移動(dòng)的效率,能夠更好的支撐未來的科學(xué)計(jì)算、人工智能、機(jī)器學(xué)習(xí)需要大規(guī)模數(shù)據(jù)搬運(yùn)和計(jì)算的工作負(fù)載。
在10月19日有賽前訓(xùn)練營(yíng)。上午有精彩的關(guān)于NVIDIA BlueField DPU和NVIDIA DOCA軟件開發(fā)套件的介紹和用例的展示。下午將有一些更深入的開發(fā)環(huán)境和開發(fā)方式的介紹,展示幾個(gè)應(yīng)用案例,能夠讓開發(fā)者更容易理解DOCA的開發(fā)如何進(jìn)行,用什么樣的步驟,用例及運(yùn)行方式是什么樣的。最后會(huì)有一個(gè)跟開發(fā)者的技術(shù)答疑。
和上一屆的安排一樣,仍然會(huì)有一個(gè)開幕式和訓(xùn)練營(yíng)的活動(dòng),之后會(huì)進(jìn)入到24小時(shí)的比賽環(huán)節(jié),比賽中各個(gè)團(tuán)隊(duì)將投入到創(chuàng)新應(yīng)用的開發(fā)之中,到第二天10月23日上午,是每個(gè)團(tuán)隊(duì)現(xiàn)場(chǎng)比賽的演示,他們將對(duì)自己做的課題做一個(gè)整體展示,后面會(huì)有中國(guó)的本地評(píng)委和國(guó)際評(píng)委對(duì)他們的比賽結(jié)果進(jìn)行評(píng)分,將在24日周一公布比賽結(jié)果。
英偉達(dá)會(huì)請(qǐng)到本地5位評(píng)委,從基礎(chǔ)架構(gòu)、軟件開發(fā)、行業(yè)應(yīng)用角度來看待這些開發(fā)團(tuán)隊(duì)所做的項(xiàng)目和呈現(xiàn)的結(jié)果。整個(gè)結(jié)果最后會(huì)提交給國(guó)際評(píng)委,他們從創(chuàng)新角度和其他應(yīng)用的角度做一個(gè)評(píng)分,大概是五個(gè)方面,訓(xùn)練營(yíng)參與度(15分)、項(xiàng)目完成度(15分)、項(xiàng)目創(chuàng)新價(jià)值(20分)及題目匹配度(30分),最后是現(xiàn)場(chǎng)演示的效果(20分)。
NVIDIA網(wǎng)絡(luò)市場(chǎng)總監(jiān)孟慶表示,雖然今年對(duì)所有半導(dǎo)體行業(yè)客戶和廠商來說都是不容易的一年,但是去年英偉達(dá)DOCA社區(qū)發(fā)展仍然超出預(yù)期。現(xiàn)在全球DOCA開發(fā)者中超過一半來自中國(guó),這是我們有底氣去辦黑客松的原因。
結(jié)語(yǔ)
綜上可以看出,無論是Project Monterey還是黑客松競(jìng)賽,都是英偉達(dá)在DPU領(lǐng)域傾注的心血,也代表著英偉達(dá)對(duì)DPU的看重。英偉達(dá)預(yù)期DPU將在數(shù)據(jù)中心中扮演非常重要的角色,而且越來越重要。
審核編輯 :李倩
-
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
5135瀏覽量
73190 -
DPU
+關(guān)注
關(guān)注
0文章
390瀏覽量
24688 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3920瀏覽量
93104
原文標(biāo)題:英偉達(dá):DPU用的越多,總成本省的越多
文章出處:【微信號(hào):芯長(zhǎng)征科技,微信公眾號(hào):芯長(zhǎng)征科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
數(shù)據(jù)中心能源監(jiān)測(cè)物聯(lián)網(wǎng)解決方案

適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)
優(yōu)化800G數(shù)據(jù)中心:高速線纜、有源光纜和光纖跳線解決方案
Cadence顛覆AI數(shù)據(jù)中心設(shè)計(jì)
7×24小時(shí)穩(wěn)定守護(hù):AMC100保障數(shù)據(jù)中心電力零中斷

偉創(chuàng)力如何應(yīng)對(duì)超大規(guī)模數(shù)據(jù)中心建設(shè)挑戰(zhàn)
人工智能對(duì)數(shù)據(jù)中心的挑戰(zhàn)

強(qiáng)強(qiáng)聯(lián)合 EK液冷技術(shù)助力高算力數(shù)據(jù)中心綠色發(fā)展

數(shù)據(jù)中心虛擬化應(yīng)用案例
當(dāng)今數(shù)據(jù)中心新技術(shù)趨勢(shì)

怎樣保障數(shù)據(jù)中心不間斷電源不斷電 提供可靠安全的供配電#數(shù)據(jù)中心
半導(dǎo)體存儲(chǔ)器在數(shù)據(jù)中心中的應(yīng)用

在數(shù)據(jù)中心使用智能負(fù)載組是個(gè)好主意#負(fù)載 #負(fù)載組

數(shù)據(jù)中心的AI時(shí)代轉(zhuǎn)型:挑戰(zhàn)與機(jī)遇

評(píng)論