為使云服務(wù)更高效、靈活地為各行業(yè)的業(yè)務(wù)創(chuàng)新與智能化轉(zhuǎn)型提供支持,特別是促進(jìn)企業(yè)上云、邊緣計(jì)算上云,眾多云服務(wù)提供商正致力于通過云數(shù)據(jù)中心架構(gòu)革新和軟件調(diào)優(yōu)來消除基礎(chǔ)設(shè)施的能力瓶頸,使其更高效和智能,從而為用戶帶來更強(qiáng)的服務(wù)性能、更高的穩(wěn)定性與安全性和更優(yōu)的管控效率。
針對(duì)這一需求,英特爾推出了全新的基礎(chǔ)設(shè)施處理設(shè)備—英特爾 基礎(chǔ)設(shè)施處理單元(Infrastructure Processing Unit,IPU)。通過可編程陣列邏輯 (Field Programmable Gate Array,FPGA) 芯片加英特爾 至強(qiáng) D 處理器組成的硬件加速引擎或單獨(dú)由專用集成電路 (Application Specifific Integrated Circuit,ASIC) 芯片,英特爾 IPU 能在軟件加持下,以可編程的方式將網(wǎng)絡(luò)、存儲(chǔ)和安全等工作負(fù)載從主機(jī)側(cè)處理器上卸載并進(jìn)行加速,進(jìn)而在充分釋放云數(shù)據(jù)中心算力,保持基礎(chǔ)設(shè)施高性能、高利用率的同時(shí),實(shí)現(xiàn)更靈活地資源調(diào)配,并使云服務(wù)提供商能更快地轉(zhuǎn)向完全虛擬化存儲(chǔ)和網(wǎng)絡(luò)架構(gòu)。另外,英特爾 IPU 作為新基礎(chǔ)設(shè)施能力加速引擎,通過與英特爾 至強(qiáng) 可擴(kuò)展處理器協(xié)同,能充分滿足用戶在更多場(chǎng)景下的云服務(wù)需求。
作為合作伙伴,百度智能云與英特爾在云數(shù)據(jù)中心未來建設(shè)方向上有著相同理念與愿景,通過在技術(shù)層面的深度探討和交流,借力英特爾 IPU 平臺(tái)參考設(shè)計(jì),自研百度太行 DPU 1.0 產(chǎn)品,積極應(yīng)對(duì)其在云服務(wù)實(shí)踐中遇到的一系列挑戰(zhàn)。新產(chǎn)品通過在裸金屬服務(wù)器和云主機(jī)等場(chǎng)景中的部署應(yīng)用,被證明可成為其未來智能云服務(wù)的可靠技術(shù)基座。
背景及挑戰(zhàn)
企業(yè)創(chuàng)新應(yīng)用對(duì)云數(shù)據(jù)中心既有能力
提出更高需求
得益于技術(shù)與市場(chǎng)的高速發(fā)展,今天的云服務(wù)正為千行百業(yè)的生產(chǎn)經(jīng)營、業(yè)務(wù)拓展和技術(shù)研發(fā)帶來高效、彈性且充沛的算力支持,并助力更多用戶基于云環(huán)境來靈活地部署和運(yùn)行其企業(yè)級(jí)應(yīng)用。隨著 5G、人工智能 (Artificial Intelligence,AI)、邊緣計(jì)算等前沿技術(shù)在更多行業(yè)獲得落地應(yīng)用,企業(yè)級(jí)云服務(wù)的發(fā)展也出現(xiàn)了許多新的變化與趨勢(shì),包括:
● 更呈分布式的云服務(wù)部署:邊緣計(jì)算等技術(shù)的發(fā)展推動(dòng)著云服務(wù)由傳統(tǒng)的中心云逐漸向“云邊端”協(xié)同演進(jìn),更多云服務(wù)被部署在貼近應(yīng)用的邊緣端;
● 更為廣泛的云服務(wù)應(yīng)用場(chǎng)景:云服務(wù)正成為更多行業(yè)的 IT 基礎(chǔ)設(shè)施之一,在智能制造、智慧金融等新業(yè)態(tài)中擔(dān)綱主力,成為各類企業(yè)級(jí)應(yīng)用的堅(jiān)實(shí)技術(shù)基座;
● 更復(fù)雜的工作負(fù)載需求:不同場(chǎng)景的工作負(fù)載對(duì)資源的需求不盡相同,有些負(fù)載需要更多算力,有些負(fù)載需要更大內(nèi)存或者加速單元。如何滿足不同工作負(fù)載的需求成為企業(yè)上云的考量之一。
實(shí)例多樣化以及資源池化
驅(qū)動(dòng)向未來數(shù)據(jù)中心轉(zhuǎn)型
上述部署方案與應(yīng)用場(chǎng)景的變化,也讓云數(shù)據(jù)中心服務(wù)器在管理與應(yīng)用上面臨更多挑戰(zhàn)。例如更多虛擬機(jī) (Virtual Machine, VM) 的部署使虛擬機(jī)管理等管理任務(wù)變得更加復(fù)雜。同時(shí),其能力輸出也逐漸從傳統(tǒng)單體式應(yīng)用向微服務(wù)化發(fā)展,這也進(jìn)一步提高了云數(shù)據(jù)中心管理任務(wù)的復(fù)雜程度,進(jìn)而占用大量處理器資源。
既要對(duì)虛擬機(jī)、微服務(wù),甚至裸金屬服務(wù)器等實(shí)例開展高效管理,又要對(duì)相關(guān)的云數(shù)據(jù)中心的網(wǎng)絡(luò)、存儲(chǔ)等基礎(chǔ)設(shè)施實(shí)現(xiàn)加速,其中的復(fù)雜性和資源開銷不斷增加,傳統(tǒng)基礎(chǔ)架構(gòu)何以滿足未來數(shù)據(jù)中心要求就成為現(xiàn)實(shí)問題。換句話說,未來數(shù)據(jù)中心需要什么技術(shù)來實(shí)現(xiàn)轉(zhuǎn)型?
隨著微服務(wù)模型越來越多地用于云數(shù)據(jù)中心的應(yīng)用,可以預(yù)測(cè)的是,未來數(shù)據(jù)中心可能具有以下的技術(shù)特性:
● 云原生應(yīng)用的出現(xiàn)和快速增長(zhǎng)推高了對(duì)專用基礎(chǔ)設(shè)施的需求,并大幅提高云服務(wù)的敏捷性以及云數(shù)據(jù)中心的效率;
● 云服務(wù)的微服務(wù)化,推動(dòng)了分布式異構(gòu)計(jì)算環(huán)境的發(fā)展,而每個(gè)微服務(wù)都應(yīng)在更適合的加速節(jié)點(diǎn)上運(yùn)行;
● 微服務(wù)模型的廣泛采用也催生出數(shù)據(jù)中心編排系統(tǒng),使各異構(gòu)計(jì)算服務(wù)器之間實(shí)現(xiàn)微服務(wù)分發(fā)的自動(dòng)化及管理;
● 使用微服務(wù)、虛擬機(jī)、容器以及容器編排的場(chǎng)景不斷增加,推動(dòng)了服務(wù)網(wǎng)格的開發(fā)。服務(wù)網(wǎng)格能夠簡(jiǎn)化微服務(wù)到微服務(wù)的通信,并使其更加高效。現(xiàn)在,服務(wù)網(wǎng)格已經(jīng)成為云原生堆棧的標(biāo)準(zhǔn)組成部分;
同時(shí),由于不同工作負(fù)載或者用戶不同時(shí)段對(duì)于資源需求的不同,通過資源池化可以更優(yōu)的配置資源以達(dá)到彈性擴(kuò)容的要求。
因此,未來數(shù)據(jù)中心的架構(gòu)將更多地面向于服務(wù)不同的實(shí)例且日益資源池化的方向發(fā)展,以此來更好利用異構(gòu)計(jì)算帶來的加速處理能力。這一異構(gòu)計(jì)算的核心將由傳統(tǒng)的處理器平臺(tái),以及由英特爾推出的 IPU 等基礎(chǔ)設(shè)施處理設(shè)備來組成。在基于這種架構(gòu)的數(shù)據(jù)中心內(nèi),服務(wù)器與執(zhí)行網(wǎng)絡(luò)、存儲(chǔ)等加速的 IPU 設(shè)備互聯(lián)互通,不僅傳統(tǒng)的服務(wù)器節(jié)點(diǎn)處理能力可在專用計(jì)算節(jié)點(diǎn)的支持下得到增強(qiáng),同時(shí)存儲(chǔ)、網(wǎng)絡(luò)服務(wù),以及云服務(wù)管理包括裸金屬服務(wù)器和微服務(wù)也能獲得加速。
英特爾 IPU 助力數(shù)據(jù)中心應(yīng)對(duì)變革挑戰(zhàn)
隨著多種實(shí)例服務(wù)以及資源池化等越來越普遍地用于云數(shù)據(jù)中心的應(yīng)用、存儲(chǔ)和網(wǎng)絡(luò),傳統(tǒng)數(shù)據(jù)中心也在通過不斷轉(zhuǎn)型來應(yīng)對(duì)更高的需求和挑戰(zhàn),并由此向未來數(shù)據(jù)中心演進(jìn)。在傳統(tǒng)數(shù)據(jù)中心的架構(gòu)中,通常借助傳統(tǒng)的網(wǎng)卡 (Network InterfaceCard,NIC) 產(chǎn)品來負(fù)責(zé)執(zhí)行物理層與數(shù)據(jù)鏈路層的數(shù)據(jù)流量處理,而更高層的功能則需要處理器等計(jì)算資源的參與。例如,在數(shù)據(jù)存儲(chǔ)過程中,每一次 I/O 都需借助處理器多次上下文切換與內(nèi)存拷貝,以“中斷”模式在用戶態(tài)與內(nèi)核態(tài)進(jìn)行數(shù)據(jù)交換。
而在提供云服務(wù)過程中,這一情況則更為突出。不僅 OpenvSwitch (OVS) 等虛擬交換技術(shù)、RDMA over Converged Ethernet (RoCE) 等傳輸存儲(chǔ)協(xié)議以及相應(yīng)的數(shù)據(jù)安全技術(shù)被引入系統(tǒng)架構(gòu),同時(shí)也衍生出裸金屬、容器云等多樣化的云產(chǎn)品形態(tài)。這些新產(chǎn)品與技術(shù)的引入,令云數(shù)據(jù)中心的各類數(shù)據(jù)處理過程變得更為復(fù)雜。
這一趨勢(shì),伴隨著數(shù)據(jù)規(guī)模的不斷增大?(端口帶寬正逐步從?25G向100G乃至更高演進(jìn)),正對(duì)云數(shù)據(jù)中心帶來巨大挑戰(zhàn),包括:
● 數(shù)據(jù)處理的增長(zhǎng)速度始終高于算力增長(zhǎng)速度,因此對(duì)處理器資源的占用率也越來越大。數(shù)據(jù)表明,目前數(shù)據(jù)中心中 30%的計(jì)算是在作流量處理,甚至被形象地稱為“數(shù)據(jù)中心稅 (Datacenter Tax)”1;
● 為保障核心業(yè)務(wù)的高效執(zhí)行,數(shù)據(jù)中心不得不購置更多處理器資源,帶來云服務(wù)總擁有成本 (Total Cost of Ownership,TCO) 的增加,進(jìn)而抬升最終用戶部署和使用云服務(wù)的成本;
● 更大的數(shù)據(jù)規(guī)模和處理復(fù)雜度,也對(duì)數(shù)據(jù)中心的各項(xiàng)基礎(chǔ)設(shè)施性能,包括網(wǎng)絡(luò) I/O、轉(zhuǎn)發(fā)、存儲(chǔ)、安全以及管理等造成影響,阻礙云數(shù)據(jù)中心增加網(wǎng)絡(luò)吞吐量、降低網(wǎng)絡(luò)延遲等性能優(yōu)化。
在這一背景下,不斷革新的云數(shù)據(jù)中心亟待尋求一種全新的智能架構(gòu)來化解上述挑戰(zhàn)。對(duì)傳統(tǒng)網(wǎng)卡產(chǎn)品進(jìn)行“擴(kuò)容賦能”,是業(yè)界解決數(shù)據(jù)處理負(fù)載過重的最初方案。這一被稱為智能網(wǎng)卡 (SmartNIC) 的產(chǎn)品,通過在網(wǎng)卡中加入用于處理和轉(zhuǎn)發(fā)不同端口上各種類型的數(shù)據(jù)等功能,從而實(shí)現(xiàn)更多的算力釋放、更佳的網(wǎng)絡(luò)性能表現(xiàn),并降低處理延遲。但是這種智能網(wǎng)卡由于缺乏計(jì)算單元,往往只能做到數(shù)據(jù)平面的卸載,控制平面以及Hypervisor 等基礎(chǔ)設(shè)施管理負(fù)載仍然需要主機(jī)處理單元來完成,做不到基礎(chǔ)設(shè)施處理的全卸載。
英特爾通過對(duì)數(shù)據(jù)中心基礎(chǔ)設(shè)施能力進(jìn)一步分析與整合,推出了英特爾 IPU (Intel Infrastructure Processing Unit),將數(shù)據(jù)平面,控制平面以及 Hypervisor 等基礎(chǔ)設(shè)施管理負(fù)載和云服務(wù)基礎(chǔ)設(shè)施能力都從主機(jī)服務(wù)器中卸載,一方面讓寶貴的算力資源更多地用于用戶關(guān)鍵業(yè)務(wù),另一方面也通過將各種能力卸載到專用設(shè)備獲得加速,有效提升各種數(shù)據(jù)處理負(fù)載的執(zhí)行效率,來全面幫助云數(shù)據(jù)中心構(gòu)建新的基礎(chǔ)設(shè)施能力加速引擎。
解決方案:以英特爾 IPU,構(gòu)建云數(shù)據(jù)中心加速強(qiáng)引擎
IPU 是全新的產(chǎn)品形態(tài)。它在涵蓋智能網(wǎng)卡功能的同時(shí),更能為未來云數(shù)據(jù)中心帶來更高級(jí)別的安全性和控制力。其優(yōu)勢(shì)包括:
● 卸載高密集的基礎(chǔ)設(shè)施應(yīng)用任務(wù)到 IPU 并進(jìn)行加速,如加密和解密以及數(shù)據(jù)包處理;
● 在極端情況下,IPU 可以卸載整個(gè)虛擬機(jī)管理程序,釋放處理器所有內(nèi)核為應(yīng)用和微服務(wù)提供支持,這對(duì)于裸金屬服務(wù)產(chǎn)品來說至關(guān)重要;
● 減少了主機(jī)側(cè)處理器中虛擬機(jī)管理程序和基礎(chǔ)設(shè)施堆棧的開銷,并可以從主機(jī)側(cè)處理器中卸載存儲(chǔ)堆棧,使更多的處理器資源可用于應(yīng)用和租戶工作負(fù)載;
● 使租戶應(yīng)用和基礎(chǔ)設(shè)施管理解耦,實(shí)現(xiàn)更高安全性和可控性;
● 為裸金屬和云主機(jī)統(tǒng)一云管控創(chuàng)造了可能。
如圖 1 所示,英特爾 IPU 產(chǎn)品在配置了 FPGA 芯片或者 ASIC 中的專有硬件加速器之外,也加入通用處理器來對(duì)各類基礎(chǔ)設(shè)施控制面功能實(shí)現(xiàn)卸載。這種將專用可編程硬件與通用處理器相結(jié)合的方式,不僅能使云數(shù)據(jù)中心中各基礎(chǔ)設(shè)施能力獲得預(yù)期加速,滿足不斷增長(zhǎng)的網(wǎng)絡(luò)數(shù)據(jù)處理需求,也能實(shí)現(xiàn)對(duì)控制面功能的靈活管理與操控,實(shí)現(xiàn)更優(yōu)的系統(tǒng)級(jí)安全、控制和管理能力。
以目前英特爾面向市場(chǎng)的 IPU 主力產(chǎn)品英特爾 FPGA IPU C5000X-PL (代號(hào)“Big Spring Canyon”) 為例,如圖 2 所示,其具備 2 個(gè) 25G 端口 (使用 SFP28 光口),可提供 50G 的網(wǎng)絡(luò)吞吐能力;核心處理能力則由所搭載的英特爾 Stratix 10 DX FPGA 芯片與英特爾 至強(qiáng) D 處理器擔(dān)綱。
其中,英特爾 Stratix 10 DX FPGA 可編程邏輯芯片能充分發(fā)揮其硬件可編程特性,通過先進(jìn)的架構(gòu)設(shè)計(jì)、封裝技術(shù)、相比前一代 FPGA 擁有更多的收發(fā)器并支持硬核 PCIe Gen4 接口,從而實(shí)現(xiàn)更高的帶寬,以定制化設(shè)計(jì)來實(shí)現(xiàn)高吞吐和低延時(shí)的性能表現(xiàn), 完成 I/O 虛擬化、OVS 轉(zhuǎn)發(fā)等任務(wù),實(shí)現(xiàn)基礎(chǔ)設(shè)施管理、網(wǎng)絡(luò)和存儲(chǔ)功能的卸載。
英特爾 至強(qiáng) D 處理器則通過高度集成的設(shè)計(jì),不僅能以卓越的單核性能來承載控制面的各項(xiàng)功能,支持 Hypervisor,還能以良好的 x86 兼容性以及與其它英特爾 架構(gòu)硬件形成的良好生態(tài),幫助用戶實(shí)現(xiàn)系統(tǒng)代碼或應(yīng)用能力的快速遷移,從而提升卸載效率。
卸載基礎(chǔ)設(shè)施能力與釋放算力
借助上述兩種芯片,如圖 3 所示,云數(shù)據(jù)中心能夠有效地將網(wǎng)絡(luò)、存儲(chǔ)、安全以及基礎(chǔ)設(shè)施管理等多種能力從處理器卸載到 IPU,從而實(shí)現(xiàn)算力釋放,并加速多種基礎(chǔ)設(shè)施能力。這些能力包括:
● 網(wǎng)絡(luò)加速:將承載網(wǎng)絡(luò) I/O、數(shù)據(jù)轉(zhuǎn)發(fā)等功能的虛擬交換機(jī)軟件,如 OVS 等從主機(jī)側(cè)處理器卸載到 IPU,提升網(wǎng)絡(luò)吞吐量,減少網(wǎng)絡(luò)處理時(shí)延;
● 存儲(chǔ)加速:將 virtio-blk、NVMe-oF 等存儲(chǔ)接口、協(xié)議棧從主機(jī)側(cè)處理器轉(zhuǎn)移到 IPU,提高存儲(chǔ)彈性和靈活性,并降低系統(tǒng)復(fù)雜性和開銷;
● 安全加速:可以從主機(jī)側(cè)處理器卸載加密/解密、壓縮和其他應(yīng)用功能;
● 基礎(chǔ)設(shè)施處理:將云服務(wù)管理功能從主機(jī)側(cè)處理器卸到 IPU,使虛擬機(jī)、容器或裸金屬服務(wù)的分配和管理更為高效。
除了引入性能更強(qiáng)且具備靈活可編程特性的硬件來面向特定功能進(jìn)行優(yōu)化加速,釋放更多寶貴算力之外,英特爾也賦予了 IPU 產(chǎn)品豐富的軟件生態(tài)。目前,英特爾正以加速開發(fā)平臺(tái) (Acceleration Development Platform,ADP) 為抓手,優(yōu)化生態(tài)系統(tǒng),助力合作伙伴實(shí)現(xiàn)云數(shù)據(jù)中心性能加速解決方案的快速開發(fā)和部署。在規(guī)劃中,ADP 平臺(tái)將為用戶提供通過英特爾 開放式 FPGA 堆棧 (英特爾 OFS) 實(shí)現(xiàn)的板卡硬件設(shè)計(jì)、軟件、驅(qū)動(dòng)程序以及技術(shù)設(shè)計(jì)支持。用戶可以利用這些軟件工具與技術(shù)支持,加速 IPU 相關(guān)產(chǎn)品的開發(fā),并迅速將產(chǎn)品推向市場(chǎng)。
對(duì)接英特爾 至強(qiáng) 可擴(kuò)展處理器,
提升云數(shù)據(jù)中心算力
在英特爾為用戶提供的高效能云數(shù)據(jù)中心生態(tài)方案中,不僅可以通過英特爾 IPU 開展能力卸載,對(duì)基礎(chǔ)設(shè)施進(jìn)行性能加速,也可以引入英特爾 至強(qiáng) 可擴(kuò)展處理器來進(jìn)一步加強(qiáng)算力。通過對(duì)算力的“開源節(jié)流”,實(shí)現(xiàn)更快的數(shù)據(jù)處理速度、更大的帶寬接入能力以及更低的網(wǎng)絡(luò)時(shí)延。
第三代英特爾 至強(qiáng) 可擴(kuò)展處理器可為服務(wù)器帶來的性能增強(qiáng)包括:
● 更多的內(nèi)核、更優(yōu)的架構(gòu)帶來算力性能的大幅提升,可有效應(yīng)對(duì)高密度計(jì)算所需;
● 支持更多內(nèi)存,支持 PCIe Gen4,可實(shí)現(xiàn)更高的每核 I/O 帶寬;
● 多項(xiàng)內(nèi)置增強(qiáng)技術(shù),如英特爾 深度學(xué)習(xí)加速技術(shù) (英特爾 DL Boost) 等可在人工智能等場(chǎng)景提供強(qiáng)大加速能力。
在算力架構(gòu)中引入英特爾 至強(qiáng) 可擴(kuò)展處理器的另一個(gè)優(yōu)勢(shì)是能夠有效提升能力卸載的效率和平滑性。由于主機(jī)側(cè)和 IPU 都采用基于英特爾 架構(gòu)的處理器 (英特爾 至強(qiáng) 可擴(kuò)展處理器和英特爾 至強(qiáng) D 處理器),這樣將原先主機(jī)側(cè)運(yùn)行的應(yīng)用遷移到 IPU 上就變的非常方便,甚至無需編譯即可遷移。例如 DPDK、SPDK 等軟件就可以從主機(jī)側(cè)直接遷移到 IPU 上運(yùn)行,從而大幅提升開發(fā)、部署和測(cè)試的效率。
這一算力架構(gòu)正幫助云數(shù)據(jù)中心形成更高效的能力輸出。以裸金屬服務(wù)器為例,作為兼具物理機(jī)的高性能和高安全性,裸金屬正越來越多地被部署在關(guān)鍵業(yè)務(wù)場(chǎng)景中。但傳統(tǒng)上,由于裸金屬的云管理能力由處理器承載,而裸金屬又具有用戶獨(dú)占處理器資源的特性,因此裸金屬無法像虛擬云主機(jī)那樣便捷彈性地向用戶提供算力。
借助英特爾 IPU 提供的云管理能力卸載,裸金屬可以實(shí)現(xiàn)基礎(chǔ)設(shè)施管理面與租戶間的物理隔離,利用 VirtIO 設(shè)備熱插拔特性支持彈性服務(wù)。而第三代英特爾 至強(qiáng) 可擴(kuò)展處理器的加入,則進(jìn)一步提升了裸金屬中可供調(diào)度分配的算力,可以幫助云數(shù)據(jù)中心有能力為用戶關(guān)鍵業(yè)務(wù)提供更具性能、更安全的服務(wù),并提升算力資源的利用效率,從而提供兼具性能和性價(jià)比優(yōu)勢(shì)的云服務(wù)能力。
助力百度智能云打造更高效可靠的云服務(wù)能力
作為領(lǐng)先的云服務(wù)提供商,百度智能云在云數(shù)據(jù)中心建設(shè)方向上與英特爾有著同樣的理念,即應(yīng)該將基礎(chǔ)設(shè)施能力的相關(guān)開銷全部從主機(jī)側(cè)處理器卸載到專門的基礎(chǔ)設(shè)施處理單元上并實(shí)施性能加速,以便釋放算力,優(yōu)化整體性能,從而打造高效,安全和可編程的未來數(shù)據(jù)中心。
來自百度智能云的實(shí)踐表明,持續(xù)向各個(gè)領(lǐng)域延伸,并承載越來越多核心業(yè)務(wù)能力的云服務(wù),正面臨著需要更強(qiáng)算力資源、更大帶寬接入和更低網(wǎng)絡(luò)時(shí)延的挑戰(zhàn)。以百度智能云獨(dú)具優(yōu)勢(shì)的 AI 云服務(wù)為例,目前 AI 算力需求比之前已提升數(shù)個(gè)數(shù)量級(jí),元宇宙的算力需求還要再提升 1000 倍2。因此要貫徹上述理念,需要更為強(qiáng)勁的技術(shù)底座予以支持。
為此,百度智能云致力于發(fā)展軟硬件結(jié)合的云計(jì)算基礎(chǔ)設(shè)施,通過自研的百度太行 DPU 系列產(chǎn)品,并融合其在云服務(wù)領(lǐng)域的豐富經(jīng)驗(yàn)以及大量真實(shí)需求,來應(yīng)對(duì)云服務(wù)實(shí)踐中遇到的算力、網(wǎng)絡(luò)、存儲(chǔ)、安全等一系列挑戰(zhàn)。
”
“云計(jì)算正與其它技術(shù)浪潮一起,推動(dòng)各行業(yè)的數(shù)字化、智能化轉(zhuǎn)型。在這一進(jìn)程中,我們第一次自研推出 DPU 設(shè)備 — 百度太行 DPU1.0。它能夠支持太行彈性裸金屬服務(wù),實(shí)現(xiàn)網(wǎng)絡(luò)卸載、PCIe 設(shè)備熱插拔等功能,讓云計(jì)算的虛擬化開銷很大程度沉淀在網(wǎng)卡上,使云產(chǎn)品的性能大大提升。”
——侯震宇,百度集團(tuán)副總裁
如圖 5 和 表 1 所示,百度太行 DPU 1.0 產(chǎn)品配備了 2 個(gè)25G帶寬的光口,并引入英特爾 FPGA 與英特爾 至強(qiáng) D 處理器作為算力核心,來實(shí)現(xiàn)各項(xiàng)虛擬化功能的卸載,在為用戶提供彈性網(wǎng)卡、彈性存儲(chǔ)能力之余,還支持 1024 個(gè)設(shè)備的熱插拔。同時(shí),通過將云管控平面卸載到百度太行 DPU 1.0中,也可以實(shí)現(xiàn)虛擬云主機(jī)和裸金屬共池,即裸金屬可與虛擬云主機(jī)被統(tǒng)一靈活調(diào)度。來自百度智能云的測(cè)試驗(yàn)證表明,百度太行 DPU 1.0 產(chǎn)品能夠?yàn)橛脩籼峁?1000 萬 PPS 的轉(zhuǎn)發(fā)率
以及 20萬 IOPS 的存儲(chǔ)性能3。
現(xiàn)在,百度太行 DPU 1.0 產(chǎn)品已在太行彈性裸金屬等多種云服務(wù)場(chǎng)景中開展應(yīng)用并獲得了用戶好評(píng)。實(shí)踐證明,百度自研的百度太行 DPU 1.0 可以有效解決云數(shù)據(jù)中心管理及虛擬化的局限性,幫助百度智能云保持優(yōu)勢(shì)。在百度智能云的計(jì)劃中,這一 DPU 產(chǎn)品也將作為其智能云服務(wù)的核心組件,助力其構(gòu)建基礎(chǔ)設(shè)施即服務(wù) (Infrastructure as a Service,IaaS) 資源的統(tǒng)一彈性底座,進(jìn)而為用戶依托百度智能云開展各類業(yè)務(wù)創(chuàng)新、實(shí)施產(chǎn)業(yè)智能化轉(zhuǎn)型提供高效且可靠的性能保障。
總結(jié)與展望
隨著英特爾 IPU 以及基于其參考設(shè)計(jì)研發(fā)的相關(guān)產(chǎn)品在云數(shù)據(jù)中心的基礎(chǔ)架構(gòu)革新中展現(xiàn)出顯著性能優(yōu)勢(shì)和市場(chǎng)價(jià)值,并逐步形成可持續(xù)發(fā)展的生態(tài)鏈,英特爾與百度智能云等深度合作伙伴也正圍繞云服務(wù)的未來發(fā)展方向,從軟硬件層面開拓更多優(yōu)化方案。例如通過新的英特爾 IPU 平臺(tái)提供更大網(wǎng)絡(luò)吞吐量,實(shí)現(xiàn)對(duì)基礎(chǔ)設(shè)施管理的全面解耦,以及以極低時(shí)延實(shí)現(xiàn)端到端的加速等。
面向未來,英特爾還計(jì)劃在 IPU 產(chǎn)品體系上持續(xù)發(fā)力。如圖 6 所示5,英特爾在 2022 年將推出兩款第二代 200G 的可編程IPU, 代號(hào)分別為“Oak Springs Canyon”和“Mount Evans”。其中,Oak Springs Canyon 搭載了英特爾 至強(qiáng) D 處理器與英特爾 Agilex FPGA 芯片;而 Mount Evans 則是英特爾首款基于 ASIC 芯片的 IPU 產(chǎn)品。這兩款產(chǎn)品都將具有卸載200G 工作負(fù)載所需的基礎(chǔ)設(shè)施加速能力,且都可與英特爾 至強(qiáng) 可擴(kuò)展處理器協(xié)同工作。未來兩到三年內(nèi),英特爾將推出支持 400G 的 IPU 產(chǎn)品,在 2025 年或晚些時(shí)候,推出新一代基于 FPGA 芯片和 ASIC 芯片 的 800G IPU 產(chǎn)品。
與此同時(shí),英特爾也正進(jìn)一步背靠豐富的開源軟件,如基礎(chǔ)架構(gòu)編程人員開發(fā)套件 (International Package and Development Kit ,IPDK)、SPDK、DPDK 等,致力于通過開放的生態(tài)系統(tǒng)、多方位的行業(yè)協(xié)作以及積極的社區(qū)互動(dòng),讓百度智能云等云服務(wù)提供商、云服務(wù)最終用戶以及其它合作伙伴能加速IPU 相關(guān)解決方案的構(gòu)建,從云數(shù)據(jù)中心基礎(chǔ)架構(gòu)的持續(xù)革新中擷取更大價(jià)值。
-
處理器
+關(guān)注
關(guān)注
68文章
19808瀏覽量
233574 -
英特爾
+關(guān)注
關(guān)注
61文章
10168瀏覽量
173935 -
帶寬
+關(guān)注
關(guān)注
3文章
992瀏覽量
41793 -
軟件
+關(guān)注
關(guān)注
69文章
5119瀏覽量
88945 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
5143瀏覽量
73207
原文標(biāo)題:白皮書丨英特爾? IPU為構(gòu)建云數(shù)據(jù)中心提供強(qiáng)引擎
文章出處:【微信號(hào):英特爾FPGA,微信公眾號(hào):英特爾FPGA】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
英特爾2025年Q1營收127億美元,數(shù)據(jù)中心與AI業(yè)務(wù)可圈可點(diǎn)
英特爾至強(qiáng)6處理器助力數(shù)據(jù)中心整合升級(jí)
英特爾至強(qiáng)6:如何煉就數(shù)據(jù)中心“全能型選手”

英特爾Michelle Johnston Holthaus:深耕x86,持續(xù)為AI數(shù)據(jù)中心注入芯動(dòng)力

英特爾數(shù)據(jù)中心CPU銷量降至14年最低
英特爾為企業(yè)智能化發(fā)展注入新動(dòng)力
第17屆英特爾互聯(lián)網(wǎng)數(shù)據(jù)中心大會(huì)順利舉行
AMD數(shù)據(jù)中心營收首超英特爾
AMD數(shù)據(jù)中心業(yè)務(wù)首超英特爾,Nvidia異軍突起
英特爾至強(qiáng)6能效核處理器助力數(shù)據(jù)中心變革
英特爾發(fā)布至強(qiáng)6性能核處理器,攜手生態(tài)加速數(shù)據(jù)中心算力升級(jí)

英特爾將進(jìn)一步分離芯片制造和設(shè)計(jì)業(yè)務(wù)
英特爾醞釀出售Mobileye股權(quán)以應(yīng)對(duì)挑戰(zhàn)
英特爾數(shù)據(jù)中心XPU產(chǎn)品最新進(jìn)展:預(yù)計(jì)2027年發(fā)布
從運(yùn)動(dòng)員到開發(fā)者: 英特爾以開放式AI系統(tǒng)應(yīng)對(duì)多重挑戰(zhàn)

評(píng)論