DPU這個(gè)概念最近一年多才出現(xiàn)的,被英偉達(dá)的 Mellanox 帶火,英偉達(dá)和邁威爾這個(gè)業(yè)務(wù)的增速都很高,市場也高看一眼。所幸大廠和中小廠商同一起跑線,國內(nèi)也能參與競爭。老規(guī)矩,按照市場最關(guān)心的問題,分如下部分:
1、DPU是什么?
2、DPU解決什么問題?
3、DPU市場空間有多大?
4、DPU能不能成為獨(dú)立主流芯片?
5、海內(nèi)外玩家有哪些?
6、最后會(huì)不會(huì)一家獨(dú)大,贏家通吃?
1、DPU是什么
Data Processing Unit,即數(shù)據(jù)處理器。DPU最直接的作用是作為CPU的卸載引擎,接管網(wǎng)絡(luò)虛擬化、硬件資源池化等基礎(chǔ)設(shè)施層服務(wù),釋放CPU的算力到上層應(yīng)用。以網(wǎng)絡(luò)協(xié)議處理為例,要線速處理10G的網(wǎng)絡(luò)需要的大約4個(gè)Xeon CPU的核,也就是說,單是做網(wǎng)絡(luò)數(shù)據(jù)包處理,就可以占去一個(gè)8核高端CPU一半的算力。Amazon 把這些開銷都稱之為“Datacenter Tax”,DPU就是把“Datacenter Tax”從CPU 上卸去,轉(zhuǎn)移到一張專門的加速卡上,DPU。
DPU可以成為新的數(shù)據(jù)網(wǎng)關(guān),將安全隱私提升到一個(gè)新的高度,網(wǎng)絡(luò)接口一般是網(wǎng)絡(luò)加密,解密的重要邊界,所以海內(nèi)外都有網(wǎng)絡(luò)安全公司做DPU的例子。DPU也可以成為存儲(chǔ)的入口,將分布式的存儲(chǔ)和遠(yuǎn)程訪問本地化。
DPU誕生之初,就是一顆異構(gòu)芯片。DPU不是一顆固化的ASIC,在CXL、CCIX等標(biāo)準(zhǔn)組織倡導(dǎo)CPU、GPU與DPU等數(shù)據(jù)一致性,DPU編程障礙掃清。國內(nèi)一些互聯(lián)網(wǎng)大廠用FPGA的方式開發(fā)DPU,海外飛塔這家公司用的ASIC方式,將DPU的性能加到網(wǎng)安組件里面。
上一個(gè)硬件圖吧
國內(nèi)中科馭數(shù)的系統(tǒng)架構(gòu):
2、DPU解決什么問題
DPU為什么能火?算力荒!DPU解決的主要是帶寬提速之后,CPU算力被占用,進(jìn)而卡頓的問題。它的角色是在以前網(wǎng)卡的基礎(chǔ)上再升級(jí),不斷寫入功能在里面,自身優(yōu)化線路,協(xié)議等,慢慢成型的一個(gè)玩意。IDC的數(shù)據(jù)顯示,全球數(shù)據(jù)量在過去10年年均復(fù)合增長率接近50%,并進(jìn)一步預(yù)測每四個(gè)月對(duì)于算力的需求就會(huì)翻一倍。與此相對(duì)的是CPU性能每年提升3%,巨大的差距面前,加速芯片獨(dú)立了。參照下圖:
數(shù)據(jù)來源:IDC
DPU 的前身,可以延續(xù)到智能網(wǎng)卡。早期智能網(wǎng)卡就是一張高速網(wǎng)卡+FPGA芯片擴(kuò)展,目的也是加速,但這種組合沒有成為絕對(duì)主流。這類智能網(wǎng)卡只被當(dāng)作FPGA加速卡,有FPGA優(yōu)勢,也繼承了所有FPGA的局限性。當(dāng)下DPU是對(duì)現(xiàn)有的SmartNIC的一個(gè)整合,能看到很多以往SmartNIC的影子,但明顯高于之前任何一個(gè)SmartNIC的定位.以后DPU可能不限于75W的控制中,會(huì)有獨(dú)立的供電系統(tǒng)。
DPU可以應(yīng)用到很多場景,大的就有三個(gè):網(wǎng)絡(luò)功能卸載,儲(chǔ)存功能卸載,安全功能卸載。網(wǎng)絡(luò)功能卸載是伴隨云計(jì)算網(wǎng)絡(luò)而產(chǎn)生的,主要是對(duì)云計(jì)算主機(jī)上的虛擬交換機(jī)的能力做硬件卸載,從而減少主機(jī)上消耗在網(wǎng)絡(luò)上的CPU算力,提高可售賣計(jì)算資源;儲(chǔ)存功能卸載,NVMe over Fabric是一個(gè)相對(duì)較新的協(xié)議規(guī)范,使用NVMe通過網(wǎng)絡(luò)結(jié)構(gòu)將主機(jī)連接到存儲(chǔ),支持對(duì)數(shù)據(jù)中心的計(jì)算和存儲(chǔ)進(jìn)行分解。
NVMe-oF協(xié)議定義了使用各種通用的輸協(xié)議來實(shí)現(xiàn)NVMe功能的方式;安全功能卸載,在傳統(tǒng)的網(wǎng)卡上做云平臺(tái)虛擬化,Hypervisor以及對(duì)應(yīng)的虛擬化網(wǎng)絡(luò)的實(shí)現(xiàn),都是在主機(jī)操作系統(tǒng)上實(shí)現(xiàn)的。
引入DPU智能網(wǎng)卡之后,將虛擬化網(wǎng)絡(luò)的控制平面完全卸載到智能網(wǎng)卡上,與主機(jī)操作系統(tǒng)相隔離。即使黑客攻陷了Hypervisor,獲取了主機(jī)操作系統(tǒng)的root權(quán)限,也無法篡改虛擬化網(wǎng)絡(luò)的配置,這樣可以將黑客的攻擊范圍限制在主機(jī)操作系統(tǒng)上,不會(huì)影響到虛擬化網(wǎng)絡(luò)以及其它主機(jī),做到有效隔離。
3、DPU市場空間有多大
按照海外投行的說法,DPU的潛在市場非常巨大,預(yù)測到2025年僅中國市場就能達(dá)到每年40億美元的規(guī)模,估計(jì)全球?qū)⒊^120億美元,但挑戰(zhàn)與機(jī)遇并存。IaaS在國內(nèi)云服務(wù)市場占比約60%,支撐了目前最重要的PaaS的容器云技術(shù)。未來幾年,我國仍將維持IaaS為主的云計(jì)算結(jié)構(gòu),預(yù)計(jì)市場占比將逐上升到70%。
4、DPU能不能成為獨(dú)立主流芯片
前面說了,DPU是智能網(wǎng)卡演化而來,能不能成為獨(dú)立主流芯片,當(dāng)下技術(shù)還在競爭發(fā)展中。
前面說了,DPU是智能網(wǎng)卡演化而來,能不能成為獨(dú)立主流芯片,當(dāng)下技術(shù)還在競爭發(fā)展中。DPU目前主流形態(tài)是外掛”CPU和FPGA會(huì)封裝到一個(gè)芯片中,形成一個(gè)奇怪的通過PCIe總線互聯(lián)的兩個(gè)CPU系統(tǒng)。這個(gè)架構(gòu)非常簡潔,但同時(shí)IPU引發(fā)了一個(gè)架構(gòu)性的問題,這個(gè)架構(gòu)到底IPU是中心,還是host CPU是中心?”。因?yàn)檫@方面的技術(shù)還在猛烈革新中,所以這三顆大芯片最后的架構(gòu)怎么樣,誰勝出,還要看。但趨勢是直線向上的。
5、海內(nèi)外玩家有哪些
從技術(shù)流派來講,援引賽迪發(fā)布的《2021中國DPU行業(yè)發(fā)展白皮書》內(nèi)容:DPU方案分為三種:一是以通用眾核處理器為基礎(chǔ),以多核ARM為核心,以眾取勝,可編程靈活性較好,但是應(yīng)用針對(duì)性不夠,對(duì)于特殊算法和應(yīng)用的支持與通用CPU相比并無太顯著優(yōu)勢;二是以專用核為基礎(chǔ)的異構(gòu)核陣列,針對(duì)性較強(qiáng)、性能較好,但是犧牲了部分靈活性;第三種路線結(jié)合了前二者優(yōu)勢,即將通用處理器的可編程靈活性與專用的加速引擎相結(jié)合,正在成為最新的產(chǎn)品趨勢。
說的有點(diǎn)抽象,用公司來舉例,以英偉達(dá),英特爾為例, 基于GPU + FPGA技術(shù)經(jīng)驗(yàn),數(shù)據(jù)處理**** ; 賽靈思 被認(rèn)為是智能網(wǎng)卡玩家 ,基礎(chǔ)的技術(shù)線路和方案比較接近。 現(xiàn)在一些FPGA+NP等技術(shù)源于這里,有人把這類歸于白皮書里的第三類,折中方案。
通信玩家,博通, Marvell****就是這個(gè)路子,他們以數(shù)據(jù)交換,網(wǎng)絡(luò)通信起家,他們的解決方案主要**** 基于ARM內(nèi)核方案。 新玩家 Fungible思科 **出身,更傾向于 網(wǎng)絡(luò)技術(shù) , ARM內(nèi)核方案。
目前海內(nèi)外玩家的競爭都集中在服務(wù)器網(wǎng)卡, AI加速計(jì)算,智能計(jì)算和算力的概念聯(lián)系上,被上升到計(jì)算架構(gòu)的高度,被一級(jí)市場 吹噓到突破摩爾定律。誰知道呢?
具體講講各公司情況,附國內(nèi)創(chuàng)業(yè)公司:
英偉達(dá):NVIDIA收購Mellanox后(intel關(guān)注洽談這家很久),在ConnectX系列高速網(wǎng)卡技術(shù)基礎(chǔ)上,推出其BlueField系列DPU,DPU定名!Mellanox和intel在阿里項(xiàng)目上歷時(shí)十幾個(gè)月的PK,累趴對(duì)手,成為國內(nèi)大互聯(lián)網(wǎng)廠首個(gè)DPU簽約主體。Mellanox以前的產(chǎn)品主要應(yīng)用在超算,后來技術(shù)部門研究可以進(jìn)入服務(wù)器市場。英偉達(dá)增速最快的業(yè)務(wù)就是服務(wù)器業(yè)務(wù),由于虛擬機(jī)和容器(containers)等的流行,應(yīng)用程序在多臺(tái)終端運(yùn)行,應(yīng)對(duì)數(shù)據(jù)中心流量爆炸的問題而Mellanox是專家。目前Mellanox的產(chǎn)品在其財(cái)報(bào)里面數(shù)據(jù)中心一項(xiàng),按照最新的電話會(huì)議說法,不是受制于產(chǎn)能,增速應(yīng)該能超過整個(gè)數(shù)據(jù)中心增長。
Xilinx:被AMD收購,早前出了Alveo系列加速卡。
Intel :2015年底收購了Xilinx的競爭對(duì)手——Altera,進(jìn)一步開發(fā)硬件加速能力。2021年6月發(fā)布IPU產(chǎn)品(名字不一樣),將FPGA與Xeon D系列處理器集成,成為了DPU賽道有力的競爭者。
Marvall:2021 年發(fā)布OCTEON 10 DPU產(chǎn)品,不僅具備強(qiáng)大的轉(zhuǎn)發(fā)能力,還具有突出的AI處理能力。
還有一些參與主體:互聯(lián)網(wǎng)廠商,內(nèi)部也有改善服務(wù)器速度的開發(fā)自研計(jì)劃。Google、Amazon,阿里巴巴等。
注:Fungible成立于2015年,目前擁有約200名員工,總籌資超過3億美元。其他投資者包括Battery Ventures,Mayfield Fund,Redline Capital和Walden Riverwood Ventures。其新資本將用于加速產(chǎn)品開發(fā)。
國內(nèi)的玩家都是初創(chuàng)期,擁有一個(gè)大的客戶,或者行業(yè)熟悉客戶,打磨自己的DPU產(chǎn)品,因?yàn)楝F(xiàn)在海內(nèi)外同一起跑線,所以看起各家融資ppt都賊牛逼。
6、最后會(huì)不會(huì)一家獨(dú)大、贏家通吃
目前要解決DPU標(biāo)準(zhǔn)化應(yīng)用,還存在一定挑戰(zhàn)。由于數(shù)據(jù)中心本身的復(fù)雜性,各大廠商一方面采用COTS組件來構(gòu)建系統(tǒng),追求低成本,一方面又設(shè)法分層服務(wù)化(IaaS,PaaS,SaaS),打造面向不用類型客戶的標(biāo)準(zhǔn)化產(chǎn)品。內(nèi)容方AWS有Nitro,阿里云有MOC,反正就是五花八門——有的廠商強(qiáng)化IO能力、有的關(guān)注路由轉(zhuǎn)發(fā)、有的重視存儲(chǔ)卸載、有的關(guān)注安全加密。
至于有沒有贏家通吃,一家獨(dú)大,類似CPU,GPU這樣的格局出現(xiàn),目前暫時(shí)看不到,只能說,數(shù)據(jù)爆發(fā)的階段,大家都有碗飯吃。
首先,DPU是一種專用處理器,與通用CPU的發(fā)展路徑有所不同。專用計(jì)算重點(diǎn)放在數(shù)據(jù)平面,而通用計(jì)算重點(diǎn)放在控制平面。作為專用處理器,DPU的功能是收斂的,不用太多考慮多元化,代際兼容等問題。典型的“先垂直深耕,再水平擴(kuò)展”的路徑,所以在初期,會(huì)有針對(duì)不同領(lǐng)域,不同類型甲方的異構(gòu)產(chǎn)品出現(xiàn)。
需求不同,產(chǎn)品就容易碎片化,例如各大公有云廠商、電信運(yùn)營商等都有比較完整、也比較封閉的底層架構(gòu)和應(yīng)用生態(tài)。上層負(fù)載不同,必然對(duì)底層架構(gòu)有各異的需求,這也許是目前DPU標(biāo)準(zhǔn)化面臨的最大的挑戰(zhàn)
當(dāng)然這里的碎應(yīng)該不是貶義詞,應(yīng)該指“專”,畢竟DPU不是一個(gè)人人都能進(jìn)入的賽道。由其專用性,需要長期行業(yè)“Knowhow”持續(xù)打磨迭代產(chǎn)品,這對(duì)于行業(yè)內(nèi)初創(chuàng)公司才有更大的生存空間,大家同一起跑線。DPU當(dāng)下類似于工業(yè)軟件,需要上下游企業(yè),甲方乙方共同來構(gòu)建良性、開放的生態(tài)環(huán)境。
傳統(tǒng)的“one-size-fit-all”的ASIC商業(yè)模式,通過上量來攤薄芯片研發(fā)的巨額NRE成本本身還是有效的。所以專用DPU最終也要謀求“水平擴(kuò)展”來覆蓋更多的場景,還是要盡可能把各異的需求整合起來,并且適應(yīng)不同廠商。
也許十年后,在競爭合作中博弈出了滿足各種行業(yè)需求的產(chǎn)品,兼顧靈活性與成本。也許十年后的DPU能解決復(fù)雜網(wǎng)絡(luò)、安全、存儲(chǔ)、虛擬化等方面的問題,真真正正成為舉足輕重的“第三顆大芯片”。
-
cpu
+關(guān)注
關(guān)注
68文章
11031瀏覽量
215946 -
DPU
+關(guān)注
關(guān)注
0文章
390瀏覽量
24687 -
數(shù)據(jù)處理器
+關(guān)注
關(guān)注
0文章
26瀏覽量
8767
發(fā)布評(píng)論請先 登錄
示波器的FFT能解決什么問題?
《數(shù)據(jù)處理器:DPU編程入門》讀書筆記
《數(shù)據(jù)處理器:DPU編程入門》DPU計(jì)算入門書籍測評(píng)
FPGA能解決什么問題看了就知道
【米爾FZ3深度學(xué)習(xí)計(jì)算卡試用體驗(yàn)】DPU搭建
專?數(shù)據(jù)處理器 (DPU) 技術(shù)??書
英偉達(dá)DPU的過“芯”之處
【書籍評(píng)測活動(dòng)NO.23】數(shù)據(jù)處理器:DPU編程入門
什么是DPU?
數(shù)據(jù)中臺(tái)是什么,它能幫我們解決什么問題
什么是DPU 未來的DPU智能?卡硬件形態(tài)

評(píng)論