女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何利用CXL協(xié)議實(shí)現(xiàn)高效能的計(jì)算架構(gòu)

SDNLAB ? 來源: SDNLAB ? 2024-09-03 09:14 ? 次閱讀

作者:張景濤

序言

近日我有幸閱讀了英特爾公司互聯(lián)系統(tǒng)領(lǐng)域的權(quán)威人物Debendra Das Sharma撰寫的一篇開創(chuàng)性文章——《Novel Composable and Scaleout Architectures Using Compute Express Link》(文末附鏈接)。在這篇文章中,Debendra Das Sharma詳盡地闡述了如何利用CXL(Compute Express Link)技術(shù)構(gòu)建一個(gè)可橫向擴(kuò)展的可組合分離架構(gòu)。眾所周知,CXL協(xié)議涵蓋了type1、type2、type3三種設(shè)備類型,而目前學(xué)術(shù)界和工業(yè)界的研究主要集中在如何利用CXL技術(shù)擴(kuò)展系統(tǒng)的內(nèi)存容量。

然而至今尚未有文獻(xiàn)系統(tǒng)地探討如何直接通過CXL技術(shù)在機(jī)架級(jí)別構(gòu)建一個(gè)支持異構(gòu)計(jì)算、內(nèi)存和存儲(chǔ)設(shè)備的池化系統(tǒng)。據(jù)我了解,現(xiàn)有的CXL協(xié)議在不進(jìn)行任何修改和優(yōu)化的情況下,似乎難以勝任這一重任。至少在性能和可擴(kuò)展性方面,它與PCIe相比并沒有展現(xiàn)出顯著的優(yōu)勢。(對于如何通過PCIe技術(shù)構(gòu)建可組合基礎(chǔ)設(shè)施感興趣的讀者,可以參考《基于PCIE的可組合基礎(chǔ)設(shè)施的性能洞察》。)

Debendra Das Sharma憑借其卓越的技術(shù)洞察力和對CXL技術(shù)的深刻理解,提出了一系列在現(xiàn)有CXL協(xié)議基礎(chǔ)上的增強(qiáng)措施。這些建議旨在提升協(xié)議的性能和擴(kuò)展性,部分提議已經(jīng)在最新的CXL 3.1規(guī)范中得到了采納。這些改進(jìn)不僅為CXL技術(shù)的發(fā)展提供了新的方向,也為構(gòu)建下一代高性能計(jì)算系統(tǒng)提供了可能。

在接下來的內(nèi)容中,我們將深入探討這些協(xié)議增強(qiáng)措施的具體細(xì)節(jié),以及它們?nèi)绾沃?shí)現(xiàn)大規(guī)模、高效能的計(jì)算架構(gòu)。這不僅涉及到硬件層面的創(chuàng)新,也包括軟件和系統(tǒng)設(shè)計(jì)的新思路。通過這些綜合措施,我們有望打破現(xiàn)有的技術(shù)瓶頸,推動(dòng)計(jì)算技術(shù)邁向一個(gè)新的高度。

背景知識(shí)

CXL是一個(gè)開放的行業(yè)標(biāo)準(zhǔn)互連,它在PCI-Express之上提供了緩存和內(nèi)存語義。除了在主機(jī)處理器和加速器、智能網(wǎng)絡(luò)接口卡以及內(nèi)存擴(kuò)展設(shè)備之間提供高帶寬和低延遲的連接外,它還支持跨多個(gè)系統(tǒng)的資源共享池,實(shí)現(xiàn)可擴(kuò)展、節(jié)能和成本效益高的計(jì)算。接下來會(huì)探討使用CXL互連在機(jī)架級(jí)別及更高級(jí)別上搭建可組合和可擴(kuò)展架構(gòu),以實(shí)現(xiàn)異構(gòu)內(nèi)存和異構(gòu)計(jì)算資源的池化和共享。

PCIe是一個(gè)非一致性互連。PCIe設(shè)備一般使用DMA完成系統(tǒng)內(nèi)存讀寫事務(wù)以非一致性方式訪問系統(tǒng)內(nèi)存。附加到PCIe設(shè)備的任何內(nèi)存都在系統(tǒng)中作為不可緩存的內(nèi)存映射I/O(MMIO)區(qū)域進(jìn)行映射。CXL 1.0/1.1在PCIe基礎(chǔ)設(shè)施之上增加了一致性和內(nèi)存語義,以支持細(xì)粒度的協(xié)同異構(gòu)處理以及滿足新興計(jì)算需求所需的內(nèi)存帶寬和容量擴(kuò)展。英特爾捐贈(zèng)了最初的CXL 1.0規(guī)范,并在2019年領(lǐng)導(dǎo)了CXL聯(lián)盟的啟動(dòng)。CXL 1.0/1.1支持I/O(CXL.io)、一致性(CXL.cache)和內(nèi)存(CXL.memory)協(xié)議之間的動(dòng)態(tài)多路復(fù)用,如圖1(b)所示。CXL基于內(nèi)存加載-存儲(chǔ)語義。它在中央處理單元(CPU(s))(主機(jī)處理器)和跨異構(gòu)內(nèi)存的CXL設(shè)備之間維護(hù)統(tǒng)一的、一致的內(nèi)存空間,如圖1(a)所示。

wKgaombWYxSAfkqdAAiCImXXoCw138.jpg

圖 1. CXL 1.0和CXL 2.0的使用模式和協(xié)議。(a) 綠色文本顯示了CXL 1.0啟用的新系統(tǒng)能力。三種類型的CXL 1.0設(shè)備。(b) CXL在PCIe PHV上的三種協(xié)議的動(dòng)態(tài)多路復(fù)用。(c) CXL 2.0的資源池化。

CXL類型1設(shè)備是加速器,例如使用一致性語義以及PCIe的DMA傳輸?shù)闹悄躈IC。CXL類型2設(shè)備是加速器,例如通用圖形處理單元(GP-GPU)和現(xiàn)場可編程門陣列(FPGA),它們具有可以部分或全部映射到可緩存系統(tǒng)內(nèi)存的本地內(nèi)存。CXL類型3設(shè)備用于使用可能具有自己內(nèi)存層次結(jié)構(gòu)的異構(gòu)內(nèi)存進(jìn)行內(nèi)存帶寬和容量擴(kuò)展。

后面文章會(huì)展示如何開發(fā)商業(yè)上可行的可組合系統(tǒng),在POD級(jí)別具有加載-存儲(chǔ)語義,并繼續(xù)向后兼容CXL的演進(jìn)。

CXL 2.0引入了通過允許多個(gè)域?qū)σ粋€(gè)或多個(gè)池化設(shè)備進(jìn)行加載-存儲(chǔ)訪問的內(nèi)存和加速器的池化概念。這種池化能力可以提供更高的能效同時(shí)降低總擁有成本,因?yàn)楦鱾€(gè)服務(wù)器不必過度配置內(nèi)存,因?yàn)樗鼈兛梢砸蕾噧?nèi)存池來應(yīng)對需求的臨時(shí)激增。CXL 2.0支持扇出和池化、內(nèi)存和加速器池化、熱插拔管理和資源管理器的切換,同時(shí)完全向后兼容CXL 1.0/1.1。因此,CXL 2.0為CXL提供了一種擴(kuò)展到機(jī)架級(jí)別低延遲互連的機(jī)制,具有加載-存儲(chǔ)語義。

CXL協(xié)議概述

68字節(jié)的FLIT是CXL中傳輸?shù)幕締挝弧XL.io基于帶有非一致性加載-存儲(chǔ)和生產(chǎn)者-消費(fèi)者排序語義的PCIe協(xié)議。CXL.cache 支持設(shè)備緩存數(shù)據(jù),采用請求和響應(yīng)協(xié)議。主機(jī)處理器管理修改、獨(dú)占、共享、無效(MESI)一致性協(xié)議,根據(jù)需要部署SNOOP消息。每個(gè)方向上都有三種消息類別:請求(Req)、響應(yīng)(Rsp)和數(shù)據(jù)。在設(shè)備到主機(jī)(D2H,上行)方向上,Req 包括讀取(例如,Rd_Shared,RdOwn)和寫入;相應(yīng)的下行 H2D 響應(yīng)是全局可觀察性(GO)。H2D-Req 是SNOOP,導(dǎo)致 D2H 響應(yīng)SNOOP(例如,RspI,RspSHitSE)。

wKgZombWYxSAKnxGAAZWN3Qaymc061.jpg

圖 2. CXL 實(shí)現(xiàn)和測量的延遲

CXL.memory 支持類型2/3設(shè)備將其內(nèi)存映射到系統(tǒng)的一致性內(nèi)存中,這將被稱為主機(jī)管理的設(shè)備內(nèi)存(HDM)。它以緩存行粒度(64字節(jié))在主機(jī)處理器(M)和類型2/3設(shè)備(S)之間傳輸內(nèi)存加載和存儲(chǔ)事務(wù)。請求從主機(jī)發(fā)送到設(shè)備在一個(gè)下游通道上:M2SReq(例如,讀取請求),以及 M2S RwD(例如,寫入)。響應(yīng)從設(shè)備發(fā)送到主機(jī)在兩個(gè)上行通道上:S2M NDR(無數(shù)據(jù)響應(yīng))和 S2M DRS(帶數(shù)據(jù)的響應(yīng))。

CXL 實(shí)現(xiàn)和結(jié)果

CXL 1.0/1.1 在英特爾的 Sapphire Rapids (SPR) CPU 中實(shí)現(xiàn),支持所有三種協(xié)議,符合 CXL 規(guī)范的要求。它已經(jīng)通過在 32.0 GT/s 下運(yùn)行的 x16 寬度的英特爾 FPGA 實(shí)現(xiàn) CXL 進(jìn)行了廣泛測試。最后一級(jí)緩存(LLC)和窺探過濾器涵蓋了 CXL設(shè)備中的緩存。無論是本地連接到 CPU 的雙倍數(shù)據(jù)速率動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DDR)總線還是映射到系統(tǒng)地址空間的 CXL設(shè)備,內(nèi)存都在 CPU 中的 Home Agent 的管轄范圍內(nèi)。

圖 2 表示我們的 IP 級(jí)微架構(gòu)塊圖。SERDES 引腳到應(yīng)用層的總往返延遲目標(biāo)是 21 或 25 納秒,這取決于公共時(shí)鐘模式是否開啟。這符合 CXL 規(guī)范目標(biāo),即內(nèi)存訪問的引腳到引腳往返延遲為 80 納秒,SNOOP的響應(yīng)為 50 納秒。因此,跨 CXL 鏈路的加載到使用延遲預(yù)計(jì)為 CXL.Mem 的大約 150-175 納秒。

wKgZombWYxSAUjgnAAfMqZVzX1A693.jpg

圖3(a)和(b)展示了我們構(gòu)建大型可組合服務(wù)器集群的架構(gòu)愿景,這些服務(wù)器跨越一個(gè)或多個(gè)機(jī)架,使用CXL作為互連。每個(gè)機(jī)架抽屜可以是計(jì)算抽屜(抽屜可以理解為一個(gè)機(jī)架中有獨(dú)立外殼的托盤),連接多個(gè)節(jié)點(diǎn)(服務(wù)器)與池化內(nèi)存(包括雙列內(nèi)存模塊、雙列內(nèi)存模塊(DIMM)和CXL內(nèi)存驅(qū)動(dòng)器),和池化加速器。每個(gè)節(jié)點(diǎn)可能有自己的專用內(nèi)存、加速器和其他I/O資源。一個(gè)抽屜也可以只由內(nèi)存或加速器組成,這些可以是跨機(jī)架資源池的一部分。共享內(nèi)存控制器(SMC)芯片提供CXL連接。SMC也可以本地托管DDR內(nèi)存,如圖3(c)所示。SMC之間的互連可以通過機(jī)架內(nèi)的銅纜(1-2米)。或者使用光纖用于SMC之間的跨機(jī)架連接。

wKgaombWYxSAPFKVAAjR57Abct4451.jpg

圖 4. 延遲優(yōu)化的FLIT布局,提出的CXLFLIT打包和CXL事務(wù)增強(qiáng)。(a) 128字節(jié)優(yōu)化的FLIT布局。(b) 使用我們提出的可擴(kuò)展性機(jī)制,在SMC-SMC鏈路中使用128字節(jié)LO FLIT的例子。(c) 現(xiàn)有的CXL(1.0,2.0)流程;所有HDM訪問都通過主機(jī)處理器與HA進(jìn)行。(d) 直接訪問HDM內(nèi)存的提出流程;新流程以紅色文本顯示。

CXL協(xié)議和能力增強(qiáng)

文中提出了幾項(xiàng)CXL增強(qiáng)措施,以實(shí)現(xiàn)可組合和可擴(kuò)展架構(gòu)。這使得跨多個(gè)域共享和池化資源(例如,內(nèi)存、加速器);每個(gè)域都是一個(gè)獨(dú)立的服務(wù)器。可以構(gòu)建跨機(jī)架的可組合系統(tǒng),每個(gè)域都可以根據(jù)需要?jiǎng)討B(tài)地從資源池中添加/移除資源。新的架構(gòu)還通過使用共享內(nèi)存、跨域中斷、信號(hào)量和基于CXL的直接加載存儲(chǔ)內(nèi)存訪問語義的消息傳遞,實(shí)現(xiàn)跨域的協(xié)同計(jì)算。

后面需要在不增加延遲懲罰的情況下將可擴(kuò)展架構(gòu)帶寬翻倍。CXL 3.0規(guī)范采用了64-GT/s PAM-4信號(hào)與我們的128字節(jié)sub-FLIT機(jī)制(與CXL 2.0相比沒有增加任何延遲)。圖4(a)顯示了不同slot的布局。通用(G)slot為16字節(jié),可用于頭和數(shù)據(jù),而H/HS slot(14/12字節(jié))僅用于頭。

為了構(gòu)建圖3所示的大規(guī)模可擴(kuò)展系統(tǒng),即使存在多級(jí)SMC也需要有接近單節(jié)點(diǎn)性能的表現(xiàn)。文中方法適用于任何使用無死鎖路由機(jī)制的拓?fù)浣Y(jié)構(gòu),沒有PCIe和CXL 1.0/2.0的樹形拓?fù)湎拗啤MC之間的CXL鏈路需要是CXL 3.0協(xié)議加上這里討論的增強(qiáng)功能,并支持每個(gè)CXL協(xié)議的上下游通道。

我們提議增強(qiáng)CXL 3.0的128字節(jié)延遲優(yōu)化(LO)FLIT,使用12位端口ID號(hào)通過SMC路由。這比256字節(jié)的方法提供了更低的延遲和更高的帶寬效率。端口ID號(hào)只需要唯一標(biāo)識(shí)連接到SMC的主機(jī)CPU或CXL設(shè)備,允許多達(dá)4,096個(gè)主機(jī)CPU或設(shè)備(可以是PCIe/CXL 1.0/CXL 2.0/CXL 3.0)連接到任何SMC端口。為此,我們需要在每個(gè)頭進(jìn)入第一個(gè)SMC時(shí)添加12位目標(biāo)端口ID(也稱為Dest-ID)。對于請求,我們需要添加12位源端口ID(Src-ID),以便響應(yīng)可以路由回源節(jié)點(diǎn)。當(dāng)事務(wù)傳遞到CPU或設(shè)備并在出口SMC端口交付時(shí),這些Dest-ID / Src-ID將被移除,并轉(zhuǎn)換為標(biāo)準(zhǔn)PCIe/CXL 1.0/1.1/2.0/3.0格式,以便現(xiàn)有的CPU/設(shè)備可以與我們提出的架構(gòu)一起工作,該架構(gòu)僅將可組合性和可擴(kuò)展性負(fù)擔(dān)放在SMC上。CXL.Cache/Mem頭有足夠的備用位來適應(yīng)這種擴(kuò)展,并且仍然適合CXL3流量的任何slot。

我們已經(jīng)確定了CXL 3.0規(guī)范中所有性能關(guān)鍵的頭編碼,如圖4(b)所示(例如,一個(gè)G slot中的3個(gè)S2M NDR)。即使在每個(gè)事務(wù)中添加了額外的端口ID位,我們也可以容納它們,包括每個(gè)slot有多個(gè)頭的那些。有兩個(gè)例外:1)有兩個(gè)頭(M2SReq,M2SRwD),由于沒有足夠的備用位,Dest-ID沒有發(fā)送。因此,這兩個(gè)需要在每個(gè)SMC進(jìn)行目的ID查找(而不是在進(jìn)入SMC復(fù)合體時(shí)一次)。我們認(rèn)為,為了保留外部鏈路帶寬而增加的查找邏輯帶寬是一個(gè)合理的權(quán)衡。2)有一個(gè)實(shí)例,其中插槽中的第三個(gè)數(shù)據(jù)返回頭(DRS)需要與第二個(gè)DRS具有相同的目標(biāo)ID位。這也是一個(gè)合理的權(quán)衡,因?yàn)槲覀儫o法發(fā)送3個(gè)DRS(而是發(fā)送2個(gè)DRS)的唯一時(shí)間是如果有超過2,048個(gè)CPU/CXL設(shè)備,并且在一個(gè)重負(fù)載系統(tǒng)中我們無法調(diào)度兩個(gè)具有相同Dest-ID的DRS。

通過這些提議的優(yōu)化,對于CXL.Cache/CXL.Mem,現(xiàn)有的單一域與我們?yōu)榇笮涂山M合系統(tǒng)提出的多域支持之間沒有效率損失。對于跨SMC鏈路的CXL.io訪問,在SMC的初始入口點(diǎn),目標(biāo)端口ID生成并添加為事務(wù)層數(shù)據(jù)包(TLP)前綴,并適當(dāng)轉(zhuǎn)換為目標(biāo)域的總線、設(shè)備和功能。TLP前綴的額外4個(gè)字節(jié)將對CXL.io帶寬產(chǎn)生很小的影響。

為了在大型系統(tǒng)中擴(kuò)展性能,我們還提出了新的CXL流程,其中一些已經(jīng)被采用在CXL 3.0規(guī)范中。在CXL 1.0/CXL 2.0中,所有HDM訪問都通過主機(jī)處理器進(jìn)行,以解決緩存一致性,即使類型2/3設(shè)備可以通過SMC直接訪問,如圖4(a)所示。這導(dǎo)致鏈路帶寬浪費(fèi)和額外的延遲。我們提出直接點(diǎn)對點(diǎn)(p2p)訪問HDM內(nèi)存,我們在CXL.io中稱之為“無序I/O”(UIO),類似于MMIO訪問的點(diǎn)對點(diǎn)。我們在S2M中添加了一個(gè)新的回退使能窺探(“BI-Snp”)和相應(yīng)的回退使能響應(yīng)(“BI-Rsp”),以支持這種直接p2p HDM訪問。這種方法保留了CXL的不對稱性,因?yàn)橹鳈C(jī)處理器仍然協(xié)調(diào)一致性并解決可緩存訪問的沖突。BI-Snp只啟用設(shè)備端內(nèi)存控制器支持直接點(diǎn)對點(diǎn)訪問,類似于自CXL 1.0時(shí)代以來類型2設(shè)備已經(jīng)具備的能力,而不會(huì)引入實(shí)現(xiàn)類型2設(shè)備的緩存語義和偏置翻轉(zhuǎn)流程的復(fù)雜性。

類型2/3設(shè)備已經(jīng)有一個(gè)目錄,由兩位存儲(chǔ)元數(shù)據(jù)(MESI狀態(tài):I、S、E/A,其中A代表任何MESI狀態(tài))。接收到其HDM內(nèi)存的直接UIO請求的類型2/3設(shè)備,如果可以在保持MESI一致性機(jī)制的同時(shí)本地服務(wù)事務(wù)[例如,如果狀態(tài)是I/S,則為讀取(寫入)請求];否則,它將觸發(fā)BI-Snp流程,如圖4(b)所示,以通過主機(jī)CPU強(qiáng)制執(zhí)行MESI一致性機(jī)制,然后完成請求。這些回退使能流程還使類型2設(shè)備能夠部署一個(gè)窺探過濾器。BI流程是CXL.Mem中的一個(gè)單獨(dú)消息類別,因?yàn)镃XL.Mem不依賴于其他消息類別,并且CXL.Mem存在于類型3(和類型2)設(shè)備中。我們還提議為CXL.io UIO寫事務(wù)添加一個(gè)可選的完成流程,如圖4(b)所示,從而將生產(chǎn)者-消費(fèi)者排序點(diǎn)移動(dòng)到源,以實(shí)現(xiàn)CXL.io的多路徑。

我們提議使用增強(qiáng)類型2/3設(shè)備在CPU和設(shè)備之間使用硬件強(qiáng)制緩存一致性共享內(nèi)存。內(nèi)存控制器可以在芯片上實(shí)現(xiàn)一個(gè)窺探過濾器,可選地由內(nèi)存中的目錄支持,或者僅僅是內(nèi)存中的目錄,其中它跟蹤可能擁有緩存行的主機(jī)處理器(s)的端口ID,并根據(jù)需要向主機(jī)處理器(s)發(fā)送BI-Snp。這使得SMC能夠在跨域的共享內(nèi)存上強(qiáng)制執(zhí)行緩存一致性。這種共享內(nèi)存也可以用來跨域?qū)崿F(xiàn)信號(hào)量。我們基于CXL.io(UIO)和非一致性CXL.Mem的節(jié)點(diǎn)間消息傳遞機(jī)制。

我們提議使用單根I/O虛擬化,為多個(gè)域中的CXL類型1/2和PCIe設(shè)備添加池化能力。在這種情況下,fabric管理器將負(fù)責(zé)設(shè)備。SMC將把所有配置請求轉(zhuǎn)發(fā)給fabric管理器,該管理器將模擬配置訪問并確保跨域的隔離。一個(gè)域只對其分配的設(shè)備功能(s)的內(nèi)存空間有直接訪問權(quán),這是為了提供最佳性能所必需的。

SMC微架構(gòu)

圖3(c)顯示了SMC芯片的塊圖,它支持連接到CXL節(jié)點(diǎn)(主機(jī)處理器或CXL設(shè)備)或其他SMC的CXL鏈路,以及連接到DRAM內(nèi)存的DDR總線。CXL管理接口提供了分布式fabric管理功能,這些功能對于協(xié)調(diào)資源分配、控制池化、共享CXL設(shè)備的配置寄存器空間以及在SMC內(nèi)部跨域設(shè)置公共數(shù)據(jù)結(jié)構(gòu)是必需的。每個(gè)主機(jī)都有獨(dú)立的系統(tǒng)地址空間視圖。帶有分布式fabric管理軟件棧的SMC協(xié)調(diào)全局地址映射,如圖5所示。因此,對從CXL節(jié)點(diǎn)的訪問通過SMC內(nèi)部的地址映射和路由邏輯進(jìn)行適當(dāng)?shù)闹赜成洹MC內(nèi)部數(shù)據(jù)路徑和SMC鏈路中的事務(wù)頭攜帶源和/或目標(biāo)的12位端口ID進(jìn)行路由。SMC需要在交付給CPU或設(shè)備時(shí)取下這些前綴、源/目標(biāo)端口ID,并在完成時(shí)重新分配它。除了跨域的地址轉(zhuǎn)換外,SMC在我們的提議架構(gòu)中還提供對復(fù)制、郵箱、信號(hào)量和中斷服務(wù)的支持。

性能指標(biāo)

SMC之間的連通性 一個(gè)抽屜可以有一個(gè)或多個(gè)SMC。對于大規(guī)模擴(kuò)展配置,我們期望每個(gè)獨(dú)立鏈接是x4@64.0GT/s,每個(gè)方向32 GB/s。擁有192個(gè)通道或48個(gè)鏈接,每個(gè)SMC可以連接到機(jī)架中所有16個(gè)獨(dú)立服務(wù)器和16個(gè)池化設(shè)備,另外16個(gè)可以用于連接機(jī)架內(nèi)/跨機(jī)架的其他SMC。因此,使用兩個(gè)級(jí)別的SMC可以在16個(gè)機(jī)架之間實(shí)現(xiàn)連通性。

用于I/O一致性訪問和圖5中描述的跨域消息傳遞,可以部署CXL.io或CXL.Mem機(jī)制。由于帶寬效率CXL.io更高,并且它不會(huì)消耗連接到SMC(s)的系統(tǒng)內(nèi)存來備份消息傳遞空間,我們建議僅使用CXL.io進(jìn)行跨域消息傳遞,以獲得性能、實(shí)現(xiàn)簡單性和成本效益。表1(a)和(b)總結(jié)了我們使用CXL.io的帶寬結(jié)果。

wKgZombWYz-AeFOcAAWDj7aaoJk282.jpg

表1 架構(gòu)的鏈路效率

如上所述,我們提議通過直接點(diǎn)對點(diǎn)(包括不涉及緩存的DMA和跨域消息)繞過主機(jī)處理器進(jìn)行CXL.io訪問。預(yù)期絕大多數(shù)這些訪問不會(huì)引發(fā)BI-Snp機(jī)制來強(qiáng)制一致性。這有助于提高鏈路效率以及減輕主機(jī)處理器鏈路的擁塞。如表1(b)所示,即使在所有訪問都引發(fā)BI-Snp的極端情況下,這種機(jī)制的效率增益也是顯著的,因?yàn)檫@比跨鏈路的多緩存行傳輸更好。

根據(jù)我們在“帶有CXL的可組合、可擴(kuò)展機(jī)架級(jí)架構(gòu)”部分中介紹的結(jié)果,CXL堆棧的Tx+Rx路徑為25納秒。即使增加額外的15納秒用于內(nèi)部延遲,如排隊(duì)/地址查找/仲裁/傳播延遲等,每次通過SMC的跳轉(zhuǎn)少于40納秒。這使得兩次SMC跳轉(zhuǎn)對于內(nèi)存訪問非常可行。表2總結(jié)了我們基于在實(shí)現(xiàn)CXL和詳細(xì)微架構(gòu)SMC方面的工作經(jīng)驗(yàn)對各種訪問的估計(jì)。

wKgZombWY0CANpSgAAOe-sC6qYU922.jpg

表2 架構(gòu)的延遲估計(jì)

結(jié)論

CXL技術(shù)由于在成熟穩(wěn)定的PCIe基礎(chǔ)設(shè)施上實(shí)現(xiàn)低延遲緩存和內(nèi)存語義的簡便性而在行業(yè)中獲得了廣泛的關(guān)注。CXL可以進(jìn)一步增強(qiáng)和部署,以跨越多個(gè)機(jī)架,為多種應(yīng)用提供高可靠性和低延遲的加載-存儲(chǔ)訪問。通過我們提出的方法,我們期望實(shí)現(xiàn)構(gòu)建跨越機(jī)架和數(shù)據(jù)中心的可組合和可擴(kuò)展系統(tǒng)的愿景,從而實(shí)現(xiàn)能效性能,并帶來顯著的總擁有成本優(yōu)勢。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    8

    文章

    3107

    瀏覽量

    74966
  • PCIe
    +關(guān)注

    關(guān)注

    16

    文章

    1318

    瀏覽量

    84627
  • 存儲(chǔ)設(shè)備
    +關(guān)注

    關(guān)注

    0

    文章

    166

    瀏覽量

    19126

原文標(biāo)題:CXL協(xié)議演進(jìn),如何構(gòu)建未來可組合基礎(chǔ)設(shè)施?

文章出處:【微信號(hào):SDNLAB,微信公眾號(hào):SDNLAB】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    兩種高效能電源設(shè)計(jì)及拓?fù)浞治?/a>

    兩種高效能電源設(shè)計(jì)及拓?fù)浞治?在本文中,我們將提出兩個(gè)能符合更高效能要求,并可控制目標(biāo)成本的設(shè)計(jì)方式,并將之和傳統(tǒng)的拓?fù)浣Y(jié)構(gòu)進(jìn)行比較。
    發(fā)表于 11-24 11:11 ?1899次閱讀
    兩種<b class='flag-5'>高效能</b>電源設(shè)計(jì)及拓?fù)浞治? />    </a>
</div>                              <div   id=

    突破新興高效能電源要求上的限制

    法規(guī)標(biāo)準(zhǔn)和消費(fèi)者的更高要求時(shí),重新檢討其設(shè)計(jì)方式就顯得非常急迫。雖然可以改進(jìn)傳統(tǒng)的拓?fù)浣Y(jié)構(gòu)來達(dá)到更高效能要求,但可以明顯地看出,沿用舊式設(shè)計(jì)方式的產(chǎn)品,其性價(jià)比將會(huì)低。在本文中,我們將提出兩個(gè)能符合更高效能
    發(fā)表于 02-04 10:10

    高效能石英振蕩器的選擇

    高效能石英振蕩器的選擇今日的網(wǎng)絡(luò)設(shè)備必須支持?jǐn)?shù)目不斷增多的各種數(shù)據(jù)速率,包括10G 以太網(wǎng)絡(luò)、10G 光纖通道(Fibre Channel)、SONET OC-192 和相關(guān)的前向錯(cuò)誤更正(FEC
    發(fā)表于 10-05 08:13

    安森美高效能LED驅(qū)動(dòng)方案全攻略

    安森美高效能LED驅(qū)動(dòng)方案全攻略
    發(fā)表于 08-18 10:10

    請問有高效能穩(wěn)壓電源原理圖嗎?

    高效能穩(wěn)壓電源原理圖
    發(fā)表于 10-16 09:03

    怎樣利用熱處理去實(shí)現(xiàn)高效能LED?

    請問怎樣利用熱處理去實(shí)現(xiàn)高效能LED?
    發(fā)表于 04-23 06:28

    求AMD R系列與AMD SOC系列嵌入式高效能解決方案

    尋求AMD R系列與AMD SOC系列嵌入式高效能解決方案
    發(fā)表于 05-10 06:05

    一窺CXL協(xié)議

    前言:CXL的全名是Compute eXpress Link。CXL是Intel在2019年提出的,希望用CXL實(shí)現(xiàn)計(jì)算、內(nèi)存、存儲(chǔ)和網(wǎng)絡(luò)
    發(fā)表于 09-09 15:03

    曙光5000A高效能計(jì)算節(jié)點(diǎn)的設(shè)計(jì)與實(shí)現(xiàn)

    曙光5000A高效能計(jì)算節(jié)點(diǎn)的設(shè)計(jì)與實(shí)現(xiàn):由于求解問題和系統(tǒng)規(guī)模的不斷擴(kuò)大,基于cluster 架構(gòu)的高性能計(jì)算機(jī)面臨擴(kuò)展性、可靠性、功耗、
    發(fā)表于 10-04 14:05 ?10次下載

    高效能穩(wěn)壓電源原理圖

    高效能穩(wěn)壓電源原理圖
    發(fā)表于 05-11 13:12 ?867次閱讀
    <b class='flag-5'>高效能</b>穩(wěn)壓電源原理圖

    符合新興高效能電源要求的設(shè)計(jì)

    符合新興高效能電源要求的設(shè)計(jì) 美國環(huán)保署(EPA)的能源之星(Energy Star)計(jì)劃在2007年7月20日正式開始實(shí)施,這是針對個(gè)人電腦在不同負(fù)載下最低效能
    發(fā)表于 01-04 08:15 ?772次閱讀
    符合新興<b class='flag-5'>高效能</b>電源要求的設(shè)計(jì)

    Intel宣布聯(lián)合多家廠商推出全新互聯(lián)協(xié)議 并發(fā)布CXL1.0規(guī)范

    處理器大廠英特爾(Intel)宣布聯(lián)合多家廠商,一起推出了針對資料中心、高效能計(jì)算、AI 等領(lǐng)域的全新的互聯(lián)協(xié)議 Compute EXpress Link(CXL),并將正式發(fā)布
    的頭像 發(fā)表于 03-13 17:03 ?3131次閱讀

    AC/DC電源模塊:緊湊設(shè)計(jì),高效能利用

    ?BOSHIDA ?AC/DC電源模塊:緊湊設(shè)計(jì),高效能利用 AC/DC電源模塊是一種用于將交流電轉(zhuǎn)換為直流電的裝置。它是許多電子設(shè)備中不可或缺的一部分,如計(jì)算機(jī)、通信設(shè)備、家電等。AC/DC
    的頭像 發(fā)表于 06-04 13:41 ?571次閱讀

    DS1008JN:精準(zhǔn)與高效能的完美結(jié)合

    DS1008JN:精準(zhǔn)與高效能的完美結(jié)合
    的頭像 發(fā)表于 07-24 14:55 ?570次閱讀

    環(huán)旭電子如何解決高效能運(yùn)算系統(tǒng)挑戰(zhàn)

    在當(dāng)今科技飛速發(fā)展的時(shí)代,高效能運(yùn)算(High-Performance Computing, HPC)正以其強(qiáng)大的計(jì)算能力,不斷突破各個(gè)領(lǐng)域的界限。
    的頭像 發(fā)表于 02-11 16:09 ?504次閱讀