女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

CXL內存延遲到底有多糟糕?

芯長征科技 ? 來源:半導體行業觀察 ? 作者:半導體行業觀察 ? 2022-12-07 15:44 ? 次閱讀

傳統觀點認為,如果您非常關心延遲,那么嘗試將系統內存連接到 PCI-Express 總線并不是一個好主意。因為內存離 CPU 越遠,延遲就越高,這就是內存 DIMM 通常盡可能靠近插槽的原因。

從邏輯上講,PCI-Express 是千里之外的。隨著每一代 PCI-Express 帶寬翻倍,如果沒有重定時器的幫助也會增加延遲,它可以傳輸的距離也會縮短。對于我們習慣于連接到 PCI-Express 的大多數類型的內存來說,這不是什么大問題。閃存存儲的延遲以幾十微秒為單位的情況并不少見,這使得互連產生的額外幾百納秒成為一個有爭議的問題。然而,我們對DDR 和其他形式的易失性存儲器就沒有那么寬容了。

以前的內存擴展嘗試都陷入了妥協,特別是在延遲方面。例如,GigaIO 表示其FabreX 架構已經可以使用 DMA 在 PCI-Express 上進行內存池化,但這樣做需要應用程序能夠容忍 500 納秒到 1.5 微秒的延遲。

同樣,根據 Blocks and Files 的說法,在英特爾今年夏天毫不客氣地削減其 Optane 持久內存業務之前,部署該技術意味著會產生大約350 納秒的延遲。雖然可用,尤其是在分層內存配置中,但它比直接連接 CPU 的 DDR 內存預期的低于 100 納秒的往返延遲要長得多。

進入 CXL 內存生態系統

這為我們帶來了使用 Compute Express Link 協議或 CXL 的第一代內存擴展模塊。基于 AMD 的Epyc 9004“Genoa”處理器的系統是首批系統之一,擁有 64 條 CXL 連接通道——不同于其 128 至 160 條整體 PCI-Express 通道——最多可分為四到十六個設備。至于英特爾將如何在其“Sapphire Rapids”Xeon SP 處理器上實施 CXL,我們將不得不等到它們明年初問世。

與這些服務器相得益彰的是我們確信的第一個是許多 CXL 內存擴展模塊。雖然 CXL 最終將允許完全分解的系統,在這些系統中,資源可以通過高速結構在整個機架上共享,但距離那一天還有幾年的時間。

對于首次涉足數據中心,CXL 直接專注于內存擴展、分層內存和一些早期的內存池應用程序。目前,我們只關注內存擴展,因為在這個早期階段,它可以說是最簡單和最實用的,尤其是在以可用延遲附加內存時。

三星和Astera Labs已經展示了 CXL 內存模塊,他們說只需將它們插入兼容的 PCI-Express 5.0 插槽,即可為系統添加數 TB 的內存。從系統的角度來看,它們的外觀和行為就像通過內存總線連接到相鄰插槽的常規 DDR DRAM 內存。

在最長的時間里,一旦達到 CPU 內存控制器的限制,添加更多內存的唯一方法就是添加更多插槽。如果工作負載可以利用額外的線程,那就更好了,但如果不能,這將成為一種非常昂貴的添加內存的方式。實際上,額外的插槽只是一個內存控制器,上面附有一堆昂貴的、不需要的內核。

內存擴展模塊的行為方式大致相同,但它不是使用專有的插槽到插槽互連,如英特爾的 UPI 或 AMD 的 xGMI 鏈接,而是 CXL。這意味著您可以擁有這些設備的整個生態系統,事實上,我們已經看到一個相當充滿活力,有時甚至是令人向往的設備圍繞 CXL 展開。

CXL 總裁 Siamak Tavallaei在 SC22上告訴 The Next Platform ,CXL 實際上包含三種協議,但并非所有協議都是延遲的靈丹妙藥。“CXL.io 仍然具有您預期的相同類型的延遲(來自 PCI-Express),但其他兩個協議——CXL.cache 和 CXL.mem——通過協議采用更快的路徑,并且它們減少了延遲。”

CXL 內存延遲到底有多糟糕?

如果 Astera 值得信任,延遲并不像您想象的那么糟糕。該公司的Leo CXL 內存控制器旨在接受高達 5600 MT/秒的標準 DDR5 內存 DIMM。他們聲稱客戶可以預期延遲與訪問第二個 CPU 上的內存大致相當,一個 NUMA 躍點。這使得它在 170 納秒到 250 納秒附近。事實上,就系統而言,這正是這些內存模塊向操作系統顯示的方式。

Tavallaei 解釋說,大多數 CXL 內存控制器會增加大約 200 納秒的延遲,額外的重定時器會增加或花費幾十納秒,具體取決于設備與 CPU 的距離。這與其他 CXL 早期采用者所看到的一致。GigaIO 首席執行官 Alan Benjamin 告訴The Next Platform,它所見過的大多數 CXL 內存擴展模塊的延遲都接近 250 納秒,而不是 170 納秒。

然而,正如 Tavallaei 指出的那樣,這仍然是對四插槽或八插槽系統的改進,在這些系統中,應用程序可能僅僅因為需要內存而不得不應對多個 NUMA 躍點。(不過,公平地說,IBM 和英特爾在 CPU 之間添加了更多更快的鏈接,以減少跳數和每跳延遲。)

話雖如此,許多芯片制造商很快指出,CXL 生態系統現在才剛剛起步。在 CXL 董事會任職的 AMD 的 Kurtis Bowman 告訴The Next Platform,許多早期的 CXL 概念驗證和產品都使用尚未針對延遲進行優化的 FPGA 或第一代 ASIC。隨著時間的推移,他預計延遲會大大改善。

如果 CXL 供應商能夠像他們聲稱的那樣,在展廳演示之外實現與多插槽系統同等的延遲,那么它應該在很大程度上消除利用它們所需的應用程序或操作系統特定定制的需要。好吧,至少就內存擴展而言。正如我們在 Optane 中看到的那樣,CXL 內存分層幾乎肯定需要某種操作系統或應用程序支持。

隨著插槽變得越來越大并且在板上安裝更多 DIMM 變得越來越難,這再合適不過了。放置它們的地方更少了。有可容納 32 個 DIMM 的雙插槽系統,但隨著芯片制造商增加更多通道以滿足更高核心數的帶寬需求,這是不可擴展的。

我們已經在某種程度上在 AMD 的 Genoa 芯片上看到了這一點,盡管該芯片將內存通道數量增加到 12 個,但在發布時每個通道僅支持一個 DIMM,將雙插槽配置中的 DIMM 數量限制為 24 個。即使您可以為每個通道連接兩個 DIMM,我們被告知將 48 個 DIMM 安裝到標準機箱中是不切實際的。

當我們希望在更遠的距離(例如跨機架)連接內存時,事情會變得更加復雜,因為電或光互連產生的延遲必須計入方程式。但對于機箱內 CXL 內存擴展,延遲似乎并不像許多人擔心的那么令人頭疼。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • amd
    amd
    +關注

    關注

    25

    文章

    5562

    瀏覽量

    135872
  • 內存
    +關注

    關注

    8

    文章

    3108

    瀏覽量

    74986
  • 生態系統
    +關注

    關注

    0

    文章

    707

    瀏覽量

    20976

原文標題:CXL,面臨嚴峻的延遲問題

文章出處:【微信號:芯長征科技,微信公眾號:芯長征科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    內存擴展CXL加速發展,繁榮AI存儲

    和IO墻的瓶頸。它通過PCI Express的物理層,提供低延遲和高帶寬的連接,旨在支持下一代數據中心的高性能計算和內存密集型工作負載。 ? CXL主要有CXL.io、
    的頭像 發表于 08-18 00:02 ?5461次閱讀
    <b class='flag-5'>內存</b>擴展<b class='flag-5'>CXL</b>加速發展,繁榮AI存儲

    實測 PTR54LS05低功耗到底有

    實測 PTR54LS05低功耗到底有低?
    發表于 04-27 10:57

    SMART Modular CXL AIC內存擴充卡獲CXL聯盟認證

    近日,全球領先的整合型內存與儲存解決方案提供商SMART Modular世邁科技(隸屬于Penguin Solutions?集團)宣布,其4-DIMM和8-DIMM CXL?(Compute
    的頭像 發表于 02-14 10:15 ?370次閱讀

    SMART Modular世邁科技CXL內存擴充卡獲CXL聯盟認證

    商名單。 這一重要里程碑不僅標志著SMART Modular在CXL技術領域的領先地位,更是對其長期以來致力于高質量、高兼容性內存解決方案的肯定。CXL作為一種高性能、低延遲的互連技術
    的頭像 發表于 02-05 15:59 ?419次閱讀

    TLC2578芯片中FS與SDI到底有什么作用?

    ,還有就是一點不太懂的就是:TLC2578芯片中FS與SDI到底有什么作用。手冊看了半天還是不懂!求解!謝謝!
    發表于 01-22 06:51

    瀾起科技CXL?內存擴展控制器芯片通過CXL 2.0合規性測試

    近日,瀾起科技在CXL(Compute Express Link)技術領域取得了又一重要里程碑。其自主研發的CXL?內存擴展控制器(MXC)芯片成功通過了CXL 2.0合規性測試,并被
    的頭像 發表于 01-21 14:44 ?805次閱讀

    RK3506到底有多香?搶先看核心板詳細參數配置

    RK3506到底有多香?觸覺智能已推出RK3506核心板,搶先了解核心板詳細參數配置!
    的頭像 發表于 01-18 11:33 ?1359次閱讀
    RK3506<b class='flag-5'>到底有</b>多香?搶先看核心板詳細參數配置

    24位或者說高分辨率的AD到底有什么用呢?

    的AD,如24位的AD,其分辨率達到很低的uV級別,我們如何考究其精度?而且AD的精度受到諸多因素的影響,其中參考源的穩定度和供電電源的穩定度對精度影響很大,參考源最低0.05%的精度,那么24位的分辨率所可以達到的精度卻是要大打折扣的,請問在這樣的情況下,24位或者說高分辨率的AD到底有什么用呢?
    發表于 01-07 06:49

    差分輸入和和單端輸入在本質上到底有什么區別?

    和和單端輸入在本質 上到底有什么區別? 因為,ADC采集的信號說到底是AINP - AINN,不管單端還是差分,采集的信號都是這兩個pad的差值。 2:將單端信號接在ADC的差分輸入接口上可以用
    發表于 12-23 07:31

    TFP401APZP到底有沒有HSYNC輸出?

    請教下TI的大牛,TFP401APZP這顆IC到底有沒有HSYNC輸出?實測發現HSYNC無輸出,是要做什么設置么?!
    發表于 12-20 07:28

    高鐵站網約車數智出行到底有智能?

    在當今這個科技飛速發展的時代,智能出行已成為我們日常生活中不可或缺的一部分,而高鐵站網約車數智出行更是將這一理念推向了新的高度。那么,這種數智出行方式到底有智能呢? 首先,從預約叫車開始,高鐵站網
    的頭像 發表于 11-14 14:48 ?518次閱讀

    RTOS與Linux到底有什么區別

    很多做嵌入式開發的小伙伴都存在這樣的疑惑:RTOS與Linux到底有什么區別?
    的頭像 發表于 10-29 09:53 ?1089次閱讀

    CMOS運放的輸入阻抗到底有多高呢?

    都說CMOS運放輸入阻抗高,到底有多高呢?可有一個量化指標?
    發表于 09-06 06:59

    影響內存延遲的因素有哪些

    內存延遲是指等待對系統內存中存儲數據的訪問完成時引起的延期,它是衡量內存響應速度的重要指標。影響內存延遲
    的頭像 發表于 09-04 11:46 ?3187次閱讀

    求助,這個電路U1A運放同相端的R1電阻到底有什么作用啊?

    想問下這個電路U1A運放同相端的R1電阻到底有什么作用啊?很郁悶。
    發表于 08-27 07:09