女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

RDMA over RoCE V2設計1:為什么要設計它?

高速傳輸與存儲 ? 來源:高速傳輸與存儲 ? 作者:高速傳輸與存儲 ? 2025-07-15 10:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

設計目標:
RDMA技術采用無感傳輸機制,消除傳統網絡傳輸中需要CPU介入下的多重數據復制與內核參與環節,實現直接跨主機內存訪問的機制。其設計目標為優化分布式環境下的數據傳輸效率,降低CPU負載。
RoCEv2基于標準網絡的以太網、網絡層和傳輸層(UDP)協議,這可以使得RoCEv2的網絡流量可以經過傳統的網絡路由器路由。之前RDMA簡介1~8有對相關資料介紹,這里強調的是:它是目前性價比最高的RDMA實現方式,雖然IB模式在一些高校應用較多,但因為它的專有特性,價格較貴,難廣泛用于產品中。

設計思考
基于PC-PC或GPU-GPU之間RDMA設計已有較多廠商投入,雖然有的大廠投入幾年后折羽而歸,但不影響PC領域成熟應用產品的推廣。這里主要討論在FPGA上設計RDMA over RoCE V2,雖然已有xilinx的ernic應用,但是性價比以及國產化需求還是有其發展空間。這里討論設計需要著重考慮地方:
1)通用性
一般項目中的數據采集前端基于 FPGA 進行開發。第一,各數據采集前端使用的 FPGA型號各不相同,需要實現的設計能夠工作在多種不同型號 FPGA 上;第二,為了降低設計部署成本,需要實現的設計能夠在脫離 CPU 控制下獨立運行和控制傳輸;第三,一些廠商不愿意采用私有化協議,主要是考慮其被迫被捆綁,私有協議也就意味著難以與其他系統兼容,一旦存在功能或性能設計不足,只能前功盡棄。考慮到以上三點需求,設計時建議采用純邏輯電路實現。
2)高性能
數據采集前端得到的數據,數據塊大小不固定、數據速率也不盡相同。同時對于數據傳輸的需求也并不相同,存在一對一、一對多、多對多等多種傳輸情況。面對大量離散數據時,需要增加 RDMA 隊列數量及深度,同時靈活調整數據包大小來保證傳輸性能,而面對大量連續數據請求時,則可通過減少隊列數量的方式來降低功耗。
同時,在面對一對多或多對多傳輸需求時,則要求設計能夠正確地處理網絡擁塞情況并正確地進行流量控制。因此,需要實現完備的隊列管理及擁塞處理功能,在滿足性能要求的同時適應不同的應用環境。具體要求為使用 QSFP28 及以上光纖接口,在傳輸不小于 256 MB 的連續數據時,數據傳輸速率不小于 90 Gbps。在傳輸包大小為 4KB 時,延遲不高于 10 μs、包吞吐量不小于 1000 kpps。這里也只是簡要指標分析,上面這些指標在PC-FPGA之間實現較容易,在FPGA-FPGA之間還是有一些挑戰。這也反映競爭環境下適者生存,最后生存的不大可能是大多數。雖然我們設計的IP性能(包括我們A, FPGA-FPGA)早已超越這些指標,相信其他廠家也能滿足。
3)易集成、用戶操作簡便
實現的 RDMA 協議棧和控制邏輯,應能夠簡易地集成到應用生產環境中,并提供簡易的用戶操作方式來實現數據傳輸控制及隊列控制。因此,設計需要使用標準化接口,同時盡可能地降低資源占用率,并具備 DMA 數據傳輸功能。
4)穩定性
這里強調的是,如果只是預研項目,就不大需要考慮穩定性,其特有的功能和性能才是項目需要重點解決的。但是作為商用IP,就需要考慮其穩定性,不能出現上次可以,這次就工作不正常,或者性能下降明顯情況。

它涉及到?幾個因素:
1)高速接口的匹配性?:RDMA數傳通道一般采用AXI總線,它需確保IP核與FPGA的如AXI4-Stream/AXI4-Lite等兼容性,避免因協議不匹配導致傳輸錯誤; ?
2)?時序優化:一般它需要跨時鐘域設計,因此對時鐘同步、信號路徑規劃和資源分配等關鍵因素需要重點考慮;
3)?存儲資源分配?:合理設計FIFO深度,(一般采用2的整數次冪深度設計)和RAM塊數量,避免因資源不足導致數據丟失或性能下降。 ?

這里給出IP讀寫性能情況:

wKgZO2h1wjqAC2ImAABynuCedFo892.png


B站已給出相關性能的視頻,如想進一步了解,請搜索B站用戶:專注與守望
鏈接:https://space.bilibili.com/585132944/dynamic?spm_id_from=333.1365.list.card_title.click

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1645

    文章

    22041

    瀏覽量

    618226
  • 高速傳輸
    +關注

    關注

    0

    文章

    29

    瀏覽量

    9170
  • RDMA
    +關注

    關注

    0

    文章

    85

    瀏覽量

    9289
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    RDMA over RoCE V2設計2:ip 整體框架設計考慮

    這里重點討論PC與FPGA之間采用RDMA RoCE v2 高速數據傳輸,FPGA與FPGA后面介紹。該IP系統的整體架構如圖 1 所示。
    發表于 07-16 08:51

    RDMA over RoCE V2設計1:通用,穩定及高性能!

    幾年后折羽而歸,但不影響PC領域成熟應用產品的推廣。這里主要討論在FPGA上設計RDMA over RoCE V2,雖然已有xilinx的ernic應用,但是性價比以及國產化需求還是有
    發表于 07-15 10:54

    RDMA簡介7之可靠傳輸

    RoCE v2協議實現可靠傳輸的技術手段共有三種,分別為:丟包重傳機制、流量控制及擁塞管理。接下來將就這三種技術手段進行詳細分析。 (1)丟包重傳機制 為了簡化設計同時降低成本,RoCE
    發表于 06-13 10:01

    RDMA簡介6之RoCEV2連接管理

    ? RoCE v2協議的隊列在創建時就已確定連接類型,共有兩種工作模式:主要分為兩種工作模式:有連接模式和無連接模式。在有連接模式下,支持可靠連接(RC)和不可靠連接(UC)兩種傳輸類型;而無連接
    發表于 06-13 09:50

    RDMA簡介5之RoCE V2隊列分析

    RDMA Write with immediate)操作不在此范圍內)。RoCE v2作為RoCE v2協議通信的重要機制,通常有五種隊列
    發表于 06-05 17:28

    RDMA簡介4之ROcE V2初析

    RoCE v2原語 (1RDMA READ操作將遠端主機內存中的數據讀取到本地。具體流程為:本地主機將需要請求數據的地址、長度及對應的遠程訪問密鑰發送給遠程主機,遠程主機比對密鑰通
    發表于 06-05 15:20

    RDMA簡介3之四種子協議對比

    計算,從硬件級別保證傳輸可靠,但成本較為高昂,需要使用專用的IB交換機和IB網卡才可以正常路由。RoCE v1RoCE v2RoCE協議
    發表于 06-04 16:05

    RDMA簡介2之A技術優勢分析

    接入、消息基于事務等特點 。RDMA協議與傳統TCP/IP協議在通信過程中的區別如圖1所示。 圖1TCP/IP協議與RDMA協議區別圖 在圖1
    發表于 06-04 11:35

    RDMA簡介1RDMA開發必要性

    協議(iWARP)等RDMA實現方法,RoCE v2協議具有可通過以太網路由、低成本、無TCP/IP依賴等優勢。因此,RoCE v2協議是數
    發表于 06-03 14:38

    HarmonyOS Next V2 @Local 和@Param

    HarmonyOS Next V2 @Local 和@Param @Local 背景 @Local 是 harmony 應用開發中的 v2 版本中 對標**@State**的狀態管理修飾器,解決了
    的頭像 發表于 04-02 18:27 ?387次閱讀
    HarmonyOS Next <b class='flag-5'>V2</b> @Local 和@Param

    HarmonyOS Next V2 @Monitor 和@Computed

    HarmonyOS Next V2 @Monitor 和@Computed @Monitor 介紹 @Monitor 是狀態把管理 V2 版本中的用于監聽狀態變量修改的技術。 它可以直接用在
    的頭像 發表于 04-02 18:26 ?348次閱讀

    加速網絡性能:融合以太網 RDMA (RoCE) 的影響

    直接內存訪問 (RDMA) (RoCE)。這項突破性技術促進了系統之間的直接數據傳輸,無需 CPU 干預,從而顯著減少延遲并提高整體系統性能。[愛波]一家著名的 FPGA 設計公司處于這一進步的最前沿,通過將 AMD 的 ERNIC IP(以太網
    的頭像 發表于 01-25 11:50 ?843次閱讀
    加速網絡性能:融合以太網 <b class='flag-5'>RDMA</b> (<b class='flag-5'>RoCE</b>) 的影響

    SAM IoT Wx v2硬件用戶指南

    電子發燒友網站提供《SAM IoT Wx v2硬件用戶指南.pdf》資料免費下載
    發表于 01-21 14:02 ?0次下載
    SAM IoT Wx <b class='flag-5'>v2</b>硬件用戶指南

    RoCE與IB對比分析(一):協議棧層級篇

    在 AI 算力建設中, RDMA 技術是支持高吞吐、低延遲網絡通信的關鍵。目前,RDMA技術主要通過兩種方案實現:Infiniband和RoCE(基于RDMA的以太網技術,以下簡稱為
    的頭像 發表于 11-15 13:58 ?2171次閱讀
    <b class='flag-5'>RoCE</b>與IB對比分析(一):協議棧層級篇

    以太網RDMA RoCE的技術局限

    上期我們講到了RDMA的WHY,WHAT & HOW(AI網絡背景下RDMA的Why,What & How),這一期我們來談一談RDMA的不足。
    的頭像 發表于 10-22 10:02 ?1329次閱讀
    以太網<b class='flag-5'>RDMA</b> <b class='flag-5'>RoCE</b>的技術局限