女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

揭秘超以太網(wǎng)聯(lián)盟(UEC)1.0 規(guī)范最新進(jìn)展(2024Q4)

星融元 ? 來源:jf_55437772 ? 作者:jf_55437772 ? 2024-11-18 16:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近期,由博通、思科、Arista、微軟、Meta等國際頂級半導(dǎo)體、設(shè)備和云廠商牽頭成立的超以太網(wǎng)聯(lián)盟(UEC)在OCP Global Summit上對外公布其最新進(jìn)展——UEC規(guī)范1.0的預(yù)覽版本。讓我們一睹為快吧!

UEC 旨在提出一種“升級版”的以太網(wǎng)通信協(xié)議棧用以應(yīng)對AI智算、HPC等領(lǐng)域?qū)DMA網(wǎng)絡(luò)的性能挑戰(zhàn)——當(dāng)前大規(guī)模計算節(jié)點互聯(lián)場景下主要有InfiniBand和基于以太網(wǎng)協(xié)議的RoCE兩大技術(shù)路線。有關(guān)IB和RoCE協(xié)議棧的詳盡對比可參閱:

[高性能網(wǎng)絡(luò)傳輸:RoCE與IB協(xié)議棧對比解析]
相比較為封閉的IB架構(gòu),以太網(wǎng)在互操作性和帶寬成本上的優(yōu)勢已在市場層面得到了廣泛認(rèn)可,尤其是大規(guī)模的AI算力中心場景。當(dāng)前全球TOP500的超級計算機(jī)中RoCE和IB的占比相當(dāng),以端口帶寬總量計算,IB占比為39.2%,RoCE已達(dá)48.5%。

盡管IB和RoCE在高性能傳輸?shù)膿砣刂啤oS皆有應(yīng)對設(shè)計,但也暴露出一些缺陷。例如亂序需要重傳、不夠完美的負(fù)載分擔(dān)、Go-back-N問題,DCQCN 部署調(diào)優(yōu)復(fù)雜等等。

面向GPU Scale-out網(wǎng)絡(luò)的UEC 1.0 規(guī)范從軟件API、運輸層到鏈路層以及網(wǎng)絡(luò)安全和擁塞控制皆有涉及,較傳統(tǒng)RDMA網(wǎng)絡(luò)有了大量改進(jìn),我們將挑出重點介紹。

什么是超級以太網(wǎng)系統(tǒng)

一個超級以太網(wǎng)系統(tǒng)的組成如下。一個集群(Cluster)由節(jié)點(Node)和網(wǎng)絡(luò)(Fabric)組成,節(jié)點通過網(wǎng)卡(Fabric Interface)連接到網(wǎng)卡,一個網(wǎng)卡中可以有多個邏輯的網(wǎng)絡(luò)端點(Fabric End Point,F(xiàn)EP)。網(wǎng)絡(luò)由若干平面(Plane)組成,每個平面是多個FEP的集合,通常通過交換機(jī)互聯(lián)。

超以太網(wǎng)協(xié)議棧概覽

? 物理層與傳統(tǒng)以太網(wǎng)完全兼容,可選支持FEC(前向糾錯)統(tǒng)計功能

? 鏈路層可選支持鏈路層重傳(LLR),并支持包頭壓縮,為此擴(kuò)展了LLDP的協(xié)商能力

? 網(wǎng)絡(luò)層依然是IP協(xié)議,沒有變化

? 傳輸層是全新的,作為UEC協(xié)議棧的核心數(shù)據(jù)包傳輸子層(Packet Delivery)和消息語義子層(Message Semantics)。包傳輸子層實現(xiàn)新一代擁塞控制、靈活的包順序等功能,消息語義子層支持xCCL和MPI等消息。可選支持安全傳輸。另外,在網(wǎng)集合通信(In Network Collective,INC)也在這一層實現(xiàn)

? ** 軟件API層** 。提供UEC擴(kuò)展的Libfabrics 2.0

物理層

UEC 1.0規(guī)范下的物理層與傳統(tǒng)以太網(wǎng)(符合IEEE802.3標(biāo)準(zhǔn))完全兼容,支持每通道100Gbps和200Gbps速率,在此基礎(chǔ)上實現(xiàn)800Gbps和更高的端口速率。

另外可選支持物理層性能指標(biāo)統(tǒng)計功能(PHY metrics)。這些指標(biāo)基于 FEC 碼字進(jìn)行計算,不受流量模式和鏈路利用率的影響。估計算法基于FEC錯誤計數(shù)器的數(shù)據(jù),從而得出不可糾正錯誤率(UCR )和數(shù)據(jù)包錯誤平均間隔(MTBPE)。這些指標(biāo)衡量了物理層的傳輸性能和可靠性,用于上層的遙測和擁塞控制等。為了支持新的 UEC 鏈路層功能,UEC規(guī)范中也對協(xié)調(diào)子層(RS)進(jìn)行了相應(yīng)的修改。

鏈路層

UEC鏈路層最大的變化是引入了LLR(Link Level Retry)協(xié)議。它可以讓以太網(wǎng)不依賴PFC,實現(xiàn)無損傳輸。

LLR 機(jī)制是基于幀的。每個幀都分配了一個序列號,接收端成功接收這一幀后,檢查幀的序列號是否符合預(yù)期,如果正確,發(fā)送確認(rèn)消息(ACK),如果發(fā)現(xiàn)幀亂序或者丟失,則發(fā)送否定確認(rèn)消息 (NACK)。發(fā)送端具有超時機(jī)制,用于保證在 NACK 丟失時重傳。

傳輸層:UET,新一代協(xié)議棧的核心

前文提過,傳統(tǒng)的RDMA網(wǎng)絡(luò)傳輸層(包括IB和RoCE)在多路徑傳輸、負(fù)載分擔(dān)、擁塞控制以及參數(shù)調(diào)優(yōu)等方面存在著不足之處。隨著AI/HPC集群規(guī)模增長,網(wǎng)絡(luò)的確定性和可預(yù)測性越來越困難,需要全新的方法來解決。

UEC傳輸層(UEC Transport Layer,簡稱UET)運行在IP和UDP協(xié)議之上, 支持實現(xiàn)以下幾大技術(shù)目標(biāo):

? 支持高達(dá) 100 萬個 GPU/TPU 的算力集群

? 往返時間低于 10μs

? 單接口帶寬800Gbps及以上

? 網(wǎng)絡(luò)利用率超過85%

選擇性重傳

(Selective Retransmit)

傳統(tǒng)傳輸協(xié)議,如TCP需要嚴(yán)格的傳輸順序,并采用了Go-Back-N機(jī)制。而一個RDMA消息通常包含多個數(shù)據(jù)包,只要有一個數(shù)據(jù)包錯誤,則從這個數(shù)據(jù)包起的所有數(shù)據(jù)包都要重傳。這讓偶爾的傳輸錯誤被放大,加劇了網(wǎng)絡(luò)擁塞。UEC采用選擇性重傳機(jī)制,僅傳輸錯誤的數(shù)據(jù)包。

亂序交付

(Out-of-Order Delivery)

UET不僅支持有序傳輸,也支持無序傳輸。這是因為現(xiàn)代網(wǎng)絡(luò)中通常有多路徑存在,同一個流的數(shù)據(jù)包經(jīng)過不同路徑傳輸,就可能造成亂序。如果還要求嚴(yán)格的順序傳輸,就無法利用多路徑來實現(xiàn)負(fù)載分擔(dān)。此外,選擇性重傳也需要無序傳輸?shù)闹С帧榱藢崿F(xiàn)無序傳輸,需要接收方有更大的數(shù)據(jù)包緩沖區(qū),從而將亂序的數(shù)據(jù)包組成一個完整的RDMA消息。

UET支持四種傳輸方式:

? ROD (Reliable Ordered Delivery)

– 需要擁塞控制、有序、可靠、無重傳(依舊采用Go-Back-N)

? RUD (Reliable Unordered Delivery)

– 需要擁塞控制、無序、可靠、無重傳

? RUDI (RUD for Idempotent Operations)

– 可選擁塞控制、無序、可靠、重傳

? UUD (Unreliable Unordered Delivery)

– 可選擁塞控制、無序、不可靠、重傳

包噴灑

(Packet Spraying)

包噴灑是一種基于包的多路徑傳輸。由于傳統(tǒng)傳輸協(xié)議不支持無序傳輸,同一個數(shù)據(jù)流必須按照同一個路徑傳輸,否則就會造成亂序,引發(fā)重傳。而在AI/HPC應(yīng)用中,存在大量的“大象流”,它們數(shù)據(jù)量大、持續(xù)時間長,如果能使用多路徑傳輸一個流,將顯著提高整個網(wǎng)絡(luò)的利用率。

由于支持了RUD,UET就可以將同一個流的不同包分散到多個路徑上同時傳輸,實現(xiàn)包噴灑功能。這讓交換機(jī)可以充分發(fā)揮ECMP甚至WCMP(Weighted Cost Multi- Pathing)路由能力,將去往同一目的地的數(shù)據(jù)包通過多條路徑發(fā)送,大幅度提高網(wǎng)絡(luò)利用率。

擁塞控制

(Congestion Control)

UET 擁塞控制包含以下重要特性,由端側(cè)硬件和交換機(jī)配合完成,有效減小了尾部延遲。

? **Incast管理。**它用于解決集合通信(Collective)中下行鏈路上的扇入問題。AI和HPC應(yīng)用經(jīng)常采用集合通信在多個節(jié)點之間同步信息,當(dāng)多個發(fā)送者同時向一個接收者發(fā)送流量,就會產(chǎn)生Incast擁塞。

? **速率調(diào)整加速。**現(xiàn)有的擁塞控制算法,在發(fā)生網(wǎng)絡(luò)擁塞后調(diào)整速率的過程較長,而 UET 可以快速上升到線速。方法是測量端到端延遲來調(diào)節(jié)發(fā)送速率,以及根據(jù)接收方的能力通知發(fā)送方調(diào)整速率。

? **基于遙測。**源自網(wǎng)絡(luò)的擁塞信息可以通告擁塞的位置和原因,縮短擁塞信令路徑并向終端節(jié)點提供更多信息,從而實現(xiàn)響應(yīng)速度更快的擁塞控制。

? 基于包噴灑的自適應(yīng)路由 。當(dāng)擁塞發(fā)生時,通過包噴灑技術(shù)將流量重新路由到其它路徑上,繞過擁塞點。

端到端的安全

UEC在傳輸層內(nèi)置安全。它是基于作業(yè)(Job)的,可以對整個作業(yè)的流量進(jìn)行端到端的AES加密,充分利用 IPSec 和PSP(Packet Security Protocol)的能力,減小安全加密的開銷,提供可擴(kuò)展安全域,并且可以由硬件卸載。

在網(wǎng)計算

(In Network Collectives)

在網(wǎng)計算最早應(yīng)用在HPC集群,業(yè)界主要有兩個思路,一是基于網(wǎng)卡的,二是基于交換機(jī)。

UEC V1.0 的目標(biāo)是后者,即將集合操作卸載到各級交換機(jī)上完成,避免過多的收發(fā)次數(shù),降低節(jié)點交互頻率和處理時延開銷,減少約一半數(shù)據(jù)傳輸量,從而加速All-Reduce操作。

在部署實現(xiàn)上,目前AI智算領(lǐng)域唯一大規(guī)模商用的案例僅有英偉達(dá)的SHARP(在ASIC層面實現(xiàn)的硬件加速),以太網(wǎng)設(shè)備廠家仍處在探索階段,例如將算力內(nèi)置于交換機(jī)或外接,甚至P4可編程都是可能的思路方向。

軟件層:Extended Libfabrics 2.0

在軟件層,UEC提供簡化的API。它簡化了RDMA操作,并為AI和HPC應(yīng)用提供專用的API,如xCCL, MPI, PGAS和OpenShmem等。

硬件升級:支持UEC的交換機(jī)和網(wǎng)卡

UEC在規(guī)范中定義了支持超級以太網(wǎng)交換機(jī)的架構(gòu),可以看到大體是繼承了SONiC的架構(gòu)。這部分的主要關(guān)注在于控制平面上支持INC和SDN控制器;數(shù)據(jù)平面升級了SAI(Switch Abstraction Interface)API調(diào)用硬件提供的INC等能力。

UEC同樣定義了網(wǎng)絡(luò)端點(Fabric End Point)的軟硬件架構(gòu)。在硬件層,網(wǎng)卡升級支持UEC功能。在操作系統(tǒng)內(nèi)核態(tài),實現(xiàn)網(wǎng)卡驅(qū)動。在用戶態(tài),基于libfabric擴(kuò)展實現(xiàn)INC管理等功能,支持上層的xCCL/MPI/SHMEM等應(yīng)用。

總的來說,UEC v1.0規(guī)范重構(gòu)了數(shù)據(jù)中心以太網(wǎng)以完全替代傳統(tǒng)的RDMA網(wǎng)絡(luò),用更高的性能、更低的成本實現(xiàn)穩(wěn)定可靠、具有百萬節(jié)點的AI/HPC集群。

星融元RoCE交換機(jī)與UEC

作為UEC成員單位,星融元提供的超低時延RoCE交換機(jī)(CX-N系列)全系采用高性能的標(biāo)準(zhǔn)白盒網(wǎng)絡(luò)硬件,搭載為生產(chǎn)環(huán)境深度調(diào)優(yōu)的企業(yè)級SONiC發(fā)行版——多項 Easy RoCE 特性,全面兼容現(xiàn)有規(guī)范并提供靈活、廣大的升級空間,未來將平滑演進(jìn)與新一代以太網(wǎng)標(biāo)準(zhǔn)保持同步。

[搶先圍觀!星融元51.2T 800G RoCE交換機(jī)測試]

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 以太網(wǎng)
    +關(guān)注

    關(guān)注

    40

    文章

    5610

    瀏覽量

    175363
  • 通信
    +關(guān)注

    關(guān)注

    18

    文章

    6191

    瀏覽量

    137586
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    7796

    瀏覽量

    90628
  • RDMA
    +關(guān)注

    關(guān)注

    0

    文章

    83

    瀏覽量

    9247
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    是德科技解讀IEEE P802.3dj最新以太網(wǎng)標(biāo)準(zhǔn)

    基于1985 年首次發(fā)布的 IEEE Std 802.3 最初標(biāo)準(zhǔn),IEEE Std 802.3df 和 IEEE P802.3dj 標(biāo)準(zhǔn)代表了以太網(wǎng)標(biāo)準(zhǔn)的最新進(jìn)展。這些新標(biāo)準(zhǔn)正在為下一代以太網(wǎng)
    的頭像 發(fā)表于 05-30 13:57 ?898次閱讀
    是德科技解讀IEEE P802.3dj最新<b class='flag-5'>以太網(wǎng)</b>標(biāo)準(zhǔn)

    英特爾持續(xù)推進(jìn)核心制程和先進(jìn)封裝技術(shù)創(chuàng)新,分享最新進(jìn)展

    近日,在2025英特爾代工大會上,英特爾展示了多代核心制程和先進(jìn)封裝技術(shù)的最新進(jìn)展,這些突破不僅體現(xiàn)了英特爾在技術(shù)開發(fā)領(lǐng)域的持續(xù)創(chuàng)新,也面向客戶需求提供了更高效、更靈活的解決方案。 在制程技術(shù)方面
    的頭像 發(fā)表于 05-09 11:42 ?192次閱讀
    英特爾持續(xù)推進(jìn)核心制程和先進(jìn)封裝技術(shù)創(chuàng)新,分享<b class='flag-5'>最新進(jìn)展</b>

    百度在AI領(lǐng)域的最新進(jìn)展

    近日,我們在武漢舉辦了Create2025百度AI開發(fā)者大會,與全球各地的5000多名開發(fā)者,分享了百度在AI領(lǐng)域的新進(jìn)展
    的頭像 發(fā)表于 04-30 10:14 ?522次閱讀

    西安光機(jī)所在太赫茲表面逆向設(shè)計領(lǐng)域取得新進(jìn)展

    高精度表面逆向設(shè)計方法及透射/反射雙功能的寬頻段聚焦渦旋光產(chǎn)生器示意圖 近日,中國科學(xué)院西安光機(jī)所快光科學(xué)與技術(shù)全國重點實驗室在太赫茲頻段表面逆向設(shè)計領(lǐng)域取得新進(jìn)展,相關(guān)研究成果
    的頭像 發(fā)表于 04-22 06:12 ?251次閱讀
    西安光機(jī)所在太赫茲<b class='flag-5'>超</b>表面逆向設(shè)計領(lǐng)域取得<b class='flag-5'>新進(jìn)展</b>

    谷歌Gemini API最新進(jìn)展

    體驗的 Live API 的最新進(jìn)展,以及正式面向開發(fā)者開放的高質(zhì)量視頻生成工具 Veo 2。近期,我們面向在 Google AI Studio 中使用 Gemini API 的開發(fā)者推出了許多不容錯過的重要更新,一起來看看吧。
    的頭像 發(fā)表于 04-12 16:10 ?967次閱讀

    華為公布AI基礎(chǔ)設(shè)施架構(gòu)突破性新進(jìn)展

    近日,華為公司常務(wù)董事、華為云計算CEO張平安在華為云生態(tài)大會2025上公布了AI基礎(chǔ)設(shè)施架構(gòu)突破性新進(jìn)展——推出基于新型高速總線架構(gòu)的CloudMatrix 384節(jié)點集群,并宣布已在蕪湖數(shù)據(jù)中心規(guī)模上線。
    的頭像 發(fā)表于 04-12 15:09 ?925次閱讀

    京東方華燦光電氮化鎵器件的最新進(jìn)展

    日前,京東方華燦的氮化鎵研發(fā)總監(jiān)馬歡應(yīng)半導(dǎo)體在線邀請,分享了關(guān)于氮化鎵器件的最新進(jìn)展,引起了行業(yè)的廣泛關(guān)注。隨著全球半導(dǎo)體領(lǐng)域?qū)Ω咝阅堋⒏咝势骷男枨蟛粩嗉哟螅墸℅aN)技術(shù)逐漸成為新一代電子器件的熱點,其優(yōu)越的性能使其在電源轉(zhuǎn)換和射頻應(yīng)用中展現(xiàn)出巨大的潛力。
    的頭像 發(fā)表于 03-13 11:44 ?729次閱讀

    翱捷科技在5G領(lǐng)域的最新產(chǎn)品進(jìn)展

    近日,翱捷科技作為芯片企業(yè)代表受邀出席第42屆GTI WORKSHOP, 并分享關(guān)于RedCap芯片及產(chǎn)業(yè)化的最新進(jìn)展
    的頭像 發(fā)表于 03-04 11:51 ?752次閱讀

    垂直氮化鎵器件的最新進(jìn)展和可靠性挑戰(zhàn)

    過去兩年中,氮化鎵雖然發(fā)展迅速,但似乎已經(jīng)遇到了瓶頸。與此同時,不少垂直氮化鎵的初創(chuàng)企業(yè)倒閉或者賣盤,這引發(fā)大家對垂直氮化鎵未來的擔(dān)憂。為此,在本文中,我們先對氮化鎵未來的發(fā)展進(jìn)行分析,并討論了垂直氮化鎵器件開發(fā)的最新進(jìn)展以及相關(guān)的可靠性挑戰(zhàn)。
    的頭像 發(fā)表于 02-17 14:27 ?1111次閱讀
    垂直氮化鎵器件的<b class='flag-5'>最新進(jìn)展</b>和可靠性挑戰(zhàn)

    Qorvo在手機(jī)RF和Wi-Fi 7技術(shù)上的最新進(jìn)展及市場策略

    供應(yīng)商保持著長期合作關(guān)系。近日,Qorvo資深產(chǎn)品行銷經(jīng)理陳慶鴻(Footmark Chen)與Qorvo亞太區(qū)無線連接事業(yè)部高級行銷經(jīng)理林健富(Jeff Lin)接受了DigiTimes的專訪,深入探討了Qorvo在手機(jī)RF和Wi-Fi 7技術(shù)上的最新進(jìn)展及市場策略,以下是根據(jù)此次專訪整理的報告。
    的頭像 發(fā)表于 01-15 14:45 ?789次閱讀

    FF將發(fā)布FX品牌最新進(jìn)展

    "、"FF"或 "公司")今天宣布,將于2025年1月8日盤后公布其自2024年9月19日FX品牌發(fā)布以來的最新進(jìn)展,包括最新項目進(jìn)展、重大里程碑、新產(chǎn)品品類戰(zhàn)略及下一步計劃。
    的頭像 發(fā)表于 01-03 15:58 ?630次閱讀

    Qorvo在射頻和電源管理領(lǐng)域的最新進(jìn)展

    了半導(dǎo)體行業(yè)的重大變革,還成功引領(lǐng)Qorvo成為射頻技術(shù)的領(lǐng)導(dǎo)者。在本次專訪中,Philip將為大家分享Qorvo在射頻和電源管理領(lǐng)域的最新進(jìn)展,并探討HPA事業(yè)部如何通過技術(shù)創(chuàng)新應(yīng)對全球電氣化和互聯(lián)化的挑戰(zhàn)。
    的頭像 發(fā)表于 11-17 10:57 ?872次閱讀

    小鵬汽車圖靈芯片及L4自動駕駛新進(jìn)展

    的特定領(lǐng)域架構(gòu),進(jìn)一步提升了其處理能力。 據(jù)悉,小鵬汽車已在今年10月份成功在圖靈芯片上跑通了智能駕駛功能,這標(biāo)志著公司在智能駕駛領(lǐng)域取得了重要進(jìn)展。 除了圖靈芯片,何小鵬還透露了小鵬汽車在L4級自動駕駛方面的最新進(jìn)展。他表示,
    的頭像 發(fā)表于 11-08 11:01 ?1553次閱讀

    芯片和封裝級互連技術(shù)的最新進(jìn)展

    近年來,計算領(lǐng)域發(fā)生了巨大變化,通信已成為系統(tǒng)性能的主要瓶頸,而非計算本身。這一轉(zhuǎn)變使互連技術(shù) - 即實現(xiàn)計算系統(tǒng)各組件之間數(shù)據(jù)交換的通道 - 成為計算機(jī)架構(gòu)創(chuàng)新的焦點。本文探討了通用、專用和量子計算系統(tǒng)中芯片和封裝級互連的最新進(jìn)展,并強(qiáng)調(diào)了這一快速發(fā)展領(lǐng)域的關(guān)鍵技術(shù)、挑戰(zhàn)和機(jī)遇。
    的頭像 發(fā)表于 10-28 09:50 ?1091次閱讀

    5G新通話技術(shù)取得新進(jìn)展

    在探討5G新通話這一話題時,我們需首先明確其背景與重要性。自2022年4月國內(nèi)運營商正式推出以來,5G新通話作為傳統(tǒng)語音通話的升級版,迅速吸引了公眾的目光,并引起了社會的廣泛關(guān)注。它基于5G網(wǎng)絡(luò),代表了通信技術(shù)的新進(jìn)展
    的頭像 發(fā)表于 10-12 16:02 ?1238次閱讀