女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

動(dòng)態(tài)感知+智能決策,一文解讀 AI 場(chǎng)景組網(wǎng)下的動(dòng)態(tài)智能選路技術(shù)

星融元Asterfusion ? 2025-06-20 15:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能AI),特別是大規(guī)模模型訓(xùn)練和推理,正以前所未有的方式重塑數(shù)據(jù)中心網(wǎng)絡(luò)。傳統(tǒng)的“盡力而為”網(wǎng)絡(luò)架構(gòu),在處理海量、突發(fā)的AI數(shù)據(jù)洪流時(shí)捉襟見肘。AI模型對(duì)網(wǎng)絡(luò)性能的嚴(yán)苛要求——高帶寬、低延遲、零丟包——迫使網(wǎng)絡(luò)必須進(jìn)行一場(chǎng)深刻的智能進(jìn)化,從被動(dòng)的基礎(chǔ)設(shè)施轉(zhuǎn)變?yōu)槔斫鈽I(yè)務(wù)、感知狀態(tài)、智能決策的“AI感知網(wǎng)絡(luò)”。

AI業(yè)務(wù)訴求:對(duì)傳統(tǒng)網(wǎng)絡(luò)架構(gòu)的挑戰(zhàn)

AI集群(如GPU/TPU服務(wù)器)間的通信呈現(xiàn)出典型的“大象流”特征,流量總量巨大、并發(fā)連接少、單條流帶寬極高(可達(dá)數(shù)百Gbps)。這與傳統(tǒng)數(shù)據(jù)中心中“數(shù)量多、帶寬小”的“老鼠流”模式截然不同。傳統(tǒng)均衡技術(shù)失效,逐流ECMP依賴Hash算法在少量大流上極易導(dǎo)致嚴(yán)重負(fù)載不均,特定路徑擁塞而其他路徑閑置。Flowlet 對(duì)路徑時(shí)延差異敏感,配置參數(shù)(如Gap值)難以適應(yīng)動(dòng)態(tài)變化的網(wǎng)絡(luò)環(huán)境,全局信息缺失導(dǎo)致效果打折。逐包ECMP亂序問題嚴(yán)重,嚴(yán)重影響GPU計(jì)算效率。AI訓(xùn)練任務(wù)(如AllReduce)具有全局同步特性。任何一條關(guān)鍵路徑上的擁塞、丟包或高延遲,都會(huì)導(dǎo)致整個(gè)計(jì)算集群“空等”,顯著拖慢任務(wù)完成時(shí)間(Job Completion Time, JCT),直接影響業(yè)務(wù)效率和資源成本。

RoCE交換機(jī)(SONiC-Based)選用的動(dòng)態(tài)智能選路創(chuàng)新方案結(jié)合了逐流 ECMP 均衡和基于子流 flowlet 均衡提出動(dòng)態(tài)WCMP(Weighted Cost Multipath)和基于flowlet 的 ALB(Auto Load Balancing),下面將介紹具體相關(guān)技術(shù)。

網(wǎng)絡(luò)智能進(jìn)化:為AI而生的核心技術(shù)

網(wǎng)絡(luò)態(tài)勢(shì)實(shí)時(shí)感知:高精度測(cè)量的基石

  • ASIC硬件級(jí)統(tǒng)計(jì)(百毫秒級(jí)):? 直接讀取交換機(jī)芯片寄存器,獲取端口/隊(duì)列的帶寬利用率、緩存占用等關(guān)鍵指標(biāo),通過SONiC控制面以亞秒級(jí)精度匯聚分析。
wKgZPGhL1YWAdsMxAABivehbs5M780.png
  • 帶內(nèi)網(wǎng)絡(luò)遙測(cè)INT(納秒級(jí)):? 采用HDC(高延遲捕獲)技術(shù)。當(dāng)數(shù)據(jù)包在交換機(jī)內(nèi)部經(jīng)歷超過設(shè)定閾值的延遲時(shí),該數(shù)據(jù)包的前150字節(jié)及關(guān)鍵元數(shù)據(jù)(入口/出口端口、精確時(shí)延)會(huì)被復(fù)制并發(fā)送給分析器(如交換機(jī)CPU)。這提供了前所未有的微突發(fā)流量和隊(duì)列擁塞的洞察能力。
wKgZO2hL1hqAR6TSAAAtyi-_KRQ388.png

動(dòng)態(tài)智能選路技術(shù)在星融元交換機(jī)上開啟 HDC 功能,并將 CPU 作為 HDC 的收集分析器,通過分析 HDC 報(bào)文實(shí)現(xiàn)高精度測(cè)量交換機(jī)轉(zhuǎn)發(fā)時(shí)延,并將時(shí)延信息作為路徑質(zhì)量評(píng)價(jià)因子,提高路徑質(zhì)量評(píng)價(jià)精度。

wKgZPGhL1nKAcNx4AABn9b6Zis0759.png

命令行配置 HDC 功能控制INT進(jìn)程運(yùn)行,之后通過 socket 連接進(jìn)行收包循環(huán),將收取到的報(bào)文進(jìn)行解析并將關(guān)鍵信息(出入端口、轉(zhuǎn)發(fā)時(shí)延等)寫入數(shù)據(jù)庫。

全局路徑智能評(píng)估與同步

感知到的數(shù)據(jù)需要轉(zhuǎn)化為對(duì)整網(wǎng)路徑質(zhì)量的統(tǒng)一認(rèn)知。

  • BGP擴(kuò)展社區(qū)屬性傳遞路徑質(zhì)量:? 創(chuàng)新性地?cái)U(kuò)展BGP協(xié)議(數(shù)據(jù)中心廣泛部署的底層路由協(xié)議),定義新的Path Bandwidth Extended Community屬性。該屬性攜帶一個(gè)綜合評(píng)估路徑質(zhì)量的浮點(diǎn)數(shù)值(單位GB/s),通過BGP Update報(bào)文在整網(wǎng)擴(kuò)散。

路徑質(zhì)量同步算法邏輯如下圖所示:

wKgZPGhVBbmANW0nAABhhkxqwi8922.png

動(dòng)態(tài)智能選路技術(shù)將兩層 Leaf-Spine 組網(wǎng)中的交換機(jī)端口分為了三類:Leaf 上行口、Leaf 下行口和 Spine口,每種類型端口賦予不同的計(jì)算系數(shù),且每種端口的計(jì)算系數(shù)可配。

  • 異常路徑主動(dòng)剔除:? 設(shè)定質(zhì)量閾值。綜合質(zhì)量過低的路徑(如擁塞嚴(yán)重、時(shí)延過高)被判定為“異常路徑”并暫時(shí)剔除,避免其拖累整體性能,待其恢復(fù)后重新引入。
wKgZO2hVBdGAOq-kAABu32D086w993.png

智能負(fù)載決策與執(zhí)行:動(dòng)態(tài)WCMP + Flowlet ALB

基于實(shí)時(shí)感知的全局路徑視圖,執(zhí)行層實(shí)現(xiàn)精細(xì)化流量調(diào)度:

動(dòng)態(tài)WCMP(加權(quán)多路徑):?

  • 核心思想:? 不再是ECMP的“平均主義”,而是根據(jù)每條路徑的實(shí)時(shí)綜合質(zhì)量動(dòng)態(tài)計(jì)算權(quán)重(如質(zhì)量比38:80對(duì)應(yīng)權(quán)重比3:7)。
  • 效果:? 將流量按比例引導(dǎo)到當(dāng)前最優(yōu)的路徑上,最大化利用可用帶寬,避免擁塞熱點(diǎn)。權(quán)重隨網(wǎng)絡(luò)狀態(tài)變化而動(dòng)態(tài)調(diào)整。
wKgZO2hVBgKAXsAGAACAdxa2Oso511.png

基于Flowlet的自動(dòng)負(fù)載均衡(ALB):?

  • 作為ECMP的智能增強(qiáng)器:? 在ECMP選定的下一跳組內(nèi),ASIC芯片實(shí)時(shí)監(jiān)測(cè)組內(nèi)各出端口的瞬時(shí)負(fù)載和隊(duì)列時(shí)延。
  • 微秒級(jí)智能調(diào)度:? 當(dāng)一個(gè)Flowlet(具有自然間隙的數(shù)據(jù)包子流)到達(dá)時(shí),ALB將其動(dòng)態(tài)分配到組內(nèi)當(dāng)前負(fù)載最輕或時(shí)延最低的物理端口上。高負(fù)載/高時(shí)延端口會(huì)被臨時(shí)跳過。
  • 故障自愈:? 支持端口級(jí)Fail-over,鏈路故障時(shí)自動(dòng)觸發(fā)流量重分布。
wKgZPGhVBiSASY3eAAAxI2tEW_0441.png

多租戶支持:網(wǎng)絡(luò)虛擬化(VRF)

AI云平臺(tái)需要支持多租戶隔離。

  • VRF隔離:? 為不同用戶/租戶分配獨(dú)立VRF路由表。
  • 基于源IP的流量分類:? 利用ASIC的PRE-ACL能力,根據(jù)GPU網(wǎng)段源IP自動(dòng)將流量劃入對(duì)應(yīng)的租戶VRF進(jìn)行查表轉(zhuǎn)發(fā),確保租戶間嚴(yán)格隔離。
wKgZO2hVBkiAIVbnAACBZTbez4M451.png

智能網(wǎng)絡(luò)賦能AI業(yè)務(wù)場(chǎng)景

化解流量洪峰:動(dòng)態(tài)WCMP的威力

  • 場(chǎng)景:? 256 x 400G GPU集群,1:1收斂比Leaf-Spine架構(gòu)。Server1 GPU1 -> Server17 GPU1的大象流。
  • 傳統(tǒng)ECMP困境:? Hash沖突可能導(dǎo)致所有大象流涌向同一Spine,造成Leaf1上行口擁塞丟包,拖慢整個(gè)訓(xùn)練任務(wù)
wKgZPGhVBl6AC_tAAACvsFfQlc4650.png

動(dòng)態(tài)智能選路方案:?

  1. Server17 GPU1的BGP路由攜帶Leaf17->GPU1質(zhì)量宣告。
  2. Spine疊加自身->Leaf17質(zhì)量后宣告給Leaf1。
  3. Leaf1疊加自身->Spine質(zhì)量,匯總所有到GPU1路徑的質(zhì)量。
  4. Leaf1剔除劣質(zhì)路徑,基于剩余路徑質(zhì)量動(dòng)態(tài)計(jì)算WCMP權(quán)重(如3:7)。
  5. 流量按最優(yōu)比例分發(fā)到多條Spine路徑,避免單點(diǎn)擁塞,保障大象流順暢。

業(yè)務(wù)價(jià)值:? 防止關(guān)鍵路徑擁塞,穩(wěn)定JCT,提升GPU集群整體利用率。

Flowlet ALB優(yōu)化ECMP

  • 場(chǎng)景:? 在Leaf1到Spine的ECMP組內(nèi),某條鏈路突發(fā)微擁塞導(dǎo)致時(shí)延升高。
wKgZPGhVBrKAUtopAACy58Yo5oI449.png

Flowlet ALB作用?

  1. ASIC實(shí)時(shí)檢測(cè)到該出端口負(fù)載/時(shí)延超標(biāo)。
  2. 后續(xù)到達(dá)的Flowlet被自動(dòng)引導(dǎo)至組內(nèi)其他負(fù)載正常/時(shí)延低的端口。
  3. 擁塞端口被暫時(shí)“規(guī)避”,待其負(fù)載/時(shí)延恢復(fù)正常后,F(xiàn)lowlet將再次被分配至此端口。

業(yè)務(wù)價(jià)值:? 消除微突發(fā)導(dǎo)致的局部擁塞和抖動(dòng),優(yōu)化端到端時(shí)延,提升GPU計(jì)算效率。

AI時(shí)代的網(wǎng)絡(luò),已不再是簡(jiǎn)單的連通管道。星融元CX-N系列RoCE交換機(jī)所代表的動(dòng)態(tài)感知 + 智能決策(動(dòng)態(tài)WCMP) + 精準(zhǔn)執(zhí)行(Flowlet ALB) 架構(gòu),標(biāo)志著網(wǎng)絡(luò)向“AI感知網(wǎng)絡(luò)”的深刻進(jìn)化。這種進(jìn)化以保障AI業(yè)務(wù)性能為核心目標(biāo),通過實(shí)時(shí)感知網(wǎng)絡(luò)狀態(tài)、智能評(píng)估路徑質(zhì)量、動(dòng)態(tài)調(diào)整流量分布,有效化解了傳統(tǒng)網(wǎng)絡(luò)在AI負(fù)載下的性能瓶頸,為大規(guī)模AI訓(xùn)練和推理提供了穩(wěn)定、高效、無損的網(wǎng)絡(luò)基石,釋放AI的真正潛力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    34781

    瀏覽量

    277146
  • 負(fù)載均衡
    +關(guān)注

    關(guān)注

    0

    文章

    121

    瀏覽量

    12572
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Path Bandwidth Extended Community:藏在BGP屬性里的智能路由革命

    傳統(tǒng)BGP協(xié)議雖能實(shí)現(xiàn)路由可達(dá)性,但缺乏對(duì)路徑質(zhì)量的動(dòng)態(tài)感知能力,導(dǎo)致流量分配不均、高延遲鏈未被規(guī)避等問題。為提升網(wǎng)絡(luò)資源利用率,動(dòng)態(tài)智能
    的頭像 發(fā)表于 06-24 14:00 ?277次閱讀
    Path Bandwidth Extended Community:藏在BGP屬性里的<b class='flag-5'>智能</b>路由革命

    智算網(wǎng)絡(luò)路徑質(zhì)量三要素:帶寬/隊(duì)列/時(shí)延在智能中的協(xié)同優(yōu)化

    為了從根本上優(yōu)化AI流量的傳輸效率并最大化集群利用率,我們?cè)O(shè)計(jì)并實(shí)踐了基于多維度網(wǎng)絡(luò)狀態(tài)感知動(dòng)態(tài)智能
    的頭像 發(fā)表于 06-13 15:44 ?163次閱讀
    智算網(wǎng)絡(luò)路徑質(zhì)量三要素:帶寬/隊(duì)列/時(shí)延在<b class='flag-5'>智能</b><b class='flag-5'>選</b><b class='flag-5'>路</b>中的協(xié)同優(yōu)化

    高德發(fā)布AI導(dǎo)航智能體:高速駕車場(chǎng)景下可感知車道級(jí)交通流變化

    模塊構(gòu)建智能閉環(huán),集成多項(xiàng)高德核心技術(shù)。 官方表示,該智能體“更像經(jīng)驗(yàn)豐富的‘老司機(jī)’”,能實(shí)時(shí)感知路況、預(yù)判風(fēng)險(xiǎn)并主動(dòng)調(diào)整策略。據(jù)IT之家了解,以高速駕車
    的頭像 發(fā)表于 04-15 18:28 ?331次閱讀
    高德發(fā)布<b class='flag-5'>AI</b>導(dǎo)航<b class='flag-5'>智能</b>體:高速駕車<b class='flag-5'>場(chǎng)景</b>下可<b class='flag-5'>感知</b>車道級(jí)交通流變化

    智能家居Mesh組網(wǎng)方案:實(shí)現(xiàn)智能化生活的無縫連接NRF52832

    互聯(lián)成為了個(gè)迫切的問題。 為了解決這問題,迅通科技研發(fā)了智能家居 Mesh 組網(wǎng)方案,為傳統(tǒng)智能家居產(chǎn)品商提供了
    發(fā)表于 04-15 14:07

    云翎智能應(yīng)急自組網(wǎng)通信系統(tǒng):讓應(yīng)急通信更智能、更可靠

    云翎智能應(yīng)急自組網(wǎng)通信系統(tǒng)是項(xiàng)創(chuàng)新的技術(shù)解決方案,旨在提升應(yīng)急通信的智能化與可靠性。以下是對(duì)該系統(tǒng)的詳細(xì)闡述:云翎
    的頭像 發(fā)表于 03-31 11:59 ?437次閱讀
    云翎<b class='flag-5'>智能</b>應(yīng)急自<b class='flag-5'>組網(wǎng)</b>通信系統(tǒng):讓應(yīng)急通信更<b class='flag-5'>智能</b>、更可靠

    AI賦能邊緣網(wǎng)關(guān):開啟智能時(shí)代的新藍(lán)海

    在數(shù)字化轉(zhuǎn)型的浪潮中,AI與邊緣計(jì)算的結(jié)合正掀起場(chǎng)深刻的產(chǎn)業(yè)變革。邊緣網(wǎng)關(guān)作為連接物理世界與數(shù)字世界的橋梁,在AI技術(shù)的加持下,正從簡(jiǎn)單的數(shù)據(jù)采集傳輸節(jié)點(diǎn),進(jìn)化為具備
    發(fā)表于 02-15 11:41

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.55】AI Agent應(yīng)用與項(xiàng)目實(shí)戰(zhàn)

    。為了更深入理解 AI Agent 的技術(shù)基礎(chǔ),以下是其關(guān)鍵技術(shù)架構(gòu)及應(yīng)用場(chǎng)景的詳細(xì)解析: (1)自主性:AI Agent 通過
    發(fā)表于 01-13 11:04

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)

    Intelligence,EAI)是個(gè)集多學(xué)科技術(shù)與理論于體的研究領(lǐng)域,旨在探討智能如何在智能體與其環(huán)境的互動(dòng)中展現(xiàn)。 與傳統(tǒng)的人工
    發(fā)表于 12-20 19:17

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.51】具身智能機(jī)器人系統(tǒng) | 了解AI的下個(gè)浪潮!

    和強(qiáng)化學(xué)習(xí)等領(lǐng)域 。 這些技術(shù)的綜合應(yīng)用使具身智能系統(tǒng)能夠進(jìn)行復(fù)雜的環(huán)境感知決策制定和物理操作。例如,通過多模態(tài)感知
    發(fā)表于 11-11 10:20

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    很幸運(yùn)社區(qū)給我個(gè)閱讀此書的機(jī)會(huì),感謝平臺(tái)。 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,為我們揭示了人工
    發(fā)表于 10-14 09:21

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    偏見、倫理道德等問題。此外,如何更好地將AI與科學(xué)研究人員的傳統(tǒng)工作模式相融合,也是個(gè)亟待解決的問題。未來,隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的拓展,A
    發(fā)表于 10-14 09:16

    同風(fēng)起,耀星河!華為攜手伙伴起創(chuàng)造無限可能

    ,聯(lián)盟會(huì)員數(shù)量如雨后春筍般迅猛增長(zhǎng),舉突破1000余家。廠商相繼發(fā)布芯片模組、智能終端、智能家居、數(shù)字車鑰匙等六十余款產(chǎn)品。聯(lián)盟新立項(xiàng)的技術(shù)標(biāo)準(zhǔn)38項(xiàng),在定位、
    發(fā)表于 10-10 12:13

    同風(fēng)起,耀星河!華為攜手伙伴起創(chuàng)造無限可能

    ,聯(lián)盟會(huì)員數(shù)量如雨后春筍般迅猛增長(zhǎng),舉突破1000余家。廠商相繼發(fā)布芯片模組、智能終端、智能家居、數(shù)字車鑰匙等六十余款產(chǎn)品。聯(lián)盟新立項(xiàng)的技術(shù)標(biāo)準(zhǔn)38項(xiàng),在定位、
    發(fā)表于 09-30 17:56

    智能IC卡測(cè)試設(shè)備的技術(shù)原理和應(yīng)用場(chǎng)景

    智能IC卡測(cè)試設(shè)備的技術(shù)原理和應(yīng)用場(chǎng)景,可以從以下幾個(gè)方面進(jìn)行闡述:技術(shù)原理智能IC卡測(cè)試設(shè)備的技術(shù)
    發(fā)表于 09-26 14:27

    詳解動(dòng)態(tài)多點(diǎn)VPN技術(shù)

    引言 動(dòng)態(tài)多點(diǎn)VPN(Dynamic Multipoint VPN)是mGRE、NHRP(Next Hop Resolution Protocol)、IPSec結(jié)合產(chǎn)生的技術(shù),簡(jiǎn)寫為DMVPN
    發(fā)表于 07-26 06:07