女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達Blackwell平臺網絡配置分析

智能計算芯世界 ? 來源:智能計算芯世界 ? 2024-04-17 11:01 ? 次閱讀

本文來自“英偉達Blachwell平臺網絡配置詳解”。GTC大會英偉達展示了全新的 Blackwell 平臺系列產品,包括 HGX B100 服務器、NVLINK Switch、GB200Superchip Computer Node、Quantum X800 交換機和 CX8 網卡(InfiniBand 方案)、ETH Spectrum X800 交換機和 BF3 網卡(以太網方案)。

1. Blackwell 平臺網絡配置分析

從網絡配置的角度,英偉達提供了第五代 NVLINK、第六代 PCIE、單端口800Gbit/s 的 IB 和以太網網卡、1.6T 光模塊需求。從目前英偉達公布的產品介紹看,這些升級后的網絡能力可能不會第一時間全部配置在最新的 DGX B200 服務器上,而是在后續的產品中逐步升級。從英偉達公布的產品說明材料看,DGX B200 服務器配置 8 顆 NVIDIA B200 Tensor Core GPUs,4 個 800G OSPF 光模塊,最大功耗為 14.3kW。

2 DGX GB200: NVLink domain 提升至 576 GPUs

采用 DGX GB200 系統的 NVIDIA DGX SuperPOD 專為訓練和推理萬億參數生成式AI 模型而構建。每個液冷機架配備 36 個 NVIDIA GB200 Grace Blackwell 超級芯片(36 個 NVIDIA Grace CPU 和 72 個 Blackwell GPU),與 NVIDIA NVLink 連接為一體。多個機架與 NVIDIA Quantum InfiniBand 連接,可擴展到數萬個 GB200 超級芯片。

GB200 可以在單機柜內搭建包含 36 個或者 72 個 GPU 的 NVLink domain。一個機柜內包含 18 個計算節點和 9 臺 L1 NVLink Switch?;诘谖宕?NVLink 技術,每個 NVLink 交換機可以提供 144 個 100GB NVLink 端口。通過機柜內的 9 個 L1NVLink Switch 可以合計 提 供 1296 個 100GB NVLink 端口 ,機柜 內的每 個Blackwell GPUs 可以獲得 18 個端口,合計 1.8T 的 NVLink 帶寬。

GB200 NVL72 使用了一個定制化的 Copper cable cartridge 實現機柜內 9 個L1 NV Switch 和 18 個計算節點的 NVLink 連接。英偉達介紹 NVIDIA GB200 NVL72可以在一個 NVLink domain 內連接 576 個 GPU。英偉達當前公布的 GB200 NVL72 配置了 72 個 CX7 網口(OSFP 400Gb/s InfiniBand),并沒有使用最新的 CX8 網卡。

3 全新 IB 交換機,雙層胖樹支持萬卡集群

NVIDIA Quantum-X800 Q3400-RA 是一臺 4U 的 IB 交 換機 ,對比 上一 代Quantum-9700 交換機設備尺寸提升了一倍。Quantum-X800 也是英偉達第一款使用200Gb/s-per-lane SerDes 方案的交換機設備,通過 72 個 OSPF 1.6T 光模塊提供144 個 800G 端口。英偉達指出,基于 Quantum-X800 的高性能,兩層胖樹網路拓撲就可以連接 10386 個網絡接口卡。

GTC 大會上,英偉達推出的 Spectrum-X800 SN5600 是一臺 51.2T 端口容量的以太網交換機,可以配置 64 個 OSPF 800G 光模塊。

4 新平臺依然需要 800G 和 400G 光模塊

從 GTC 大會的介紹看,BLACKWELL 平臺會帶來第五代 NVLINK、第六代 PCIE、第八代 IB 網絡應用。但是在當前早期交付的產品中依然會采用 800G 和 400G 光模塊。其中 DGX B200 服務器配置通過 4 個 800G OSPF 光模塊提供 8 個 400G 端口,這和DGX H100 服務器的配置相同。

我們認為 B200 GPU 和 800 光模塊的配置比例和 H100 GPU 保持一致。而 GB200NVL72 需要配置 72 個 OSPF 400G 光模塊,以便通過 IB 網絡實現萬卡集群的連接。

5 新的IB網絡帶來1.6T光模塊需求

NVIDIA Quantum-X800 Q3400-RA 和 CX8 NIC 則明確需要配置 1.6T 光模塊。和上一代 IB 網絡相比,主要的變化是 Quantum-X800 的端口能力提升至 115.2T,可以通過兩層胖樹拓撲實現 10386 個網絡接口卡的連接,萬卡規模 Blackwell GPU 集群使用 IB 網絡組網的成本得到優化。我們認為這會弱化以太網方案的價格優勢,提升 IB 網絡方案的競爭力。

6 NVLink domain 容量擴展帶來新增的銅纜連接需求

通過第五代 NVLINK 從 900GB 提升至 1800GB,單個 NVLINK domain 的 GPU 數量提升至 576 個。最大的變化是 L1 NV Switch 從服務器 PCB 板載芯片的形式調整為機柜內的 9 臺交換機,連接能力提升至 72 個 GPU,需要使用銅纜實現機柜內的NVLINK 連接。

而如何實現 576 個 GPU 連接,目前英偉達還沒有給出具體的連接方案,但是鑒于目前最新的 IB 交換機能力,我們認為連接 576 個 GPU 需要 L2 NV Switch。最終的方案使用銅纜還是光模塊,核心是銅纜的連接距離是否可以滿足 8 個機柜的連接需求,低成本的銅纜連接方案會是優先選項。

審核編輯:黃飛

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 以太網
    +關注

    關注

    40

    文章

    5582

    瀏覽量

    174692
  • 交換機
    +關注

    關注

    21

    文章

    2720

    瀏覽量

    101326
  • 光模塊
    +關注

    關注

    80

    文章

    1376

    瀏覽量

    60004
  • 網絡配置
    +關注

    關注

    1

    文章

    25

    瀏覽量

    7730
  • 英偉達
    +關注

    關注

    22

    文章

    3920

    瀏覽量

    93081

原文標題:英偉達Blackwell平臺網絡配置詳解

文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    英偉GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
    的頭像 發表于 03-20 15:35 ?600次閱讀

    新思科技攜手英偉加速芯片設計,提升芯片電子設計自動化效率

    宣布在英偉 Grace Blackwell 平臺上實現高達 30 倍的預期性能提升,加速下一代半導體的電路仿真 ? 摘要: 在今年GTC主題演講中,新思科技作為生態系統的一部分,展示
    發表于 03-19 17:59 ?199次閱讀

    黃仁勛:英偉CoWoS產能將大幅增加

    近日,英偉公司CEO黃仁勛親臨硅品精密臺中潭子新廠,并發表了一系列重要言論。 黃仁勛表示,英偉Blackwell
    的頭像 發表于 01-17 10:33 ?453次閱讀

    英偉Blackwell芯片機架出現故障 訂單下滑

    據外媒報道,英偉首批搭載Blackwell芯片的機架出現過熱問題,芯片之間的連接方式也存在故障。主要客戶微軟、亞馬遜云部門、谷歌母公司Alphabet和Meta等公司已經減少了英偉
    的頭像 發表于 01-14 15:39 ?342次閱讀

    英偉CEO確認:液冷Grace Blackwell服務器無過熱問題

    近日,英偉公司的首席執行官(CEO)針對外界關注的液冷Grace Blackwell服務器過熱問題,發表了明確的看法。他強調,采用液冷技術的Grace Blackwell服務器并不存
    的頭像 發表于 11-21 11:45 ?534次閱讀

    英偉將重新命名其Blackwell Ultra產品線為B300系列

    據TrendForce的最新報道,英偉計劃對其Blackwell Ultra產品線進行更名,以B300系列來標識這一性能提升的新系列,旨在與即將面世的B100和B200產品形成清晰區分。然而,此次升級在內存
    的頭像 發表于 11-01 14:54 ?870次閱讀

    英偉Blackwell GPU未來一年訂單爆滿

    據摩根士丹利(大摩)透露,人工智能(AI)芯片領域的領軍企業英偉(NVIDIA)的管理層在近期的一系列與投資人的會議中,分享了關于其下一代繪圖處理器(GPU)Blackwell的強勁市場需求情況。
    的頭像 發表于 10-17 16:52 ?806次閱讀

    英偉Blackwell芯片量產加速,Q4預計出貨45萬片

    摩根士丹利最新發布的報告揭示了英偉在AI芯片領域的重大進展,其最新力作Blackwell芯片已成功步入量產階段,預示著英偉有望在今年第四
    的頭像 發表于 09-27 15:02 ?1131次閱讀

    英偉Blackwell GPU量產加速,Q4營收沖刺百億美元大關

    近日,全球領先的圖形處理單元(GPU)及人工智能芯片制造商英偉傳來重大利好消息。據摩根士丹利最新發布的行業分析報告指出,英偉基于
    的頭像 發表于 09-26 15:58 ?558次閱讀

    英偉Blackwell可支持10萬億參數模型AI訓練,實時大語言模型推理

    。 ????????????????????? 英偉Blackwell是通用計算全棧矩陣的終極解決方案,由多個英偉芯片組成,包括
    的頭像 發表于 09-04 09:10 ?3556次閱讀

    英偉Blackwell架構揭秘:下一個AI計算里程碑?# 英偉# 英偉Blackwell

    英偉行業資訊
    jf_02331860
    發布于 :2024年08月26日 10:58:09

    英偉Blackwell系列芯片出貨或延期,官方強調生產計劃仍在推進

    8月14日,據多家媒體報道,英偉即將推出的Blackwell系列芯片原計劃在今年內出貨,但目前面臨可能延期的挑戰。針對這一傳聞,英偉達官方迅速作出回應,表示
    的頭像 發表于 08-14 15:03 ?567次閱讀

    英偉回應AI芯片推遲發布傳聞

    近日,英偉就外界廣泛關注的AI芯片Blackwell推遲發布傳聞作出正式回應。8月4日,英偉方面在接受媒體采訪時明確表示:“正如我們之前
    的頭像 發表于 08-05 17:34 ?841次閱讀

    英偉Blackwell芯片已投產,預告未來AI芯片發展

    英偉創始人兼CEO黃仁勛近日宣布,公司旗下的Blackwell芯片已正式投入生產。這款芯片是英偉在AI領域的重要突破,預計將為未來的智能
    的頭像 發表于 06-04 09:23 ?2199次閱讀

    英偉或將推出融合Arm與Blackwell內核的AI PC芯片

    近日,業內傳出英偉正在研發一款全新芯片的傳聞。據悉,這款芯片將結合下一代Arm Cortex CPU內核與英偉自家的Blackwell
    的頭像 發表于 05-31 10:31 ?805次閱讀