女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA MGX變革AI工廠設計與部署

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 2025-06-06 15:07 ? 次閱讀

生成式 AI、大語言模型和高性能計算呈指數級增長,這對數據中心基礎設施提出了前所未有的要求。傳統服務器架構難以滿足現代加速計算在功率密度、散熱需求和快速迭代周期方面的要求。

本文介紹了NVIDIA MGX的優勢,這是一種用于加速計算的模塊化參考架構,它正在重新定義企業和云服務提供商構建可擴展 AI 工廠的方式。

為何模塊化架構如今至關重要?

借助 NVIDIA MGX,合作伙伴可以像搭積木那樣設計多種系統,從而節省開發成本并縮短產品上市時間。NVIDIA MGX 支持多代產品以及數百種 GPU、DPU、CPU、存儲和網絡的組合方案,適用于 AI、HPC 和數字孿生等領域。

當前推動 NVIDIA MGX 廣泛應用的三大趨勢包括:

功率密度與散熱:現代 AI 計算的高要求促使功率密度不斷提高,并推動液冷基礎設施越來越普及。例如,NVIDIA Blackwell GPU 需要單機架功率最高可達 120 千瓦的全機架級解決方案,來滿足由此產生的多項技術要求。MGX 通過液冷匯流排和歧管來滿足這些需求,即使在 1400A 的負載下仍能將冷卻液溫差控制在 15°C 以內,從而能夠在不影響性能或可靠性的情況下實現高密度的機架級部署。

異構工作負載支持:企業需要在同一數據中心內管理日益多樣化的工作負載,包括使用 72-GPU NVIDIA GB200 NVL72 集群的 AI 后訓練、需要測試時擴展的推理任務以及數字孿生模擬。MGX 的模塊化混搭兼容性使企業能夠針對特定工作負載定制基礎設施,而且無需重新設計整個機架。

供應鏈敏捷性:MGX 支持在工廠內預集成約 80% 的組件,包括匯流排、冷板和電源線束。這簡化了構建過程,使 ODM 廠商能夠將部署周期從 12 個月縮短到 90 天以內。

基于這些趨勢,像 MGX 這樣標準化且穩定的架構能夠確保可靠、兼容的服務器部署,使之在不犧牲互操作性的前提下,滿足不斷發展的性能需求。這種穩定性對企業實現基礎設施投資的前瞻性布局至關重要,同時還保留了適應新興工作負載和技術的靈活性。

龐大的 MGX 生態系統讓企業可以靈活地選購多樣化的組件并避免供應商鎖定,這能夠最大限度地降低投資風險、縮短交貨時間并減少不確定性。由于合作伙伴能夠自由地在廣泛的認證組件中進行選擇,MGX 使組織在優化其數據中心構建時能夠降低成本、提高性能和供應鏈彈性。

基于標準的模塊化 MGX 設計簡化了集成過程,消除了對定制解決方案的需求,從而實現了快速、成本可控的部署和更具靈活性的擴展。這種方法不僅加快了上市時間,還簡化了后續維護和升級,使企業能夠根據需求增長和技術發展情況高效地擴展 AI 工廠。

MGX 機架系統內部構造

NVIDIA MGX 機架系統圍繞兩大核心模塊構建:計算托盤和 NVLink 交換機托盤。每個計算托盤都配備了強大的 CPU 和 GPU 組合,例如 NVIDIA Grace CPU 與 NVIDIA Blackwell GPU 的搭配。它們為 AI 訓練、推理和模擬工作負載提供核心加速計算性能。NVLink 交換機托盤則提供高速、低延遲的互連結構,將這些計算托盤連接在一起,實現 GPU 到 GPU 的無縫通信和整個機架的高效擴展。

然而,完整的 MGX 機架系統還遠不止計算和交換機托盤。為了滿足現代 AI 工廠對規模和效率的運行要求,該系統還依賴強大的機械電氣和管道(冷卻)基礎設施,包括:

機械組件:模塊化 MGX 機架本身為高密度數據中心部署提供了所需的結構完整性和可維護性。電源架支架將電源架固定在機架內,而滑軌則便于機架式設備的安裝和維護。

電氣組件:在電力輸送與連接方面,MGX 54V 匯流排和 MGX 1400A 匯流排在整個機架內高效地分配電力,支持 HPC 負載。33 kW 電源架為系統提供充足的電力,而 MGX 電源線束可以靈活地連接電源架和匯流排。MGX 高速電纜保障高速數據傳輸,確保計算托盤和交換機托盤之間保持最優的通信。

管道或冷卻組件:MGX 冷板為 GPU 提供高效液冷,維持其最佳運行溫度。MGX 44RU 歧管用于管理機架內的冷卻液分配。MGX NVQD(NVIDIA 快換接頭)和 MGX UQD(通用快換接頭)等快換接頭實現液冷管線的快速安全連接,簡化維護并最大限度地減少停機時間。

這種模塊化方法可以顯著節省時間,因為標準組件可以在工廠預安裝,并通過即插即用的電源和冷卻裝置在現場集成。

NVIDIA GB200 NVL72 和 GB300 NVL72 系統中的 MGX 組件是基礎架構,用于管理功率密度和熱負載,使這些液冷機架級平臺能夠提供前所未有的 AI 性能。通過將先進的液冷 MGX 架構集成到 Blackwell 計算節點中,NVIDIA 滿足了 GB200 NVL72 的單機架 120 千瓦的能耗需求,而 GB300 NVL72 的 72 個 Blackwell Ultra GPU 則需要更高的散熱協調能力,以實現其高達 50 倍的 AI 推理輸出提升。

這種設計理念需要機械工程團隊(優化冷卻液分配)、電源專家(高效電壓調節)與制造合作伙伴(實現前端可維護性)之間的緊密協作。所有這些都通過 NVIDIA 的芯片級 NVLink 互連技術統一起來,該技術將 36 個 Grace CPU 和 72-144 個 GPU 綁定到一個統一的計算域中。這種聯合設計的解決方案比前代 NVIDIA Hopper 集群的能效提升了 25 倍,展現了 MGX 的系統集成如何將原始算力轉化為可擴展的 AI 基礎設施。

變革 AI 工廠的設計與部署

NVIDIA MGX 為整個數據中心生態系統帶來了切實的好處。

對于系統制造商來說,通過共享參考設計,MGX 使每個平臺的研發成本降低了 200 萬至 400 萬美元,并使團隊能夠一次性認證整個 NVIDIA 軟件棧,其中包括 NVIDIA CUDA-X、NVIDIA AI Enterprise 和 NVIDIA Omniverse。

對于數據中心運營商來說,能夠使用一致的電源和冷卻接口,實現從 8-GPU 節點無縫擴展到 144-GPU 機架,同時由于電源效率高達 94% 且冷卻管道系統可重復使用,總體擁有成本降低了 50%。

對于 AI 工作負載來說,MGX 使各組織能夠利用 NVLink 交換機在 72-GPU 的統一的計算域上訓練參數量高達 1.8 萬億的模型,并在 72 節點機架上部署延遲波動小于 5 毫秒的推理集群。

開始使用

NVIDIA MGX 不僅僅是一項機架標準,更是 AI 工廠時代的基礎。隨著 200 多家生態系統合作伙伴已采用 MGX 組件,企業由此獲得了通往未來 exascale 級 AI 的路徑。隨著 NVIDIA Blackwell、NVIDIA Rubin 等不斷突破計算邊界,MGX 模塊化架構確保了 AI 工廠能夠隨著芯片創新的不斷發展,并通過模塊化升級路徑來保護數據中心投資。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5246

    瀏覽量

    105793
  • 交換機
    +關注

    關注

    21

    文章

    2725

    瀏覽量

    101401
  • 數據中心
    +關注

    關注

    16

    文章

    5146

    瀏覽量

    73219
  • AI
    AI
    +關注

    關注

    87

    文章

    34294

    瀏覽量

    275480

原文標題:NVIDIA MGX 為 AI 工廠奠定堅實的模塊化基礎

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    NVIDIA擴展適用于AI工廠數字孿生的Omniverse Blueprint

    NVIDIA 宣布大幅擴展適用于 AI 工廠數字孿生的 Omniverse Blueprint,為工程團隊提供更多 AI 工廠構建工具,目前
    的頭像 發表于 05-22 09:48 ?212次閱讀

    NVIDIA驅動的AI工廠正在重新定義數據中心

    NVIDIA 及其生態系統合作伙伴正在為 AI 推理時代構建大規模 AI 工廠,而每家企業都將需要一個這樣的工廠
    的頭像 發表于 04-11 11:27 ?375次閱讀
    <b class='flag-5'>NVIDIA</b>驅動的<b class='flag-5'>AI</b><b class='flag-5'>工廠</b>正在重新定義數據中心

    英偉達GTC2025亮點:NVIDIA認證計劃擴展至企業存儲領域,加速AI工廠部署

    ,現在已將企業存儲納入其中,旨在通過加速計算、網絡、軟件和存儲,助力企業更高效地部署 AI 工廠。 在企業構建 AI 工廠的過程中,獲取高質
    的頭像 發表于 03-21 19:38 ?938次閱讀

    NVIDIA推出AI零售購物助手藍圖

    NVIDIA 于近日發布了用于零售購物助手的 NVIDIA AI Blueprint,這個生成式 AI 參考工作流旨在變革網購和實體店購物的
    的頭像 發表于 01-14 11:17 ?527次閱讀

    賴耶科技通過NVIDIA AI Enterprise平臺打造超級AI工廠

    NVIDIA 技術團隊保持合作。賴耶科技通過NVIDIA AI Enterprise平臺打造的超級 AI 工廠,致力于加速大模型場景應用
    的頭像 發表于 11-19 14:55 ?934次閱讀

    NVIDIA與德勤共同部署適用于醫療健康的數字AI智能體

    渥太華醫院使用 NVIDIA AI 驅動的德勤 Frontline AI Teammate 來部署 AI 助手,以提供更好的患者體驗并減輕管
    的頭像 發表于 11-13 11:37 ?712次閱讀

    印度頭部IT企業與NVIDIA合作加速AI采用

    Infosys、TCS、Tech Mahindra 和 Wipro 這四家公司的近 50 萬名開發者和顧問使用 NVIDIA AI Enterprise 軟件設計和部署 AI 智能體,
    的頭像 發表于 10-29 15:08 ?899次閱讀

    NVIDIA助力印度建造AI工廠

    Yotta Data Services、Tata Communications、E2E Networks 和 Netweb 等公司正在開發和提供 NVIDIA 加速的基礎設施和軟件,預計截至今年年末部署量將翻一倍。
    的頭像 發表于 10-29 15:04 ?631次閱讀

    印度制造商使用NVIDIA AI和 Omniverse創建工廠數字孿生

    在印度舉行的 NVIDIA AI Summit 上,多家頭部咨詢伙伴和工業制造商表示正使用 NVIDIA Omniverse 在虛擬環境中整合下一代工廠
    的頭像 發表于 10-27 09:49 ?704次閱讀

    NVIDIA助力印度打造AI基礎設施

    在孟買舉辦的 NVIDIA AI Summit 上,黃仁勛和穆克什·安巴尼(Mukesh Ambani)探討了關于 AI 基礎設施的投資,這些投資有望為各行各業帶來變革
    的頭像 發表于 10-27 09:44 ?527次閱讀

    NVIDIA新增生成式AI就緒系統認證類別

    借助全新的 NVIDIA Spectrum-X Ready 和 NVIDIA IGX 認證,領先的制造業合作伙伴將提供高性能系統,幫助客戶輕松部署 AI
    的頭像 發表于 10-10 09:44 ?684次閱讀

    初創公司SEA.AI利用NVIDIA邊緣AI和計算機視覺技術變革航海安全系統

    總部位于奧地利林茨的初創公司正在利用 NVIDIA 邊緣 AI 和計算機視覺技術變革航海安全系統,讓每一次出海變得更安全。
    的頭像 發表于 09-09 09:32 ?830次閱讀

    NVIDIA RTX AI套件簡化AI驅動的應用開發

    NVIDIA 于近日發布 NVIDIA RTX AI套件,這一工具和 SDK 集合能夠幫助 Windows 應用開發者定制、優化和部署適用于 Windows 應用的
    的頭像 發表于 09-06 14:45 ?788次閱讀

    HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE,加速生成式 AI 變革

    同發布“NVIDIA AI Computing by HPE”。 作為極具開創性的一站式“交鑰匙”私有云人工智能(private-cloud AI)解決方案,NVIDIA
    的頭像 發表于 06-21 14:39 ?603次閱讀

    NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 變革

    作為極具開創性的一站式“交鑰匙”私有云人工智能(private-cloud AI)解決方案,NVIDIA AI Computing by HPE 包含了可持續的加速計算產品組合以及全生命周期服務,將
    的頭像 發表于 06-20 17:36 ?983次閱讀