從大語言模型(LLM)到代理式 AI 推理和物理 AI ,隨著 AI 工作負載的復雜性和規模不斷增加,人們對更快、擴展性更高的計算基礎設施的需求空前強烈。滿足這些需求就要從基礎開始重新思考系統架構。
NVIDIA 正在通過NVIDIA ConnectX-8 SuperNIC升級平臺架構。NVIDIA ConnectX-8 SuperNIC 是業內首款在單個設備中集成PCIe6.0 交換機和超高速網絡的 SuperNIC。ConnectX-8 專為現代 AI 基礎架構設計,可提供更高的吞吐量,同時簡化系統設計,并提高能效和成本效益。
為 PCIe6.0 連接的時代做好準備
在基于 PCIe 連接的平臺中,尤其是配備 8 個或更多 GPU 的平臺,PCIe 交換機對于最大化 GPU 間通信帶寬和實現可擴展的 GPU 拓撲至關重要。現有設計依賴于獨立的 PCIe 交換機,這通常會增加設計復雜性,并可能會限制性能和效率。
ConnectX-8 通過內置的 PCIe6.0 交換機提供 48 通道的 PCIe6.0 連接解決了這一問題。將 GPU 到 GPU 和 GPU 到 NIC 通信整合到單一高性能設備中,消除了對獨立 PCIe 交換機的需求,減少了元器件數量并簡化了主板設計,為 AI 基礎設施打造了更具成本效益、可擴展的架構。
此外,憑借原生 PCIe6.0 支持,ConnectX-8 可滿足新一代 GPU、CPU 和 IO 加速器日益增長的 IO 需求。它使系統架構師能夠設計出向前兼容的平臺,能夠充分享用領先的高吞吐 PCIe6.0 設備的帶寬。
通過 NVIDIA RTX PRO 服務器加速企業工作負載
ConnectX-8 SuperNIC 現已全面投產。 在 COMPUTEX 2025 上,ConnectX-8 被發布用于全球各系統合作伙伴的 NVIDIA RTX PRO 服務器中。
圖 1 比較了兩種服務器架構:采用獨立 PCIe 交換機的傳統設計,以及采用 NVIDIA ConnectX-8 SuperNIC 集成 PCIe6.0 交換機的 NVIDIA RTX PRO 服務器的 優化配置。
圖 1:傳統(左)和與采用 ConnectX-8 SuperNIC 優化(右)服務器設計的比較
在傳統設計中,服務器布局包括 2 個 CPU、8 個 GPU 和 5 個 NIC(包括 4 個 NVIDIA ConnectX-7 NIC 和 1 個 NVIDIA BlueField-3 DPU)。這種配置還需要兩到四個獨立的 PCIe 交換機來實現 GPU 到 GPU 和 GPU 到 NIC 的連接,從而增加復雜性和組件數量。
在優化過的設計中,用 ConnectX-8 SuperNIC 替換掉了專用 PCIe 交換機,將 PCIe6.0 交換和 800 Gb/s 網絡集成在了單一網卡設備中。
它使每個 GPU 的網絡帶寬翻倍,有助于消除 IO 瓶頸,并加快 GPU、NIC 和存儲之間的數據移動速度。因此,此 NVIDIA RTX PRO 服務器平臺可提供高達 2 倍的 NCCL all-to-all 性能,加速在多 GPU 和多節點工作負載中至關重要的集合通信,并提高 AI 工廠的可擴展性。
在圖 1 的基礎上,圖 2 讓我們更深入地了解經過優化設計的服務器架構如何改善三種主要 GPU 通信路徑之間的連接:
GPU 到 GPU 通信跨越兩個 CPU 插座:在傳統設計中,此路徑可能會遇到主機 CPU 和內部插座瓶頸問題,根據 CPU 之間鏈路的利用率不同,可能被限制在 25 GB/s 或更低的速度。相比之下,基于 ConnectX-8 的優化設計可為集群內的所有 GPU 間通信提供高達 每個GPU 50 GB/s 的 IO 帶寬,因為 NCCL 直接通過網絡轉發所有流量。
GPU 到 NIC 通信:在 2:1 的 GPU 到 NIC 配置下,經過優化的架構為每個 GPU 提供 50 GB/s 的帶寬,無論 GPU 或主機系統是 PCIe5.0 或 PCIe6.0。
GPU 到 GPU 通信通過同一 PCIe 交換機:相較 PCIe5.0,配備 PCIe6.0 的系統可將帶寬提高一倍,從而顯著加速同一 PCIe 交換機上的點對點 GPU 傳輸。
圖 2:傳統(左)和與采用 ConnectX-8 SuperNIC 的優化(右)服務器設計的比較,強調了三種關鍵的 GPU 通信路徑
通過將 PCIe 交換直接集成到 SuperNIC 中,ConnectX-8 還簡化了主板設計、改善了氣流并增強了可維護性。這將打造一個更緊湊、更節能、更經濟高效的平臺。在 NVIDIA 參考設計的支持下,這項創新可幫助系統廠商更快地擴展其系統,并提高性能及降低 TCO。
基于 PCIe 總線的 AI 基礎架構的未來
NVIDIA ConnectX-8 正在重新定義基于 PCIe 總線的系統的可能性。通過將 PCIe6.0 交換機和高性能 SuperNIC 集成到單一集成設備中,ConnectX-8 可簡化服務器設計,減少組件數量,并解鎖現代 AI 工作負載所需的高帶寬通信路徑。從而打造更簡單、更節能的平臺,同時降低總體擁有成本(TCO)并實現出色的性能可擴展性。
此外,ConnectX-8 SuperNIC 還可在基于多 GPU 的平臺中實現增強的機密計算能力。
在 COMPUTEX 2025 上,領先的數據中心合作伙伴展示了由內置 NVIDIA ConnectX-8 SuperNIC 的 NVIDIA RTX PRO 服務器所加速的先進 AI 平臺架構。
-
NVIDIA
+關注
關注
14文章
5267瀏覽量
105903 -
總線
+關注
關注
10文章
2955瀏覽量
89446 -
AI
+關注
關注
88文章
34520瀏覽量
276031 -
PCIe
+關注
關注
16文章
1328瀏覽量
84800
原文標題:NVIDIA ConnectX-8 SuperNIC 通過 PCIe6.0 總線升級 AI 平臺架構
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
基于NVIDIA GPU的加速服務 為AI、機器學習和AI工作負載提速
可以安裝NVIDIA許可證服務器嗎?
nVidia許可服務器存在問題
華秋第八屆硬創大賽攜手NVIDIA初創加速計劃,賦能企業發展
RTX刀片服務器實現云渲染密度、效率及可擴展性的飛躍
NVIDIA虛擬工作站新版本可支持RTX服務器
NVIDIA宣布一套用于構建GPU加速ARM服務器的參考設計
NVIDIA公布通過NVIDIA認證系統測試的全球首批加速服務器 企業 AI 使用量倍增
NVIDIA Grace超級芯片為HPC及AI工作負載提速

使用NVIDIA Triton推理服務器來加速AI預測
NVIDIA Blackwell RTX PRO 提供工作站和服務器兩種規格,助力設計師、開發者、數據科學家和創作人員構建代理式

評論