電子發燒友網綜合報道 消息稱,NVIDIA正在為中國市場研發一款名為“B30”的降規版AI芯片,這款芯片將首度支持多GPU擴展,允許用戶通過連接多組芯片來打造更高性能的計算集群。B30芯片預計將采用最新的Blackwell架構,使用GDDR7顯存,而非高頻寬內存(HBM),也不會采用臺積電的先進封裝技術。
不少人認為多GPU擴展能力指的是NVLink,但NVIDIA已在其消費級GPU芯片中取消了NVLink支持,因此B30是否支持NVLink目前還不能確定。有消息稱B30芯片的多GPU互聯功能可能基于NVIDIA的ConnectX-8 SuperNICs技術,這一技術曾在Computex 2025上展示,用于連接RTX Pro 6000 GPU。
NVIDIA ConnectX-8 SuperNIC是業內首款在單個設備中集成支持 PCIe Gen6 的交換機和超高速網絡的 SuperNIC。ConnectX-8 專為現代 AI 基礎架構設計,可提供更高的吞吐量,同時簡化系統設計并提高功耗和成本效益。
NVIDIA ConnectX-8 正在重新定義基于 PCIe 的系統的可能性。通過將 PCIe Gen6 交換機和高性能 SuperNIC 集成到單個集成設備中,ConnectX-8 可簡化服務器設計,減少組件數量,并解鎖現代 AI 工作負載所需的高帶寬通信路徑。從而打造更簡單、更節能的平臺,同時降低總體擁有成本 (TCO) 并實現出色的性能可擴展性。
此外,ConnectX-8 SuperNIC 還可在基于多 GPU 的平臺中實現增強的機密計算能力。
B30與H20存在性能差異,主要體現在幾個方面:1、顯存技術差異,H20芯片采用HBM3顯存,帶寬高達4.0TB/s,而B30芯片預計使用GDDR7顯存,帶寬可能降至1.7TB/s左右。HBM3在帶寬和能效比上顯著優于GDDR7,尤其在處理大規模數據集時,H20的顯存性能優勢將更明顯。
2、互聯技術對比:H20支持NVLink技術,卡間互聯帶寬高達900GB/s,適合構建大規模計算集群。B30芯片的多GPU擴展功能可能依賴ConnectX-8 SuperNICs技術,而非NVLink,其互聯帶寬和延遲可能不及H20,在需要低延遲通信的場景中表現可能受限。
3、性能定位差異:H20芯片在FP8和FP16精度下的Tensor Core性能分別為296 TFLOPS和148 TFLOPS,適用于高精度計算任務。B30芯片作為降規版,單芯片算力可能低于H20,但通過多GPU擴展可提升整體性能,適合對成本敏感但需要一定擴展性的應用場景。
4、應用場景適配:H20芯片在垂類模型訓練和推理任務中表現優異,尤其適合需要高帶寬和低延遲的場景。B30芯片則更側重于通過多GPU擴展滿足中小規模計算需求,可能在性價比和靈活性上更具優勢,但單芯片性能可能無法與H20媲美。
與華為昇騰910等國產芯片相比,B30系列在顯存容量上占優,但價格和能效比可能處于劣勢。B30售價預估為6500-8000美元,較H20的1-1.2萬美元降低約40%,但仍高于部分國產芯片。
B30在中國市場的發展面臨挑戰。如技術限制,顯存帶寬和接口簡化導致性能下降,可能無法滿足高端客戶需求,長期來看,技術限制可能削弱NVIDIA在中國市場的競爭力。市場接受度上,中國客戶對性能和成本的平衡較為敏感,B30需通過實際表現證明價值。國產芯片的崛起可能分流部分市場需求,B30需在生態和價格上持續優化。
另外,出口管制政策可能進一步收緊,影響B30的供應鏈和市場份額。中國對自主可控技術的重視可能推動國產芯片替代,B30需應對政策不確定性。
-
HBM
+關注
關注
1文章
408瀏覽量
15121
發布評論請先 登錄
NVIDIA B30芯片的核心解讀
借助NVIDIA技術加速半導體芯片制造
NVIDIA推出NVLink Fusion技術
Sky5? NR MB/HB LNA 前端模塊(B3、B39、B2/25、B34、B1、B66、B40、B30、B41 和 B7) skyworksinc

評論