女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種基于分布式光交換的高帶寬域架構InfiniteHBD

曦智科技 ? 來源:曦智科技 ? 2025-06-09 10:38 ? 次閱讀

曦智科技聯合北京大學、階躍星辰為下一代萬億參數大模型訓練的基礎設施建設提出全新解決方案。

隨著大模型參數規模的擴大,分布式訓練成為人工智能發展的核心途徑。分布式訓練可以將模型數據分配給多個計算節點,進行并行計算和數據管理,從而顯著加速模型訓練的過程,而高帶寬域(High Bandwidht Domain, HBD)的設計對提升模型算力利用率至關重要。

然而,現有的HBD架構在可擴展性、成本和容錯能力等方面存在根本性限制:

交換機中心的HBD(如NVIDIA NVL72)成本高昂、不易擴展規模。

以以AI 加速器(包括GPU 與專用ASIC)為中心的HBD(如Google TPUv3和Tesla Dojo)存在嚴重的故障傳播問題。

2022 年Google發布TPU v4 集群,首次采用光交換方案(Optical Circuit Switch,以下簡稱“OCS”),這種交換機-GPU混合的HBD在互連成本與系統擴展性之間采取了折中方案,但仍存在故障爆炸半徑問題,其成本和容錯能力仍不甚理想。

70f2da02-41b9-11f0-b715-92fbcf53809c.jpg

在此背景下,曦智科技聯手北京大學、階躍星辰的研究團隊提出了一種以光交換(OCS)模組為中心的高帶寬域架構InfiniteHBD,通過在光電轉換模組中集成OCS能力,InfiniteHBD實現了動態可重構的單點對多點連接,具備節點級故障隔離和低資源碎片化的能力。

InfiniteHBD在可擴展性和成本上全面優于現有方案:InfiniteHBD的單位成本僅為NVL72的31%,GPU冗余率比NVL72和TPUv4低一個數量級,且與NVIDIA DGX(單機8卡)相比,模型算力利用率最高提升3.37 倍。

該方案以論文形式被國際通信網絡領域頂級會議SIGCOMM 2025[1]接收。

曦智科技在集成硅光領域擁有十余年的產業經驗,在InfiniteHBD 方案中,創新性的開發了基于硅光子技術的分布式光交換dOCS(distributed Optical Circuit Switch),將基于馬赫曾德(MZI,Mach-Zehnder Interferometer)交換矩陣的光交換芯片集成到商用QSFP-DD 800Gbps光電轉換模組中,大幅簡化了器件結構的同時,有效提升了器件集成度,從而降低了成本和功耗,顯著提升了InfiniteHBD 的性價比和系統可擴展性。

715fa696-41b9-11f0-b715-92fbcf53809c.png

分布式光交換方案對于建設超大規模訓練集群具有以下收益:

dOCS自帶光電轉換,提供交換能力的同時可形成跨機超節點;

光交換芯片采用成熟制程,降低了對于先進制程電交換芯片的依賴;

光交換芯片對協議不敏感,適用于當前GPU連接協議碎片化的現狀

InfiniteHBD為高帶寬域架構的高效擴展提供了新的解決方案,為下一代萬億參數大模型訓練的基礎設施建設帶來了重要啟示。 注釋: [1]SIGCOMM,Special Interest Group on Data Communication,即數據通信專業組,是ACM(美國計算機協會)組織在通信網絡領域的旗艦會議。今年的SIGCOMM 將于9 月8日-11日在葡萄牙科英布拉舉行。

關于曦智科技

曦智科技是全球領先的光電混合算力提供商。公司憑借在集成光子領域的開創性技術和全球頂尖的集成電路技術研發團隊,致力于在計算需求爆發的時代,為客戶提供一系列算力躍遷解決方案,與客戶共建更智能、更可持續的世界。曦智科技從光子矩陣計算(oMAC)、片上光網絡(oNOC)和片間光網絡(oNET)三大核心技術出發,打造光子計算和光子網絡兩大產品線,與大數據、云計算、金融、自動駕駛、生物醫藥、材料研究等領域客戶開展緊密合作,持續為客戶提供更具創造性的高效算力支撐。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 加速器
    +關注

    關注

    2

    文章

    824

    瀏覽量

    38940
  • 算力
    +關注

    關注

    2

    文章

    1150

    瀏覽量

    15465
  • 大模型
    +關注

    關注

    2

    文章

    3035

    瀏覽量

    3840

原文標題:曦科技|基于分布式光交換高帶寬域InfiniteHBD:破局超節點擴展瓶頸

文章出處:【微信號:曦智科技,微信公眾號:曦智科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    分布式伏電力問題層出不窮?安科瑞分布式伏運維系統來“救場”

    分布式伏電力運維,痛點大揭秘? ? 分布式伏作為實現綠色能源轉型的關鍵環,近年來在我國
    的頭像 發表于 05-07 17:14 ?175次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏電力問題層出不窮?安科瑞<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏運維系統來“救場”

    分布式伏發運維系統實際應用案例分享

    和可持續發展的重要推動力量。國家能源局于2025年1月發布了《分布式伏發電開發建設管理辦法》,對分布式伏的分類、上網模式、備案管理、電網接入等進行了詳細規定,未來
    的頭像 發表于 04-09 14:46 ?228次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏發運維系統實際應用案例分享

    分布式伏運維困境如何破?安科瑞伏運維云平臺來支招

    分布式伏的發展與現狀 ? 在全球積極推進清潔能源轉型的大背景下,分布式伏作為一種綠色、高
    的頭像 發表于 03-24 14:38 ?312次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏運維困境如何破?安科瑞<b class='flag-5'>光</b>伏運維云平臺來支招

    分布式伏如何實現防逆流?

    分布式伏如何實現防逆流
    的頭像 發表于 03-24 13:31 ?213次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏如何實現防逆流?

    淺談分布式伏系統在工業企業的設計及應用

    主要對工業廠區屋頂分布式伏發電系統的設計及應用進行研究,為工業廠區能源供應提供一種全新的解決思路和技術支持。介紹了工業廠區屋頂分布式伏系
    的頭像 發表于 03-21 14:24 ?361次閱讀
    淺談<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏系統在工業企業的設計及應用

    分布式伏如何重塑社區能源生態

    1概述 ? ? ? ?分布式伏系統是一種伏發電設備分散安裝在用戶側或負荷中心附近的發電系統。與集中式伏電站不同,
    的頭像 發表于 03-17 14:17 ?271次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏如何重塑社區能源生態

    基于ptp的分布式系統設計

    。 PTP概述 PTP是一種網絡時間同步協議,它允許網絡中的設備同步它們的時鐘。PTP基于IEEE 1588標準,旨在提供亞微秒級別的時間同步精度。PTP通過在網絡中傳播時間信息,并使用這些信息來校正本地時鐘,從而實現精確的時間同步。 系統架構 基于PTP的
    的頭像 發表于 12-29 10:09 ?470次閱讀

    分布式控及SOA架構車身功能測試方案

    北匯信息推出分布式控以及SOA架構的車身功能測試解決方案,支持在實驗室環境下完成車身單部件、系統級功能自動化測試,可以極大地提升車身功能的可靠性和穩定性。
    的頭像 發表于 12-27 09:05 ?2458次閱讀
    <b class='flag-5'>分布式</b>、<b class='flag-5'>域</b>控及SOA<b class='flag-5'>架構</b>車身功能測試方案

    分布式伏監控系統在能源領域中的重要性

    在當今能源領域,分布式伏發電作為一種可持續的能源解決方案正日益普及。而分布式伏監控系統在其中扮演著至關重要的角色,為
    的頭像 發表于 12-09 14:39 ?673次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏監控系統在能源領域中的重要性

    分布式伏為企業帶來哪些便捷!

    伏開發試點方案的通知》中指出:“為加快推進屋頂分布式伏發展,擬在全國組織開展整縣(市、區)推進屋頂分布式伏開發試點工作”?
    的頭像 發表于 11-18 15:34 ?700次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏為企業帶來哪些便捷!

    淺談屋頂分布式伏發電技術的設計與應用

    【摘要】為了緩解城市用電緊張袁降低人們的用電成本,可以在工業園區、辦公樓屋頂等場所應用屋頂分布式伏發電技術進行就近轉換、并網發電袁充分利用建筑物屋頂的太陽資源。概述屋頂分布式伏發電
    的頭像 發表于 11-11 15:10 ?1717次閱讀
    淺談屋頂<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏發電技術的設計與應用

    文講清什么是分布式云化數據庫!

    分布式云化數據庫是一種先進的數據管理系統,它將傳統的數據庫技術與分布式計算、云計算和大數據處理技術相融合。這種數據庫架構旨在提供可用性、
    的頭像 發表于 10-14 10:06 ?437次閱讀

    安科瑞分布式伏監控系統的應用

    隨著“雙碳”目標的提出,開發利用可再生能源已成為必然趨勢。新能源發電作為能源利用的一種重要形式,已經受到越來越多的關注。相對于大容量、電壓、遠距離輸送的集中發電方式,分布式伏具有容
    的頭像 發表于 08-14 08:41 ?536次閱讀
    安科瑞<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏監控系統的應用

    分布式伏發電對低壓電網的影響與對策

    分布式伏發電作為一種新型的能源與能源的綜合利用模式,具有形式靈活、管理與運行成本低廉等優點,在無噪聲、無空氣與水體污染的情況下,具有顯著的環保效益,對于優化能源結構,實現節能減排,具有十分重要
    的頭像 發表于 07-31 09:25 ?1610次閱讀
    <b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏發電對低壓電網的影響與對策

    安科瑞分布式伏系統在某重工企業18MW分布式伏中應用

    2024年7月16日,江蘇省發改委發布《關于高質量做好全省分布式伏接網消納的通知(征求意見稿)》,計劃大力支持分布式伏的發展! 1、未來分布式
    的頭像 發表于 07-19 11:30 ?790次閱讀
    安科瑞<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏系統在某重工企業18MW<b class='flag-5'>分布式</b><b class='flag-5'>光</b>伏中應用