近日,2025世界人工智能大會暨人工智能全球治理高級別會議(WAIC 2025)主論壇上,備受矚目的人工智能界“奧斯卡”正式揭曉。由曦智科技、壁仞科技、中興通訊聯(lián)合打造的“分布式OCS全光互連芯片及超節(jié)點應(yīng)用創(chuàng)新方案”,榮膺2025世界人工智能大會最高獎“SAIL獎”(Super Al Leader,卓越人工智能引領(lǐng)者獎)。這也是壁仞科技繼2022年斬獲SAIL獎之后,再度獲此殊榮!
作為人工智能領(lǐng)域國內(nèi)最高規(guī)格的官方獎項,SAIL獎由人工智能領(lǐng)域?qū)W術(shù)界和產(chǎn)業(yè)界權(quán)威專家組成的專業(yè)評委會綜合評選產(chǎn)生。SAIL獎以其“超越”、“賦能”、“創(chuàng)新”、“引領(lǐng)”為主要價值理念,從全球范圍發(fā)掘在人工智能技術(shù)或應(yīng)用上提出重大發(fā)現(xiàn)、方向突破、原始創(chuàng)新,正在或?qū)⒁淖兾磥砩畹膬?yōu)秀項目。
該獎自2018年創(chuàng)辦以來每年評選一次,本屆共收到參評項目超240個,經(jīng)初評、復(fù)評等多輪角逐,最終,光躍LightSphere X——全球首個分布式光互連光交換GPU超節(jié)點解決方案,憑借其突破性原始創(chuàng)新榮膺該獎項,并作為本年度最具代表性的創(chuàng)新項目,成為SAIL四大評價維度(Superior, Application, Innovation, Leading)中“Innovation”(創(chuàng)新)維度的標(biāo)桿案例。
國內(nèi)首個光互連光交換GPU超節(jié)點
光躍LightSphere X正式發(fā)布
近日,在2025世界人工智能大會(WAIC)“智算云啟,共繪生態(tài)”論壇上,上海儀電聯(lián)合曦智科技、壁仞科技、中興通訊,正式發(fā)布國內(nèi)首個光互連光交換GPU超節(jié)點——光躍LightSphere X。該超節(jié)點基于曦智科技全球首創(chuàng)的分布式光交換技術(shù),采用硅光技術(shù)的光互連光交換芯片和壁仞科技自主原創(chuàng)架構(gòu)的大算力通用GPU液冷模組與全新載板互連,并搭載中興通訊高性能AI國產(chǎn)服務(wù)器及儀電智算云平臺軟件,構(gòu)建起高帶寬、低延遲、靈活可擴(kuò)展的自主可控智算集群新范式,即將于上海儀電智算中心落地。
創(chuàng)新技術(shù)直擊算力與網(wǎng)絡(luò)核心痛點
萬億參數(shù)大模型與多模態(tài)訓(xùn)練的崛起,正推動算力集群邁入“萬卡協(xié)同”時代。超節(jié)點架構(gòu)通過深度整合GPU資源,在超節(jié)點內(nèi)構(gòu)建起低延遲、高帶寬的統(tǒng)一算力實體,已成為支撐這一演進(jìn)的關(guān)鍵技術(shù)路徑。
當(dāng)前業(yè)界一種常見方案是通過提升單機(jī)柜功耗來部署更多GPU,但受限于數(shù)據(jù)中心單機(jī)柜的功耗天花板,單機(jī)柜GPU密度提升存在瓶頸。對此,光躍LightSphere X采用光互連技術(shù),通過增加機(jī)柜數(shù)量構(gòu)建超節(jié)點,突破傳統(tǒng)互連方式下超節(jié)點的物理限制。相比銅纜,光纜的遠(yuǎn)距離傳輸優(yōu)勢可實現(xiàn)交付與機(jī)柜解耦,其核心價值在于:突破單機(jī)柜功耗束縛,支持萬卡級彈性擴(kuò)展,兼容現(xiàn)有機(jī)房設(shè)施降低部署成本,并可按算力需求動態(tài)調(diào)整超節(jié)點規(guī)模,實現(xiàn)分階段建設(shè)。
同時,光躍LightSphere X全球首創(chuàng)的分布式光交換(dOCS,distributed Optical Circuit Switch)技術(shù)則進(jìn)一步提升了超節(jié)點的靈活度和系統(tǒng)可擴(kuò)展性,從而達(dá)到提升系統(tǒng)性價比的目的。不同于傳統(tǒng)的集中式交換,其通過在每個GPU上集成光交換功能,較靈活切換GPU間互連拓?fù)浣Y(jié)構(gòu)。這不僅可實現(xiàn)故障場景下的拓?fù)鋵崟r重構(gòu),提高大模型訓(xùn)推性能,降低GPU冗余成本,還能按模型算力需求動態(tài)調(diào)整超節(jié)點規(guī)模,切換拓?fù)渚W(wǎng)絡(luò)。此外,分布式設(shè)計支持GPU高帶寬通訊域彈性擴(kuò)展。光躍LightSphere X將實現(xiàn)2千卡規(guī)模部署。
得益于多計算芯粒(Chiplet)與CoWoS 2.5D封裝協(xié)同設(shè)計的GPU模組,光躍LightSphere X擁有強(qiáng)大算力。該模組基于自主原創(chuàng)架構(gòu)大算力(單卡1P級)通用GPU液冷模組,極大地增強(qiáng)了集群訓(xùn)推性能。通過自主研發(fā)智算云平臺軟件靈活配置超節(jié)點網(wǎng)絡(luò)拓?fù)洌С置芗?a href="http://www.asorrir.com/v/tag/1301/" target="_blank">通信和更大TP&EP,高效適應(yīng)各種大模型需求,大幅提高節(jié)點的可擴(kuò)展性。OCS UBB采用獨創(chuàng)的革新載板設(shè)計,超低損板材多層架構(gòu),互聯(lián)拓?fù)湄S富靈活。該訓(xùn)推一體架構(gòu)可動態(tài)分配計算資源,既滿足千億參數(shù)大模型訓(xùn)練的高吞吐需求,又保障推理任務(wù)的低時延響應(yīng)。
光躍LightSphere X的上層軟件平臺同樣值得關(guān)注。其智算集群統(tǒng)一管理平臺通過深度融合調(diào)度引擎與訓(xùn)推框架,實現(xiàn)了對超節(jié)點全生命周期的智能管控。智算平臺能夠依據(jù)不同模型特征,進(jìn)行超節(jié)點拓?fù)渲悄芘渲茫@著提升訓(xùn)練性能;基于全局資源可觀測體系,實現(xiàn)故障節(jié)點秒級替換與分鐘級斷點續(xù)訓(xùn),保障模型長穩(wěn)運(yùn)行。此外,通過軟硬協(xié)同的系統(tǒng)級工程優(yōu)化,進(jìn)一步釋放了超節(jié)點在性能和效率等方面的綜合潛能。
開放、自主可控生態(tài)打造中國智算基礎(chǔ)設(shè)施新基座
除了單點技術(shù)創(chuàng)新,光躍LightSphere X還進(jìn)一步聚焦構(gòu)建全棧自主的智算生態(tài),為中國算力基礎(chǔ)設(shè)施筑牢根基,為中國人工智能發(fā)展提供強(qiáng)勁動力。
硬件層開放兼容:光交換技術(shù)不依賴于特定的數(shù)據(jù)傳輸協(xié)議,可無縫兼容不同廠商使用的互連協(xié)議,消除生態(tài)鎖閉風(fēng)險;
突破核心器件與供應(yīng)鏈瓶頸:分布式光交換芯片基于硅光技術(shù),其設(shè)計與制造不依賴于先進(jìn)半導(dǎo)體工藝節(jié)點;
全棧軟件自主:自研統(tǒng)一管理平臺實現(xiàn)從調(diào)度、容災(zāi)到優(yōu)化的全鏈路管控。
這套“開放協(xié)議+自主技術(shù)+自研軟件”的協(xié)同體系,真正實現(xiàn)了從技術(shù)到生態(tài)的自主可控閉環(huán)。
上海儀電表示,光躍LightSphere X依托上海儀電算力底座,集合國內(nèi)智算領(lǐng)域頭部企業(yè),共建了“光芯片—GPU—服務(wù)器—算力集群-智算云平臺”閉環(huán),打造了開放共享的光電融合算力生態(tài)體系。未來,光躍LightSphere X將作為新一代智算集群核心架構(gòu),支撐全棧自主可控的國產(chǎn)算力池建設(shè),助力中國AI算力基礎(chǔ)設(shè)施實現(xiàn)跨代發(fā)展。
關(guān)于上海儀電
上海儀電(集團(tuán))有限公司前身是上海市儀表電訊工業(yè)局,是上海市國資委所屬的產(chǎn)業(yè)發(fā)展類集團(tuán),以及上海市公共算力服務(wù)平臺核心建設(shè)單位和智算自主可控國產(chǎn)軟硬件生態(tài)“鏈主”企業(yè)。有力支撐本市大模型戰(zhàn)略用戶和重點企業(yè)的創(chuàng)新發(fā)展,正加快從算力基礎(chǔ)設(shè)施供給向智算云綜合服務(wù)轉(zhuǎn)型,致力于成為國內(nèi)領(lǐng)先的智算云服務(wù)商。
關(guān)于曦智科技
全球領(lǐng)先的光電混合算力提供商,在集成光電領(lǐng)域具備開創(chuàng)性技術(shù)和全球頂尖的集成電路技術(shù)研發(fā)團(tuán)隊,致力于在計算需求爆發(fā)的時代,為客戶提供一系列算力躍遷解決方案,與合作伙伴共建更智能、更可持續(xù)的世界。
關(guān)于壁仞科技
國產(chǎn)GPU領(lǐng)軍企業(yè),致力于研發(fā)高性能通用GPU,打造自主原創(chuàng)的高性能GPU軟硬件體系,構(gòu)建國產(chǎn)智能計算產(chǎn)業(yè)生態(tài)。首代壁仞通用GPU產(chǎn)品基于原創(chuàng)訓(xùn)推一體芯片架構(gòu),已在多地智算中心落地。壁仞科技實現(xiàn)中國首個四種及以上異構(gòu)芯片混訓(xùn)技術(shù)落地,突破了算力孤島難題。合作伙伴包括中興通訊、中國移動、中國電信、上海人工智能實驗室等。
關(guān)于中興通訊
全球領(lǐng)先的綜合信息與通信技術(shù)解決方案提供商,用創(chuàng)新的技術(shù)與產(chǎn)品解決方案,服務(wù)于全球電信運(yùn)營商、政企客戶和消費者。致力于成為網(wǎng)絡(luò)連接和智能算力的領(lǐng)導(dǎo)者,全力塑造智算基礎(chǔ)設(shè)施開放解耦生態(tài),推動國產(chǎn)化智算發(fā)展。
-
gpu
+關(guān)注
關(guān)注
28文章
4967瀏覽量
131633 -
人工智能
+關(guān)注
關(guān)注
1809文章
49151瀏覽量
250564 -
壁仞科技
+關(guān)注
關(guān)注
1文章
70瀏覽量
3200
原文標(biāo)題:再獲WAIC最高獎!壁仞科技聯(lián)合三方發(fā)布“國內(nèi)首個光互連光交換GPU超節(jié)點方案”引領(lǐng)技術(shù)革新
文章出處:【微信號:Birentech,微信公眾號:壁仞科技Birentech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
澎峰科技亮相2025世界人工智能大會
聯(lián)想三大超級智能體亮相WAIC 2025
墨芯人工智能WAIC 2025現(xiàn)場直擊
中興通訊榮獲WAIC 2025卓越人工智能引領(lǐng)者獎
壁仞科技亮相2025世界人工智能大會
上海儀電聯(lián)合曦智科技、壁仞科技、中興通訊發(fā)布國內(nèi)首個光互連光交換GPU超節(jié)點——光躍LightSphere X

評論