全球正在掀起一場(chǎng)關(guān)于AI算力的“競(jìng)賽”,越來(lái)越多的智算中心正在加速部署:截止2023年底,國(guó)內(nèi)智算中心項(xiàng)目為128個(gè);與此同時(shí),2024年共有39個(gè)智算中心項(xiàng)目已投產(chǎn)。IDC也預(yù)計(jì):到2026年,中國(guó)智能算力規(guī)模將進(jìn)入每秒十萬(wàn)億億次浮點(diǎn)(ZFLOPS)級(jí)別,達(dá)到1271.4EFLOPS。
在智算中心“如火如荼”的部署之時(shí),如何“制冷”卻是建造與運(yùn)維中不可繞開(kāi)的難題:隨著人工智能服務(wù)器集群所帶來(lái)的高功率散熱挑戰(zhàn)迅速提升,傳統(tǒng)風(fēng)冷散熱所能提供的制冷支持也愈發(fā)“捉襟見(jiàn)肘”,AI智算中心正在上演一場(chǎng)“冰與火之歌。”
綜合考量性能、成本、應(yīng)用場(chǎng)景,智算中心液冷架構(gòu)該怎么選擇?施耐德電氣推出《智算中心液冷架構(gòu)探討》白皮書(shū),為你挑選更適合的智算中心液冷架構(gòu)提供“解題思路”。
Part 01
分析題干·液冷架構(gòu)的關(guān)鍵要素是?
當(dāng)我們談到“液冷架構(gòu)”,我們往往在談什么?其關(guān)鍵要素又是什么?AI 服務(wù)器的液冷方式主要有冷板式液冷和浸沒(méi)式液冷,雖然二者在生態(tài)系統(tǒng)上有些微差異,但卻有著共通的三大要素——
服務(wù)器內(nèi)部的熱捕捉
CDU類(lèi)型
將熱量排至室外環(huán)境的方法
數(shù)據(jù)中心液冷架構(gòu)簡(jiǎn)化視圖
服務(wù)器內(nèi)的熱捕獲簡(jiǎn)單來(lái)說(shuō)就是通過(guò)冷卻液把熱量從IT組件上“抽出來(lái)”,雖然“熱捕獲”這一要素是液冷架構(gòu)的重要組成部分,但后兩個(gè)要素才是真正考察的“重難點(diǎn)”。
Part 02
拆解考點(diǎn)·“種草”的CDU如何選?
考點(diǎn)一:冷卻分配單元(CDU)——
掌握給IT系統(tǒng)分配制冷量的“大權(quán)”,就像“智能空調(diào)管家”。但想挑選一名合適的“管家”并不簡(jiǎn)單,除了溫度控制、流量控制、壓力控制、流體處理、熱交換和隔離這五大基本功能,CDU還有眾多其他具體屬性,細(xì)看下來(lái)實(shí)在讓人焦頭爛額!
此時(shí)我們可以用到“控制變量法”,通過(guò)確定兩大CDU的關(guān)鍵屬性以簡(jiǎn)化決策流程,實(shí)現(xiàn)“公式活用”。
01 熱交換類(lèi)型:
液體-空氣(L2A):“捉住”IT組件中的熱量后,直接排放到數(shù)據(jù)中心的空氣中
液體-液體(L2L):“捉住”IT組件中的熱量后,排放到設(shè)施內(nèi)的水系統(tǒng)“改造”
除了這兩種主流的熱交換類(lèi)型,還有制冷劑-空氣(R2A)、制冷劑-液體(R2L)、液體-制冷劑(L2R)、制冷劑-制冷劑(R2R)等共計(jì)6種熱交換類(lèi)型。
02 CDU的容量和尺寸外形
機(jī)柜內(nèi)安裝式:顧名思義,將CDU安裝在機(jī)柜內(nèi)并為單個(gè)機(jī)柜提供制冷;通常分為20-40kW和40-80kW兩種容量。
落地式:類(lèi)似“中央空調(diào)”為多個(gè)機(jī)柜提供制冷,通常與液冷IT機(jī)柜相鄰;根據(jù)熱交換類(lèi)型的不同,其功率可達(dá)約60 kW或從300 kW到1MW以上不等。
Part 03
拆解考點(diǎn)·把熱量排出去總共分幾步?
考點(diǎn)二:將熱量排至室外——
在“熱量大掃除”后,收集到的余熱該如何處理?在家中,掃出來(lái)的垃圾可以直接扔進(jìn)垃圾桶,但對(duì)于精巧的數(shù)據(jù)中心而言,將熱量排至室外可就沒(méi)那么簡(jiǎn)單了。常見(jiàn)的“解題思路”有3種——
液-氣熱交換:將熱量直排IT機(jī)房的空氣中(閉環(huán)式局部散熱)
液-液熱交換:熱量排到設(shè)施系統(tǒng)現(xiàn)有回路的水中進(jìn)行循環(huán)降溫
設(shè)計(jì)專(zhuān)用散熱系統(tǒng):為智算中心的液冷系統(tǒng)設(shè)計(jì)建設(shè)獨(dú)立散熱系統(tǒng)
液冷架構(gòu)散熱的簡(jiǎn)化視圖
雖然看起來(lái)這三種熱量排放方式效率不同,但其實(shí)它們各有所長(zhǎng),需要根據(jù)不同的數(shù)據(jù)中心液冷改造環(huán)境綜合考慮才能更好地“發(fā)散余熱”。
Part 04
分步求解·舉一反三部署液冷“尖子生”
智算中心的液冷架構(gòu)實(shí)際部署不能僅僅考慮數(shù)據(jù)計(jì)算,還需要統(tǒng)籌考慮現(xiàn)有制冷基礎(chǔ)設(shè)施兼容性、部署規(guī)模、部署速度、能效等實(shí)際要素,舉一反三才能為這道“應(yīng)用題”給出“滿(mǎn)分答卷”。
常見(jiàn)的液冷架構(gòu),包括散熱方法和CDU類(lèi)型
正因如此,在梳理清晰“CDU類(lèi)型”和“將熱量排放到室外”這兩大考點(diǎn)之后,施家通過(guò)排列組合給出了智算中心液冷架構(gòu)業(yè)內(nèi)常見(jiàn)“例題”的“分步求解思路”。
01 先選散熱方法:
又是“液-氣熱交換”、又是“液-液熱交換”、又是新建散熱系統(tǒng),到底什么散熱方法適合我?萬(wàn)變不離其宗,遵循自身對(duì)于改造規(guī)模、成本和效率的綜合需求即可“對(duì)號(hào)入座”——
例如,如果現(xiàn)有機(jī)房規(guī)模較小或需要快速部署液冷架構(gòu),則可以選擇基于現(xiàn)有散熱系統(tǒng)的空氣直排方式;如果需要部署大規(guī)模液冷服務(wù)器,則需要根據(jù)是否擁有冷機(jī)、成本如何等要素再考慮是否新建專(zhuān)用散熱系統(tǒng)。
02 再挑CDU的容量和外形尺寸:
CDU的選擇更加簡(jiǎn)單,總結(jié)起來(lái)便是3個(gè)關(guān)鍵詞:“看速度”“看空間”“看規(guī)模”——機(jī)柜部署需求較少或需要更高部署速度時(shí),機(jī)柜內(nèi)安裝式CDU更佳;IT機(jī)柜內(nèi)空間相對(duì)不足或部署數(shù)量需求較大,則落地式CDU更是“明智之選”。
兵馬未動(dòng),糧草先行——
人工智能算力競(jìng)爭(zhēng)進(jìn)入白熱化,配套的制冷、管理、可持續(xù)性等“后備”力量至關(guān)重要。憑借在數(shù)據(jù)中心制冷領(lǐng)域多年的經(jīng)驗(yàn)與創(chuàng)新的解決方案,施家有信心并致力于為伙伴提供更加高效、綠色、前瞻性的服務(wù),為AIGC時(shí)代的數(shù)字化基座提供更多先進(jìn)力量。
-
服務(wù)器
+關(guān)注
關(guān)注
13文章
9683瀏覽量
87271 -
人工智能
+關(guān)注
關(guān)注
1804文章
48691瀏覽量
246419 -
施耐德電氣
+關(guān)注
關(guān)注
0文章
202瀏覽量
15713 -
智算中心
+關(guān)注
關(guān)注
0文章
88瀏覽量
1978 -
AIGC
+關(guān)注
關(guān)注
1文章
383瀏覽量
2213
原文標(biāo)題:重磅白皮書(shū)丨AIGC時(shí)代,智算中心的“冰與火之歌”
文章出處:【微信號(hào):施耐德電氣,微信公眾號(hào):施耐德電氣】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
龍芯中科發(fā)布2024年版龍架構(gòu)生態(tài)白皮書(shū)
NVIDIA Blackwell白皮書(shū):NVIDIA Blackwell Architecture Technical Brief
雷曼光電參編的COB顯示屏調(diào)研白皮書(shū)發(fā)布
微軟發(fā)布《GraphRAG實(shí)踐應(yīng)用白皮書(shū)》助力開(kāi)發(fā)者
Omdia與華為共發(fā)布NPS管理白皮書(shū)
全球視野 算領(lǐng)未來(lái),施耐德電氣助力數(shù)據(jù)中心把握智算機(jī)遇

紫光同芯參編《智能底盤(pán)操作系統(tǒng)白皮書(shū)》發(fā)布

華為發(fā)布天線(xiàn)數(shù)字化白皮書(shū)
美通社推出《智能科技行業(yè)媒體概況》白皮書(shū)
中科曙光聯(lián)合發(fā)布《智能算力產(chǎn)業(yè)發(fā)展白皮書(shū)》
IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書(shū)
智能柵極驅(qū)動(dòng)白皮書(shū)
移遠(yuǎn)通信《5G RedCap技術(shù)發(fā)展及應(yīng)用白皮書(shū)》重磅發(fā)布

評(píng)論