來源:內(nèi)容編譯自theconversation,謝謝。
高性能計(jì)算(簡(jiǎn)稱 HPC)聽起來像是科學(xué)家在秘密實(shí)驗(yàn)室里才會(huì)用到的東西,但它實(shí)際上是當(dāng)今世界上最重要的技術(shù)之一。從預(yù)測(cè)天氣到研發(fā)新藥,甚至訓(xùn)練人工智能,高性能計(jì)算系統(tǒng)都能幫助解決普通計(jì)算機(jī)無法解決的難題或大型問題。
過去40年來,這項(xiàng)技術(shù)助力科學(xué)和工程領(lǐng)域取得了重大發(fā)現(xiàn)。如今,高性能計(jì)算正處于一個(gè)轉(zhuǎn)折點(diǎn),政府、研究人員和科技行業(yè)今天的選擇可能會(huì)影響創(chuàng)新、國(guó)家安全和全球領(lǐng)導(dǎo)力的未來。
高性能計(jì)算系統(tǒng)本質(zhì)上是由數(shù)千甚至數(shù)百萬個(gè)處理器同時(shí)協(xié)同工作的超強(qiáng)計(jì)算機(jī)。它們還使用先進(jìn)的內(nèi)存和存儲(chǔ)系統(tǒng)來快速移動(dòng)和保存大量數(shù)據(jù)。
憑借如此強(qiáng)大的能力,高性能計(jì)算系統(tǒng)可以運(yùn)行極其精細(xì)的模擬和計(jì)算。例如,它們可以模擬新藥如何與人體相互作用,或者颶風(fēng)如何穿越海洋。它們還應(yīng)用于汽車設(shè)計(jì)、能源生產(chǎn)和太空探索等領(lǐng)域。
近年來,高性能計(jì)算因人工智能而變得更加重要。人工智能模型,尤其是用于語音識(shí)別和自動(dòng)駕駛汽車等領(lǐng)域的模型,需要海量的計(jì)算能力進(jìn)行訓(xùn)練。高性能計(jì)算系統(tǒng)非常適合這項(xiàng)工作。因此,人工智能和高性能計(jì)算如今正緊密合作,相互促進(jìn)。
可以明見,高性能計(jì)算系統(tǒng)面臨著比以往任何時(shí)候都更大的壓力,對(duì)系統(tǒng)的速度、數(shù)據(jù)和能耗提出了更高的要求。與此同時(shí),我也看到高性能計(jì)算面臨著一些嚴(yán)峻的技術(shù)問題。
技術(shù)挑戰(zhàn)
高性能計(jì)算面臨的一大挑戰(zhàn)是處理器速度與內(nèi)存系統(tǒng)跟上處理器輸出速度之間的差距。想象一下,你有一輛超快的汽車,但卻堵在路上——如果道路無法承載,速度再快也于事無補(bǔ)。同樣,高性能計(jì)算處理器也經(jīng)常需要等待,因?yàn)閮?nèi)存系統(tǒng)無法足夠快地發(fā)送數(shù)據(jù)。這會(huì)降低整個(gè)系統(tǒng)的效率。
另一個(gè)問題是能源消耗。如今的超級(jí)計(jì)算機(jī)耗電量巨大,有時(shí)甚至相當(dāng)于一個(gè)小鎮(zhèn)的用電量。這不僅成本高昂,而且對(duì)環(huán)境也非常不利。過去,隨著計(jì)算機(jī)部件體積變小,它們的耗電量也隨之減少。但這種被稱為登納德縮放定律的趨勢(shì)在2000年代中期停止了。如今,計(jì)算機(jī)性能的提升通常意味著它們也消耗更多的能源。為了解決這個(gè)問題,研究人員正在尋找新的方法來設(shè)計(jì)高性能計(jì)算系統(tǒng)的硬件和軟件。
芯片的種類也存在問題。芯片行業(yè)主要專注于人工智能,而人工智能在處理 16 位或 8 位等低精度數(shù)學(xué)運(yùn)算時(shí)也能正常工作。但許多科學(xué)應(yīng)用仍然需要 64 位精度才能達(dá)到準(zhǔn)確度。位數(shù)越高,芯片能夠處理的小數(shù)點(diǎn)右側(cè)位數(shù)就越多,精度也就越高。如果芯片公司停止生產(chǎn)科學(xué)家所需的部件,那么進(jìn)行重要的研究可能會(huì)變得更加困難。
本報(bào)告討論了半導(dǎo)體制造和商業(yè)優(yōu)先事項(xiàng)的趨勢(shì)如何與科學(xué)計(jì)算界的需求產(chǎn)生分歧,以及缺乏定制硬件如何阻礙研究進(jìn)展。
一種解決方案可能是構(gòu)建用于高性能計(jì)算的定制芯片,但這既昂貴又復(fù)雜。盡管如此,研究人員仍在探索新的設(shè)計(jì),包括芯片(chiplet,可以像樂高積木一樣組合的小型芯片),以使高精度處理器更加經(jīng)濟(jì)實(shí)惠。
一場(chǎng)全球競(jìng)賽
全球許多國(guó)家正在大力投資高性能計(jì)算。歐洲有“歐洲高性能計(jì)算”(EuroHPC)計(jì)劃,正在芬蘭和意大利等地建造超級(jí)計(jì)算機(jī)。他們的目標(biāo)是減少對(duì)外國(guó)技術(shù)的依賴,并在氣候建模和個(gè)性化醫(yī)療等領(lǐng)域占據(jù)領(lǐng)先地位。日本建造了富岳超級(jí)計(jì)算機(jī),它既支持學(xué)術(shù)研究,也支持工業(yè)生產(chǎn)。中國(guó)也取得了重大進(jìn)展,利用自主研發(fā)的技術(shù)建造了一些世界上速度最快的計(jì)算機(jī)。所有這些國(guó)家的政府都明白,高性能計(jì)算是國(guó)家安全、經(jīng)濟(jì)實(shí)力和科學(xué)領(lǐng)導(dǎo)力的關(guān)鍵。
美國(guó)數(shù)十年來一直是高性能計(jì)算領(lǐng)域的領(lǐng)導(dǎo)者,最近完成了能源部的百億億次計(jì)算項(xiàng)目。該項(xiàng)目研發(fā)的計(jì)算機(jī)每秒可執(zhí)行數(shù)十億億次運(yùn)算。這是一個(gè)令人難以置信的成就。但即使取得了這樣的成功,美國(guó)仍然沒有明確的長(zhǎng)期規(guī)劃。其他國(guó)家正在迅速行動(dòng),如果沒有國(guó)家戰(zhàn)略,美國(guó)可能會(huì)落后。
我認(rèn)為,美國(guó)的國(guó)家戰(zhàn)略應(yīng)該包括資助新機(jī)器并培訓(xùn)人們使用這些機(jī)器。它還應(yīng)包括與大學(xué)、國(guó)家實(shí)驗(yàn)室和私營(yíng)企業(yè)的合作。最重要的是,該計(jì)劃不僅要關(guān)注硬件,還要關(guān)注使高性能計(jì)算變得實(shí)用的軟件和算法。
充滿希望的跡象
量子計(jì)算是未來一個(gè)令人興奮的領(lǐng)域。這是一種基于原子級(jí)物理定律進(jìn)行計(jì)算的全新方式。量子計(jì)算機(jī)有朝一日或許能夠解決普通計(jì)算機(jī)無法解決的問題。但它們?nèi)蕴幱谠缙陔A段,未來很可能是對(duì)傳統(tǒng)高性能計(jì)算系統(tǒng)的補(bǔ)充,而非取代。正因如此,持續(xù)投資這兩種計(jì)算技術(shù)都至關(guān)重要。
好消息是,一些舉措已經(jīng)落地。2022年通過的《芯片與科學(xué)法案》為擴(kuò)大美國(guó)芯片制造規(guī)模提供了資金,并設(shè)立了一個(gè)辦公室,幫助將科學(xué)研究轉(zhuǎn)化為實(shí)際產(chǎn)品。“美國(guó)科學(xué)技術(shù)愿景”工作組于2025年2月25日成立,由美國(guó)科學(xué)促進(jìn)會(huì)首席執(zhí)行官蘇迪普·帕里克領(lǐng)導(dǎo),旨在匯聚非營(yíng)利組織、學(xué)術(shù)界和產(chǎn)業(yè)界的力量,共同指導(dǎo)政府決策。私營(yíng)企業(yè)也在數(shù)據(jù)中心和人工智能基礎(chǔ)設(shè)施上投入了數(shù)十億美元。
這些都是積極的信號(hào),但并不能完全解決如何長(zhǎng)期支持高性能計(jì)算的問題。除了短期資金和基礎(chǔ)設(shè)施投資外,這還意味著:
聯(lián)邦政府長(zhǎng)期投資高性能計(jì)算研發(fā),包括先進(jìn)的硬件、軟件和節(jié)能架構(gòu)。
在國(guó)家實(shí)驗(yàn)室和大學(xué)采購(gòu)和部署領(lǐng)導(dǎo)級(jí)計(jì)算系統(tǒng)。
勞動(dòng)力發(fā)展,包括并行編程、數(shù)值方法和 AI-HPC 集成方面的培訓(xùn)。
硬件路線圖的協(xié)調(diào),確保商業(yè)芯片開發(fā)與科學(xué)和工程應(yīng)用的需求保持一致。
可持續(xù)的融資模式可以防止與一次性里程碑或地緣政治緊急情況相關(guān)的繁榮與蕭條周期。
公私合作彌合學(xué)術(shù)研究、行業(yè)創(chuàng)新和國(guó)家安全需求之間的差距。
高性能計(jì)算不僅僅是指速度更快的計(jì)算機(jī)。它是科學(xué)發(fā)現(xiàn)、經(jīng)濟(jì)增長(zhǎng)和國(guó)家安全的基礎(chǔ)。隨著其他國(guó)家的積極推進(jìn),美國(guó)面臨著制定清晰、協(xié)調(diào)一致的計(jì)劃的壓力。這意味著投資新硬件、開發(fā)更智能的軟件、培訓(xùn)熟練的勞動(dòng)力,并在政府、產(chǎn)業(yè)和學(xué)術(shù)界之間建立合作伙伴關(guān)系。如果美國(guó)能夠做到這一點(diǎn),就能確保高性能計(jì)算在未來幾十年繼續(xù)推動(dòng)創(chuàng)新。
參考鏈接
https://theconversation.com/challenges-to-high-performance-computing-threaten-us-innovation-255188
-
芯片
+關(guān)注
關(guān)注
459文章
52183瀏覽量
436201 -
HPC
+關(guān)注
關(guān)注
0文章
332瀏覽量
24206 -
高性能計(jì)算
+關(guān)注
關(guān)注
0文章
87瀏覽量
13609
發(fā)布評(píng)論請(qǐng)先 登錄
IBM Spectrum LSF如何助力半導(dǎo)體企業(yè)應(yīng)對(duì)AI時(shí)代的高性能芯片需求
羅德與施瓦茨出席AI與高性能計(jì)算服務(wù)器測(cè)試解決方案研討會(huì)
智慧路燈的推廣面臨哪些挑戰(zhàn)?
國(guó)內(nèi)汽車芯片面臨的挑戰(zhàn)及發(fā)展建議

Triton編譯器在高性能計(jì)算中的應(yīng)用
圣誕特輯 |開源芯片系列講座第25期:RISC-V架構(gòu)在高性能領(lǐng)域的進(jìn)展與挑戰(zhàn)

直播預(yù)約 |開源芯片系列講座第25期:RISC-V架構(gòu)在高性能領(lǐng)域的進(jìn)展與挑戰(zhàn)

AI高性能計(jì)算平臺(tái)是什么
邊緣計(jì)算的技術(shù)挑戰(zhàn)與解決方案
名單公布!【書籍評(píng)測(cè)活動(dòng)NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析
帶你了解什么是高性能計(jì)算(HPC)

芯品# 高性能計(jì)算芯片
技術(shù)巔峰!探秘國(guó)內(nèi)高性能模擬芯片的未來發(fā)展

評(píng)論