在邊緣計(jì)算、chiplet、人工智能與機(jī)器學(xué)習(xí)、CaaS(計(jì)算即服務(wù))以及可持續(xù)性需求等其他趨勢(shì)的推動(dòng)下,HPC(高性能計(jì)算)正在變得日益重要。
無(wú)論是在嚴(yán)格定義方面,還是在更為重要的應(yīng)用領(lǐng)域和使用方法方面,HPC概念在過(guò)去幾年中均得到了發(fā)展。如今,HPC不再局限于大型數(shù)據(jù)中心、研究實(shí)驗(yàn)室和超級(jí)計(jì)算機(jī),而是被廣泛應(yīng)用在各種行業(yè)中,如產(chǎn)品設(shè)計(jì)、財(cái)務(wù)建模、天氣預(yù)報(bào)等。它為我們所依賴(lài)并樂(lè)享的居家、辦公和汽車(chē)體驗(yàn)帶來(lái)了更加強(qiáng)大的計(jì)算能力,讓各種應(yīng)用更加貼近我們的日常生活。
HPC得以發(fā)展壯大的根本原因可以歸結(jié)為一個(gè)詞:數(shù)據(jù),更具體的來(lái)說(shuō)是因?yàn)槿藗冃枰纫酝斓靥幚怼⒎治龊蛡鬏敻鞣N數(shù)據(jù)。不管是我們居家時(shí)刷短視頻的習(xí)慣,還是日益互聯(lián)的汽車(chē),亦或是我們?cè)谕瓿晒ぷ鳌⒈O(jiān)測(cè)健康狀況或管理財(cái)務(wù)時(shí)所需的大量信息,這些過(guò)程中都會(huì)不斷有數(shù)據(jù)產(chǎn)生、提供和消費(fèi),而HPC便是為這種無(wú)盡的數(shù)據(jù)循環(huán)問(wèn)題而生。
隨著人們對(duì)HPC需求的不斷增加,對(duì)更快、更強(qiáng)、更高效的半導(dǎo)體芯片的需求也在同步增長(zhǎng)。事實(shí)上,盡管芯片業(yè)務(wù)總體上有起有伏,但在HPC領(lǐng)域卻表現(xiàn)出一貫的持續(xù)增長(zhǎng)。
作為HPC背后關(guān)鍵半導(dǎo)體技術(shù)的推動(dòng)者,新思科技對(duì)HPC不斷變化的需求和新的用途有著全面的了解。那么,2023年HPC的前景如何呢?
01
邊緣(分布式)計(jì)算不斷發(fā)展
毫無(wú)疑問(wèn),邊緣計(jì)算是從總體上改變計(jì)算環(huán)境的一個(gè)關(guān)鍵趨勢(shì),但它似乎與傳統(tǒng)HPC恰恰相反。HPC往往與大型集中式計(jì)算和存儲(chǔ)資源相關(guān)聯(lián),而這些資源實(shí)際上是遠(yuǎn)程云計(jì)算的主干。相比之下,邊緣計(jì)算則專(zhuān)注于在網(wǎng)絡(luò)邊緣或附近處理數(shù)據(jù),而不是將數(shù)據(jù)發(fā)送回中心位置。這樣一來(lái),它便可以提供較低的延遲,并且在許多情況下具有更安全的操作特性。
但是,這兩個(gè)領(lǐng)域正在走向融合:邊緣計(jì)算常常也是HPC,只是可能位于傳統(tǒng)數(shù)據(jù)中心之外的其他地方。導(dǎo)致出現(xiàn)這種情況的原因是數(shù)據(jù)的大爆炸。在萬(wàn)物智能需求的推動(dòng)下,邊緣產(chǎn)生的數(shù)據(jù)量在數(shù)量和復(fù)雜性方面呈指數(shù)級(jí)增長(zhǎng)(這其中還包括大量的物聯(lián)網(wǎng)(IoT)設(shè)備)。邊緣計(jì)算的重要性主要體現(xiàn)在延遲和內(nèi)容交付上,因?yàn)椴粩嗤涤谠贫?集中化數(shù)據(jù)中心無(wú)法滿(mǎn)足所需的響應(yīng)時(shí)間。在某些情況下,文件可能太大,無(wú)法發(fā)送到云端進(jìn)行處理甚至存儲(chǔ)。這其中可能包括城市交通管理和相關(guān)的自動(dòng)駕駛系統(tǒng)、精準(zhǔn)醫(yī)療、欺詐檢測(cè)、商業(yè)智能、智慧城市開(kāi)發(fā)等。
我們認(rèn)為,邊緣計(jì)算將對(duì)HPC系統(tǒng)供應(yīng)商、云服務(wù)提供商、網(wǎng)絡(luò)供應(yīng)商和存儲(chǔ)供應(yīng)商產(chǎn)生重大影響,因?yàn)檫@些組織希望將遠(yuǎn)程HPC功能與本地生成和處理的數(shù)據(jù)策略結(jié)合在一起。在此過(guò)程中,我們預(yù)計(jì)還會(huì)看到HPC的物理足跡從集中式交付模型擴(kuò)展到更加分散的分布式模型,其中包含的一些位置靠近那些會(huì)生成大量數(shù)據(jù)的邊緣位置。
從芯片設(shè)計(jì)的角度來(lái)看,盡管邊緣計(jì)算仍要求具有出色的功耗、性能和面積(PPA),但它還要兼顧另一個(gè)關(guān)鍵優(yōu)先事項(xiàng):減少這些設(shè)備在處理和傳輸數(shù)據(jù)時(shí)的延遲。設(shè)計(jì)策略必須優(yōu)先考慮這類(lèi)芯片中的數(shù)據(jù)傳輸速度和效率,例如下面小芯片架構(gòu)中討論的那些芯片。當(dāng)然,芯片設(shè)計(jì)解決方案必須考慮PPA權(quán)衡方案的各個(gè)方面,并提供一些高級(jí)功能來(lái)針對(duì)任何給定的應(yīng)用需求設(shè)計(jì)和分析優(yōu)化的芯片。這其中包括強(qiáng)大的仿真和驗(yàn)證工具、功耗和熱分析功能、設(shè)計(jì)布局的智能實(shí)施,以及一系列關(guān)鍵功能和接口的認(rèn)證IP模塊。未來(lái),從數(shù)據(jù)中心到由電池供電的物聯(lián)網(wǎng)設(shè)備,市場(chǎng)對(duì)能夠降低功耗的設(shè)計(jì)解決方案的需求會(huì)不斷增加。
02
Chiplets走向成熟
HPC的最新趨勢(shì)之一是Multi-Die系統(tǒng)的使用。由于器件的物理特性和制造傳統(tǒng)單體架構(gòu)芯片所面臨的經(jīng)濟(jì)挑戰(zhàn),摩爾定律的加倍效應(yīng)已經(jīng)開(kāi)始放緩。為了應(yīng)對(duì)這一情況,Multi-Die系統(tǒng)得到了高性能計(jì)算領(lǐng)域的青睞。簡(jiǎn)單來(lái)說(shuō),傳統(tǒng)的單個(gè)片上系統(tǒng)(SoC)變得太大,生產(chǎn)成本太高,無(wú)法進(jìn)行先進(jìn)設(shè)計(jì),而且收益風(fēng)險(xiǎn)也會(huì)隨著設(shè)計(jì)尺寸而增加。作為擴(kuò)展摩爾定律PPA優(yōu)勢(shì)的一種可行方式,Multi-Die方案非常具有吸引力。該方案可以提供更強(qiáng)大的處理能力,而又無(wú)需增加芯片面積或功耗。它還支持異質(zhì)混合和匹配方法,可最大限度實(shí)現(xiàn)目標(biāo)應(yīng)用優(yōu)化的工藝技術(shù)。將SoC組件分解,分別制造,然后將這些不同的功能匯集到單個(gè)封裝中,不僅可以減少浪費(fèi),同時(shí)還提供一種方法來(lái)快速打造具有優(yōu)化系統(tǒng)功耗和性能的新產(chǎn)品型號(hào)。
雖然Multi-Die系統(tǒng)已經(jīng)成為HPC發(fā)展的基本推動(dòng)力,但設(shè)計(jì)方法必須不斷發(fā)展以應(yīng)對(duì)新的挑戰(zhàn)。例如,支持高帶寬、低延遲、低功耗和無(wú)差錯(cuò)工作的die-to-die接口對(duì)于快速、可靠的數(shù)據(jù)傳輸至關(guān)重要。而要處理這種Multi-Die方案中的異構(gòu)集成、互連和封裝問(wèn)題,就需要增強(qiáng)的工具、方法和IP。另外,為了推動(dòng)創(chuàng)新和設(shè)計(jì)效率達(dá)到新水平,還必須具備先進(jìn)封裝和硅光子學(xué)等領(lǐng)域的專(zhuān)業(yè)知識(shí)和技術(shù)。
03
人工智能與機(jī)器學(xué)習(xí)方興未艾
另一個(gè)貫穿HPC各個(gè)方面的重要趨勢(shì)是人工智能(AI)和機(jī)器學(xué)習(xí)(ML)的興起。該領(lǐng)域與HPC存在著共生關(guān)系。
一方面,高性能計(jì)算機(jī)需要處理AI工作負(fù)載。在當(dāng)今這個(gè)自動(dòng)化數(shù)據(jù)密集的世界中,AI工作負(fù)載可謂無(wú)處不在。對(duì)于HPC供應(yīng)商來(lái)說(shuō),這是一個(gè)快速增長(zhǎng)的領(lǐng)域,幾乎每個(gè)有計(jì)算需求的地方都存在新的機(jī)遇。但是,為了支持AI工作負(fù)載,計(jì)算平臺(tái)要求底層硬件不斷提高性能,這就給芯片開(kāi)發(fā)者帶來(lái)了持續(xù)創(chuàng)新的壓力。在這里,人工智能本身也發(fā)揮著作用。現(xiàn)在,借助AI設(shè)計(jì)工具,開(kāi)發(fā)者可以?xún)?yōu)化繁瑣或過(guò)于詳盡的任務(wù)(經(jīng)過(guò)訓(xùn)練的AI算法可以很好地接手這些任務(wù)),據(jù)此處理前沿芯片設(shè)計(jì)中的復(fù)雜性和規(guī)模性問(wèn)題。這不僅提高了整體開(kāi)發(fā)效率,還讓開(kāi)發(fā)者可以專(zhuān)注于更加注重創(chuàng)新的工作。
另一方面,HPC依賴(lài)人工智能本身來(lái)高效、安全地運(yùn)行數(shù)據(jù)中心。無(wú)論是監(jiān)控存儲(chǔ)、服務(wù)器和網(wǎng)絡(luò)設(shè)備的健康狀況與安全性,確保配置正確,預(yù)測(cè)設(shè)備故障,還是篩查數(shù)據(jù)來(lái)排查惡意軟件,人工智能為HPC用戶(hù)提供了新的洞察力,并將預(yù)測(cè)性維護(hù)提升到新水平。人工智能還可用于通過(guò)優(yōu)化供暖和冷卻系統(tǒng)來(lái)降低用電量和提高效率,這些是數(shù)據(jù)中心運(yùn)營(yíng)商最關(guān)心的關(guān)鍵可持續(xù)性問(wèn)題(下文會(huì)做更深入的介紹)。
04
HPCaaS得以推進(jìn)
隨著業(yè)務(wù)各個(gè)方面所需的計(jì)算能力大幅增長(zhǎng),各家公司都在積極探索“即服務(wù)”模式的價(jià)值,以滿(mǎn)足其周期性計(jì)算需求。“HPC即服務(wù)”(HPCaaS)便應(yīng)運(yùn)而生。除了峰值工作負(fù)載效率外,此類(lèi)模式還為那些內(nèi)部不具備相關(guān)知識(shí)、資源或基礎(chǔ)設(shè)施來(lái)通過(guò)云技術(shù)使用HPC的公司提供相關(guān)服務(wù)和支持。HPCaaS使得HPC易于部署和擴(kuò)展,并且從成本的角度更加可預(yù)測(cè)。
芯片設(shè)計(jì)領(lǐng)域?qū)υ撃J奖憩F(xiàn)出了極大的興趣,希望能夠通過(guò)它來(lái)獲取執(zhí)行數(shù)據(jù)密集型芯片設(shè)計(jì)任務(wù)所需的計(jì)算資源。由多核架構(gòu)組成的復(fù)雜HPC芯片設(shè)計(jì)便是一個(gè)主要例證。這類(lèi)設(shè)計(jì)在設(shè)計(jì)和開(kāi)發(fā)期間要求具備更高的計(jì)算、存儲(chǔ)和處理能力,并且通常需要并行處理大量數(shù)據(jù),以便實(shí)現(xiàn)設(shè)計(jì)與驗(yàn)證的融合。這種托管模式正在為大型半導(dǎo)體公司和開(kāi)發(fā)高性能的HPC芯片的初創(chuàng)公司所使用。這是一種有趣的共生關(guān)系:HPC的推動(dòng)者也依賴(lài)于HPC能力。
與其他HPCaaS企業(yè)用例一樣,基于云的EDA在芯片開(kāi)發(fā)過(guò)程中提供了可擴(kuò)展性、靈活性、效率和安全性。各家公司可以根據(jù)具體的使用需求、高峰設(shè)計(jì)時(shí)間和分布式工作結(jié)構(gòu)來(lái)調(diào)整HPC的使用,而無(wú)需員工具備專(zhuān)門(mén)的資源管理專(zhuān)業(yè)知識(shí)。所有這些優(yōu)勢(shì)都是建立在性能吞吐量?jī)?yōu)勢(shì)的基礎(chǔ)之上,而這正是EDA工具的一個(gè)關(guān)鍵需求。
05
可持續(xù)發(fā)展成為焦點(diǎn)
隨著HPC的快速發(fā)展,我們?cè)谏钪兄T多方面受益匪淺,但與此同時(shí)我們也為之付出了一些代價(jià),即這些高能耗系統(tǒng)造成的環(huán)境影響。一些專(zhuān)家預(yù)測(cè),到2030年,僅數(shù)據(jù)中心的用電量就將占到全球總用電量的3%至7%。在地方層面上,由于用水和用電量問(wèn)題,許多數(shù)據(jù)中心都遭到人們強(qiáng)烈抵制,甚至出現(xiàn)難以獲得新施工許可的情況。這些大型計(jì)算平臺(tái)的供電和冷卻問(wèn)題已經(jīng)成為可持續(xù)發(fā)展的討論熱點(diǎn),電源使用效率(PUE)和碳排放等指標(biāo)已經(jīng)成了大家首要考慮的問(wèn)題。
通過(guò)可再生能源(水力、太陽(yáng)能、風(fēng)能)為數(shù)據(jù)中心供電的根本性轉(zhuǎn)變正逐漸成為大家的共識(shí)。一些新的方法同樣具有巨大的潛力,例如沉浸冷卻或液冷技術(shù)(包括水下數(shù)據(jù)中心),將數(shù)據(jù)中心消耗的能源和水重新分配并回收用于其他用途(如樓宇供暖),以及在供應(yīng)鏈生態(tài)系統(tǒng)中使用更環(huán)保的組件、材料和制造方法。前文所述的HPCaaS模式本質(zhì)上也是一種更高效地利用資源的方法。
對(duì)于新思科技而言,我們能做的是在芯片級(jí)別提高能耗和散熱效率。例如,通過(guò)使用先進(jìn)的低功耗設(shè)計(jì)方法和功率優(yōu)化的IP核,可以更好地對(duì)HPC芯片設(shè)計(jì)進(jìn)行功耗優(yōu)化,從而降低芯片和整個(gè)系統(tǒng)的總體能耗。
小芯片趨勢(shì)為降低功耗提供了另一個(gè)重要的潛在途徑。對(duì)功耗更為敏感的數(shù)據(jù)傳輸方法(例如高帶寬內(nèi)存(HBM))也可以讓芯片及其支持的系統(tǒng)更加節(jié)能。CXL、UCIe和OCP等標(biāo)準(zhǔn)和開(kāi)源工作也在助力這些目標(biāo)的實(shí)現(xiàn)。
總之,HPC行業(yè)正在不斷發(fā)展壯大,每天都在為我們的生活帶來(lái)新的氣象。但是,這種發(fā)展是一把雙刃劍,因?yàn)樗跒閿?shù)據(jù)創(chuàng)建和消費(fèi)方面帶來(lái)持續(xù)、高效增長(zhǎng)的同時(shí),也可能對(duì)環(huán)境造成有害的影響。應(yīng)對(duì)這些挑戰(zhàn)的解決方案還在不斷改進(jìn)中,新思科技期待發(fā)揮自己的作用,讓HPC保持可持續(xù)、可擴(kuò)展的發(fā)展道路。

? ?
原文標(biāo)題:2023:五大趨勢(shì)引領(lǐng)HPC可持續(xù)發(fā)展
文章出處:【微信公眾號(hào):新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
新思科技
+關(guān)注
關(guān)注
5文章
853瀏覽量
51210
原文標(biāo)題:2023:五大趨勢(shì)引領(lǐng)HPC可持續(xù)發(fā)展
文章出處:【微信號(hào):Synopsys_CN,微信公眾號(hào):新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
施耐德電氣2025年第一季度可持續(xù)發(fā)展成果
發(fā)那科榮獲2025 EcoVadis可持續(xù)發(fā)展金獎(jiǎng)
福田汽車(chē)打造可持續(xù)發(fā)展新標(biāo)桿
恩智浦發(fā)布2024年企業(yè)可持續(xù)發(fā)展報(bào)告
A級(jí)!廣電計(jì)量ESG評(píng)級(jí)實(shí)現(xiàn)“三連升”,領(lǐng)航可持續(xù)發(fā)展新征程

海康威視榮獲2025年EcoVadis可持續(xù)發(fā)展銀牌認(rèn)證
軟通動(dòng)力蟬聯(lián)CSO全球可持續(xù)發(fā)展論壇“首席可持續(xù)發(fā)展官”獎(jiǎng)項(xiàng)
軟通動(dòng)力蟬聯(lián)首席可持續(xù)發(fā)展官
德州儀器分析服務(wù)器電源設(shè)計(jì)中的五大趨勢(shì)

評(píng)論