NVIDIA發(fā)明的具有主動(dòng)電源管理系統(tǒng)的GPU,借助于人工智能技術(shù),在保證性能的前提下提供了更好的可靠性,并且可用于需要高度可靠性的計(jì)算場(chǎng)景中。
3D圖形顯卡在1999年NVIDIA公司推出GeForce 256時(shí)開(kāi)始了其首次變革,這種硬件光影轉(zhuǎn)換技術(shù),極大的提高了計(jì)算機(jī)的圖像顯示性能,對(duì)游戲領(lǐng)域產(chǎn)生了重要的革命意義,同時(shí)也帶給了用戶極高的畫(huà)面真實(shí)感。
當(dāng)前,圖形處理器已經(jīng)無(wú)處不在,GPU不再僅僅用于圖形應(yīng)用,而是被廣泛用于密集計(jì)算操作的應(yīng)用程序,包括人工智能、實(shí)時(shí)識(shí)別和自動(dòng)駕駛等領(lǐng)域中。
就在2020年9月2日凌晨,NVIDIA發(fā)布了RTX30系列顯卡,分別為RTX3070、RTX3080和RTX3090,據(jù)悉,3070的性能比2080更強(qiáng),價(jià)格確更加便宜,3080的性能是2080的兩倍,價(jià)格卻和2080一樣,而3090則支持8K 60幀光線追蹤。
而隨著人工智能芯片的興起,不僅僅是各種人工智能訓(xùn)練需要借助于NVIDIA的圖形顯卡,NVIDIA也在嘗試將人工智能技術(shù)應(yīng)用在GPU圖形處理單元中。在18年,NVIDIA發(fā)布了一款全新的AI芯片,它將價(jià)值10000美元的性能,塞進(jìn)了一個(gè)售價(jià)僅為1299美元的小盒子,30W功耗就可以與1萬(wàn)美元的工作站媲美。
無(wú)疑,這樣的技術(shù)對(duì)于AI芯片的功耗的要求非常高,因此需要電源控制器來(lái)最小化AI芯片的功率。為達(dá)此目的,NVIDIA在2020年2月13日發(fā)明了一項(xiàng)名為“指令和機(jī)器學(xué)習(xí)的能量特征有效地操作處理系統(tǒng)的技術(shù)”的發(fā)明專利(公開(kāi)號(hào):US 2020/0050920 A1),申請(qǐng)人為NVIDIA公司。
根據(jù)該專利目前公開(kāi)的資料,讓我們一起來(lái)看看這項(xiàng)AI芯片的動(dòng)態(tài)功率控制技術(shù)吧。
如上圖,為該專利中發(fā)明的AI芯片中主動(dòng)電源管理控制系統(tǒng)的示意圖,系統(tǒng)100中包含有多個(gè)GPU(102),這些GPU通過(guò)數(shù)字通信總線與其他部件互相通信。在供電方面,這些GPU由配電網(wǎng)110供電,電源管理單元140監(jiān)視著配電網(wǎng)供給的電流,同時(shí)電源管理單元接受由并行處理器116發(fā)送的功率控制指令。
基于GPU當(dāng)前的工作功率以及處理器所發(fā)送的信號(hào),電源管理單元可以預(yù)測(cè)處理器在未來(lái)時(shí)段所需要的電量,并控制提供給GPU的電壓,以便于為GPU提供適當(dāng)?shù)墓β省_@樣不僅可以保證GPU發(fā)揮穩(wěn)定的性能,同時(shí)也可以控制GPU的功耗,更重要的是,通過(guò)預(yù)先在需要高功率的時(shí)段來(lái)限制其功率,可以避免出現(xiàn)電流過(guò)載的情況,否則可能導(dǎo)致電路損壞或者電源過(guò)熱。
由此看來(lái),電源管理模塊的預(yù)測(cè)工作是十分重要的,在NVIDIA的方案中,使用基于硬件的深度學(xué)習(xí)加速器對(duì)于深度神經(jīng)網(wǎng)絡(luò)進(jìn)行加速,從而對(duì)處理器的功耗進(jìn)行預(yù)測(cè)。
如上圖,為預(yù)測(cè)GPU功率的功率控制技術(shù)流程圖,首先,輸入功率監(jiān)視器采用ADC(數(shù)模轉(zhuǎn)換芯片)來(lái)對(duì)于提供給GPU的電源進(jìn)行采樣,采樣包括輸入的電流以及電壓,并將采樣結(jié)果轉(zhuǎn)換為數(shù)字信號(hào)輸出。
其次,并行處理器接收預(yù)測(cè)功率信號(hào)的指令,這樣可以確定預(yù)測(cè)的GPU功率與當(dāng)前功率之間的差值,在確定誤差之前,需要對(duì)預(yù)測(cè)功率進(jìn)行縮放,以使其與當(dāng)前功率處于正常的比例之中。
這種操作基于深度學(xué)習(xí)的方法,來(lái)更新自適應(yīng)PID控制器,因?yàn)椴⑿刑幚砥鞯墓ぷ髫?fù)載可以在短時(shí)間尺度上變化,因此,處理器可以主動(dòng)控制輸入到GPU的電源,并根據(jù)并行處理器中的工作負(fù)載變化來(lái)優(yōu)化處理器的性能和功耗。
如上圖,為這種具有學(xué)習(xí)機(jī)制的實(shí)現(xiàn)主動(dòng)電源管理技術(shù)的電路示意圖,其中電路400包括ADC(118)、濾波和縮放器電路420、狀態(tài)向量寄存器430、PID控制器440、電壓控制器450以及學(xué)習(xí)系統(tǒng)460。
該專利中特別提及,雖然處理器可以通過(guò)對(duì)于指令進(jìn)行解析,來(lái)估計(jì)是否需要更高或者更小的功率,但是處理器可能并不知道通過(guò)執(zhí)行這種指定的指令具體需要消耗多少功率。
這就像一個(gè)長(zhǎng)跑運(yùn)動(dòng)員,他可能大概知道在半程馬拉松比賽中可能會(huì)消耗多少卡路里的能量,但是通常無(wú)法預(yù)測(cè)小段路途中的具體卡路里能量消耗,因?yàn)榫唧w的能量消耗與太多的因素關(guān)聯(lián),例如環(huán)境條件、溫度、實(shí)際速度以及自身體重等的變化。
所以,具體的電源使用情況還是取決于處理器的軟件指令的特定順序,盡管處理器可以預(yù)估消耗的功耗,并對(duì)GPU的功率進(jìn)行大致的調(diào)整,但是由于制造工藝以及不同的計(jì)算任務(wù),因此并不能精準(zhǔn)的進(jìn)行功耗控制。
以上就是NVIDIA發(fā)明的基于人工智能的芯片功耗控制系統(tǒng),這種具有主動(dòng)電源管理系統(tǒng)的GPU智能芯片,在保證芯片性能的前提下具有更高的可靠性,因此可用于需要高度可靠性的計(jì)算環(huán)境,例如:數(shù)據(jù)種心、服務(wù)器環(huán)境等。此外,在目前較為火熱的智能駕駛領(lǐng)域中,這種方案不僅可以避免電流因?yàn)樗查g的下降而影響自動(dòng)駕駛的通信信號(hào),而且還可以通過(guò)實(shí)現(xiàn)更快的功率管理響應(yīng)來(lái)改善車輛的功耗消耗。
關(guān)于嘉德
深圳市嘉德知識(shí)產(chǎn)權(quán)服務(wù)有限公司由曾在華為等世界500強(qiáng)企業(yè)工作多年的知識(shí)產(chǎn)權(quán)專家、律師、專利代理人組成,熟悉中歐美知識(shí)產(chǎn)權(quán)法律理論和實(shí)務(wù),在全球知識(shí)產(chǎn)權(quán)申請(qǐng)、布局、訴訟、許可談判、交易、運(yùn)營(yíng)、標(biāo)準(zhǔn)專利協(xié)同創(chuàng)造、專利池建設(shè)、展會(huì)知識(shí)產(chǎn)權(quán)、跨境電商知識(shí)產(chǎn)權(quán)、知識(shí)產(chǎn)權(quán)海關(guān)保護(hù)等方面擁有豐富的經(jīng)驗(yàn)。
責(zé)任編輯:tzh
-
芯片
+關(guān)注
關(guān)注
459文章
52191瀏覽量
436229 -
gpu
+關(guān)注
關(guān)注
28文章
4912瀏覽量
130661 -
AI
+關(guān)注
關(guān)注
87文章
34255瀏覽量
275399 -
人工智能
+關(guān)注
關(guān)注
1804文章
48717瀏覽量
246523
發(fā)布評(píng)論請(qǐng)先 登錄
ip6806芯片的詳細(xì)參數(shù)解析

邊緣AI MPU深度盤(pán)點(diǎn):品牌、型號(hào)與技術(shù)特性全解析
黑芝麻A2000#高階智能駕駛與通用AI計(jì)算芯片詳細(xì)解析

電磁環(huán)境動(dòng)態(tài)監(jiān)測(cè)與分析平臺(tái)軟件全面解析

Nordic新一代旗艦芯片nRF54H20深度解析
住宅IP動(dòng)態(tài)化技術(shù)應(yīng)用解析:對(duì)比數(shù)據(jù)中心IP的三大核心優(yōu)勢(shì)
AI與云端生產(chǎn)力結(jié)合應(yīng)用場(chǎng)景及技術(shù)解析(2025)

ACDC非隔離WD5208高性能離線式PWM控制功率開(kāi)關(guān),深度解析其技術(shù)優(yōu)勢(shì)與應(yīng)用領(lǐng)域

評(píng)論