女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

IMG GPU的幾個(gè)架構(gòu)特色

Dbwd_Imgtec ? 來源:Imagination Tech ? 作者:黃燁鋒 ? 2022-07-28 10:52 ? 次閱讀

隨著HPC應(yīng)用地位的日益攀升,GPU的受關(guān)注程度似乎達(dá)到了新高度。不過現(xiàn)在探討的重點(diǎn),更偏向于GPU在數(shù)據(jù)中心、汽車等設(shè)備之上的應(yīng)用;畢竟手機(jī)、PC之類的消費(fèi)電子產(chǎn)品近半年略有式微之感。不過原本,GPU在更多市場(chǎng)發(fā)揮作用也是當(dāng)前的大趨勢(shì)。

其中比較顯著的一個(gè)議題,就是不只是手機(jī)之類的電池驅(qū)動(dòng)型設(shè)備對(duì)元件功耗、能效有高要求,像數(shù)據(jù)中心這類原本對(duì)芯片功耗沒那么敏感、更偏向高性能的場(chǎng)景,如今也在追求高能效,和算力密度(單位空間內(nèi)所能提供的算力);以及如汽車電動(dòng)化趨勢(shì)之下,“續(xù)航里程焦慮”也讓其中各類組件的功耗、能效變得尤為關(guān)鍵。負(fù)責(zé)圖形乃至通用計(jì)算加速的GPU自然是其中之一;性能和功耗雙方需要進(jìn)一步得到兼顧。

最近Khronos & Imagination技術(shù)研討會(huì)在上海舉辦,主體上還是圍繞Khronos的API標(biāo)準(zhǔn),以及Imagination的GPU IP展開的技術(shù)探討。包括芯動(dòng)科技、芯馳科技等在內(nèi)的下游芯片設(shè)計(jì)企業(yè),以及騰訊、字節(jié)跳動(dòng)等應(yīng)用端企業(yè)也參與了這次活動(dòng)。

我們比較感興趣的是,在應(yīng)對(duì)當(dāng)前GPU發(fā)展趨勢(shì)的過程中,Imagination在技術(shù)層面都做了些什么。本次研討會(huì)的多個(gè)議題實(shí)際上都著力于解答該問題。而Imagination對(duì)GPU架構(gòu)和技術(shù)的呈現(xiàn),也有利于我們進(jìn)一步理解GPU技術(shù)現(xiàn)如今正在發(fā)生怎樣的轉(zhuǎn)變。

市場(chǎng)對(duì)GPU的新需求

Imagination對(duì)于GPU芯片當(dāng)前的市場(chǎng)需求與趨勢(shì)方面的總結(jié)大致上有下面這4點(diǎn):

d5443c6a-0e1f-11ed-ba43-dac502259ad0.png

其一是擴(kuò)展性、彈性(scalability)要求,從手機(jī)這樣的小設(shè)備,到云數(shù)據(jù)中心規(guī)模級(jí)別的算力都覆蓋——如果在芯片架構(gòu)上能夠提供對(duì)應(yīng)的彈性,自然能夠達(dá)成更高的芯片設(shè)計(jì)效率。這似乎也是當(dāng)代幾個(gè)比較主流的GPU供應(yīng)商,在做架構(gòu)設(shè)計(jì)時(shí)普遍考慮的問題。

這其中有一些對(duì)應(yīng)的新技術(shù)和新需求涌現(xiàn),例如chiplet、先進(jìn)封裝。汽車應(yīng)用方向上,則有FuSa功能安全方面的需求——“不管冗余設(shè)計(jì)要求算兩遍,還是某些功能失效后怎么辦的問題,都需要考慮?!?/p>

第二,就是文首提到的能耗比、熱效能、算力密度。不同方向的應(yīng)用當(dāng)前對(duì)“效率”都越來越看重,不同規(guī)模的設(shè)備都開始受到功耗、發(fā)熱等方面的限制。這方面“我們不能單單以制造工藝的進(jìn)步,來主導(dǎo)我們往前走?!?/p>

第三,則在于帶寬方面的限制。主流馮諾依曼體系架構(gòu)中,制約芯片性能的關(guān)鍵在數(shù)據(jù)存取和通信的過程中——這是能耗與熱量開銷的大頭;另外在chiplet之類的新技術(shù)大規(guī)模應(yīng)用之際,chiplet之間的數(shù)據(jù)同步、通信延遲等問題也都需要考慮進(jìn)來。不過實(shí)際上,我們認(rèn)為帶寬問題也可以歸屬到第二點(diǎn)。Imagination將這一點(diǎn)單獨(dú)拿出來談,當(dāng)與其GPU的TBDR架構(gòu)有很大關(guān)系。

第四個(gè)新需求在安全(security)方面。尤其當(dāng)GPU應(yīng)用于云以后,GPU也成為安全鏈上的一環(huán),硬件層面的安全支持也顯得很重要。實(shí)際上像英偉達(dá)這樣的GPU企業(yè),這兩年的GTC上也越來越多地去談信息安全話題,亦能明確這方面的未來趨勢(shì)。

IMGGPU的幾個(gè)架構(gòu)特色

針對(duì)這幾個(gè)問題,Imagination在研討會(huì)上給出了一些“方案”,或者說其PowerVR GPU IP產(chǎn)品現(xiàn)有的一些架構(gòu)特性,是如何去滿足市場(chǎng)需求的。對(duì)PowerVR比較熟的讀者應(yīng)該也都不會(huì)陌生。

首先是針對(duì)架構(gòu)彈性擴(kuò)展的問題,這一直以來都是Imagination的GPU特色:即模塊化、層級(jí)化的方式,通過一種架構(gòu)的彈性化擴(kuò)展,覆蓋從手機(jī)到服務(wù)器市場(chǎng)的各類需求。

d55963a6-0e1f-11ed-ba43-dac502259ad0.png

比如這一代CXT架構(gòu),如上圖中左下的CXT-16-512 RT1(16 Pixels/Clock,512 FP32 FLOPs/Clock,1個(gè)RT核心),規(guī)模可以翻倍達(dá)成填充率、算力等性能成倍提升,直至4倍時(shí)形成單core——在有更高性能要求時(shí)還有多核的MC2-MC8不同規(guī)模版本;從多核再擴(kuò)展到多實(shí)例(multi-instance)——多GPU卡應(yīng)用于服務(wù)器和云市場(chǎng)。

d5767630-0e1f-11ed-ba43-dac502259ad0.png

Imagination表示,在具體設(shè)計(jì)上加上標(biāo)準(zhǔn)NOC片上網(wǎng)絡(luò)技術(shù),這樣的彈性方案也很符合chiplet結(jié)構(gòu)的需求——復(fù)用相同的模塊,將多個(gè)模塊以chiplet的方案封裝到一起,形成更大的GPU。其關(guān)鍵點(diǎn)也在于避免采用過于中心化的邏輯,以及復(fù)雜信號(hào)設(shè)計(jì),而采用相對(duì)松散、去中心化的結(jié)構(gòu),靈活性更好。

這種設(shè)計(jì)也在很多層面帶來了好處,比如說硬件虛擬化、汽車功能安全的冗余設(shè)計(jì),以及各chiplet之間的異步操作等等。

d58935a4-0e1f-11ed-ba43-dac502259ad0.png

其次Imagination談到了tile-based,也就是基于分塊的渲染架構(gòu)在滿足當(dāng)代GPU需求方面的優(yōu)勢(shì)。傳統(tǒng)意義上,基于tile的渲染方式一直是移動(dòng)領(lǐng)域的重要藝能,主要是考慮到移動(dòng)設(shè)備的帶寬、功耗等方面受到的限制都比較大。Imagination、蘋果、Arm高通的GPU方案都是基于tile的渲染方式。

著眼于前文提到不同應(yīng)用市場(chǎng)對(duì)于帶寬、功耗方面的新需求,這種基于tile的渲染方式在移動(dòng)之外的市場(chǎng)也能延續(xù)效率上的顯著優(yōu)勢(shì)。因?yàn)榛趖ile的處理方式,是在對(duì)對(duì)象做sort以后,以tile為單位做處理——如此一來不少處理過程就能在片內(nèi)cache上做,也就提升了能效,降低了功耗;寫出tile更加的"burst effective",對(duì)于cache與內(nèi)存相關(guān)操作更友好。

另外基于tile渲染還有個(gè)優(yōu)勢(shì),按照Imagination的說法,它天然地更適合彈性擴(kuò)展。因?yàn)槊總€(gè)tile都是相對(duì)獨(dú)立的,“也就有利于在多核或多設(shè)備之間分發(fā)這些tile,也有利于達(dá)成性能的線性scaling”。相對(duì)的“傳統(tǒng)IMR(立即渲染模式)以三角形為單位的渲染方式”就無法達(dá)成這樣的效果。

d5999ef8-0e1f-11ed-ba43-dac502259ad0.png

在tile-based基礎(chǔ)上,接下來當(dāng)然就要提到Imagination長(zhǎng)久以來引以為傲的TBDR了,這其實(shí)一直也是Imagination對(duì)自家GPU IP的宣傳點(diǎn),如上圖所示。在流程上同在采用TBDR的廠商主要還有蘋果。藉由所謂的perfect tiling、culling,提升帶寬利用率和整體效率也都算是TBDR的傳統(tǒng)特色了。

當(dāng)然其中有很多細(xì)節(jié),比如說三角形binning精準(zhǔn)地落到對(duì)應(yīng)的tile之上,避免數(shù)據(jù)的overfetch;再比如更高效的場(chǎng)景中被遮擋三角形的拋棄、對(duì)于后面光柵化(rasterization)階段貢獻(xiàn)很低的小型三角形的拋棄等等,對(duì)于縮減帶寬、功耗都是有價(jià)值的。

還有數(shù)據(jù)的硬件壓縮也是縮減帶寬需求的重要組成部分。

d5b2e50c-0e1f-11ed-ba43-dac502259ad0.png

TBDR中的“D”是指“延后”渲染,在流程上和一般的TBR還是有不同。在tiling之后,primitive list和頂點(diǎn)數(shù)據(jù)是有一次寫出的?!皩懗鍪且裻ile list表達(dá)清楚,哪個(gè)三角形在對(duì)應(yīng)的tile區(qū)域內(nèi),在這個(gè)環(huán)節(jié)表達(dá)清楚。在此之后,其他任務(wù)就相對(duì)獨(dú)立,都在tile上面,通過on-chip memory來做HSR消隱等操作?!?/p>

尤其HSR(隱面消除)所在位置,一直都是Imagination這種TBDR結(jié)構(gòu)提升效率的優(yōu)勢(shì)。本質(zhì)也在于盡早拋棄不需要的部分,在后期階段也就節(jié)約了不必要的資源開支。Imagination表示在考慮對(duì)框架做改進(jìn)——在幾何階段,Imagination內(nèi)部正考慮引入新的特性,以其令其更有利于多核GPU的任務(wù)分發(fā),提升并行率;另外對(duì)于需要寫出到系統(tǒng)內(nèi)存的數(shù)據(jù),“我們也在考慮,可以通過壓縮來處理這幾塊buffer的data。”Imagination在主題演講中談到。

d5da5984-0e1f-11ed-ba43-dac502259ad0.png

數(shù)據(jù)壓縮也是節(jié)約帶寬的重要技術(shù)。針對(duì)不同階段、各種數(shù)據(jù)的壓縮,Imagination形容“渲染里面幾乎所有的data,都做壓縮”。包括對(duì)開發(fā)者可見的紋理壓縮以及無需開發(fā)者關(guān)心的幾何壓縮。

還有Imagination花了不少工夫的IMGIC,針對(duì)系統(tǒng)內(nèi)存中render target的讀寫frame buffer image壓縮——應(yīng)當(dāng)是Imagination在發(fā)布B系列GPU的時(shí)候引入的,用于替代此前逐漸不再有優(yōu)勢(shì)的PVRIC。無損和有損壓縮均支持:對(duì)于有損壓縮,據(jù)說能夠在對(duì)質(zhì)量?jī)H有輕微影響的情況下,獲得非常大的壓縮比。

Imagination表示,相比于市面上的競(jìng)爭(zhēng)對(duì)手,其GPU可達(dá)成20-40%的帶寬節(jié)約——上圖的測(cè)試場(chǎng)景和游戲中都有所體現(xiàn)。帶寬需求更低,也就意味著能夠提供更好的持續(xù)性能或者更低的功耗。

d5eb03ec-0e1f-11ed-ba43-dac502259ad0.png

順應(yīng)時(shí)代發(fā)展趨勢(shì),GPU從硬件層面開始注重安全以及虛擬化特性。上面這張圖的例子是當(dāng)GPU應(yīng)用于汽車之時(shí)——當(dāng)代座艙內(nèi)就有好幾塊屏幕,用途各異——它們?cè)谙到y(tǒng)內(nèi)可能會(huì)由同一個(gè)GPU來驅(qū)動(dòng)。那么虛擬化在此就能發(fā)揮作用,包括從操作系統(tǒng)層級(jí)來做性能負(fù)載的分配。

還有負(fù)載的安全和隔離——比如儀表盤、導(dǎo)航、娛樂系統(tǒng)都跑在一個(gè)GPU上,則在某個(gè)系統(tǒng)崩潰時(shí)不會(huì)影響到儀表盤,即功能安全相關(guān)負(fù)載——GPU在此就是將使用場(chǎng)景,在硬件級(jí)上實(shí)現(xiàn)切分。另外在其他一些使用場(chǎng)景上,比如手機(jī)之上,對(duì)應(yīng)的特性就能對(duì)神經(jīng)網(wǎng)絡(luò)加速,和UI特性做到資源均衡分配。當(dāng)然還有在云服務(wù)器上,硬件虛擬化多租戶也是十分必要的特性。

d605efc2-0e1f-11ed-ba43-dac502259ad0.png

最后一個(gè)亮點(diǎn)特性,在于其firmware processor固件處理器上。前年我們細(xì)談Imagination的A系列GPU微架構(gòu)時(shí),就特別談到過當(dāng)時(shí)架構(gòu)改進(jìn)中新增的這個(gè)“固件功能”。這次的研討會(huì)上,固件功能也被當(dāng)作一個(gè)重點(diǎn)做了介紹。

基于其可編程性,這個(gè)processor可以幫助降低主CPU的負(fù)載開銷?!颁秩镜臅r(shí)候,有很多中斷信號(hào)或申請(qǐng)信號(hào),就不需要回到主CPU去,這個(gè)小的CPU也能響應(yīng)。”固件功能也能做到虛擬化隔離,“我們甚至能夠做到每一個(gè)USC給某一個(gè)應(yīng)用來用?!?/p>

另外,不少復(fù)雜調(diào)度、安全、保護(hù)特性需要這樣的固件功能。應(yīng)對(duì)未來的新需求,自然也能通過固件來做調(diào)整。而且其可編程可擴(kuò)展性,就令其很適用于調(diào)試,當(dāng)GPU崩潰時(shí)能夠給出完整的數(shù)據(jù)log。所以這對(duì)于功能安全的錯(cuò)誤分析也就很有幫助。而在上面跑個(gè)debugserver,連接GDB來做debug,就是個(gè)不錯(cuò)的debug工具。

與此同時(shí)“firmware其實(shí)知道GPU里面的不少信息,包括寄存信息、memory信息、當(dāng)前繪制的workload信息——基于此可以和外部設(shè)備做交互。”通過GPIO口進(jìn)行電源管理?!癴irmware處理器知道GPU有多忙,那么我們就能快速高效地,在硬件上原生實(shí)施DVFS機(jī)制?!薄八钥偟膩碚f,在帶寬效率、能耗比以及安全方面,它都能帶來幫助?!?/p>

以光追架構(gòu)為例

如果要用一個(gè)詞來總結(jié)Imagination當(dāng)前做GPU IP的理念的話,應(yīng)該就是“efficiency”(效率)了,所以Imagination才會(huì)在研討會(huì)上反復(fù)強(qiáng)調(diào)能效、算力密度、帶寬效率這些詞。

我們倒是覺得,如果要舉一個(gè)具體的例子的話,則Imagination的光追技術(shù)及架構(gòu)應(yīng)該是能夠代表對(duì)“效率”一詞的貫徹的。不過受限于篇幅,最后只能再簡(jiǎn)單談一談。

d638c03c-0e1f-11ed-ba43-dac502259ad0.png

Imagination在技術(shù)白皮書里談到過,他們將光追實(shí)現(xiàn)分成了6個(gè)等級(jí),此前我們?cè)敿?xì)撰文探討過。除了L0是早年各自為政的技術(shù)探索、L1是從軟件層面來做光追、L2部分加入硬件專門的支持(ray-box與ray-triangle相交處理問題),L3往后實(shí)則是我們現(xiàn)在普遍理解中的光線追蹤技術(shù)。

L2、L3把光線遍歷、追蹤和監(jiān)控算法通過專門的硬件來實(shí)現(xiàn),在性能和效率上有了成倍提升。關(guān)鍵是這里的L4:Imagination認(rèn)為L(zhǎng)4是要在L3硬件實(shí)現(xiàn)的基礎(chǔ)上,給BVH(bounding volume hierarchy,層次包圍體)處理再加個(gè)“Coherency Sorting”。

因?yàn)樵贗magination看來,要在對(duì)功耗非常敏感的移動(dòng)平臺(tái)上實(shí)踐光線追蹤,還需要更進(jìn)一步提升效率??紤]光線穿過BVH有不同的路徑,需要頻繁進(jìn)行內(nèi)存訪問,不同路徑又與不同三角形相交加重了shader的工作量。所以這里coherency sorting的意義在于對(duì)具有相干性的光線進(jìn)行sorting——比如某些材質(zhì)反射同方向光線做分組,來達(dá)成更高的數(shù)據(jù)復(fù)用、提升并行ALU管線利用率。

在Imagination看來,coherency sorting之于光線追蹤,就相當(dāng)于tile-based rendering對(duì)于GPU效率的意義。這一點(diǎn)實(shí)則是能夠看出Imagination在GPU IP上對(duì)“efficiency”一詞的貫徹的。

d647fff2-0e1f-11ed-ba43-dac502259ad0.png

上面這張圖是Imagination當(dāng)前光追的硬件實(shí)現(xiàn):一個(gè)RAC光追單元簇,由以上這些主要的單元模塊構(gòu)成。光追L4實(shí)現(xiàn)就在其中的PCG(packet coherency gathering)單元上:它會(huì)對(duì)所有活躍光線做分析,然后對(duì)“相干”光線做分組。

這也是Imagination眼中,未來手機(jī)這類功耗受限的設(shè)備上實(shí)現(xiàn)光追的必行之策。而且這個(gè)特性是不需要開發(fā)者去關(guān)心的。

Imagination表示,相比于市面上的其他解決方案,這種光追架構(gòu)能夠在光追負(fù)載上最多達(dá)成2.5倍的效率領(lǐng)先。

d667799a-0e1f-11ed-ba43-dac502259ad0.png

另外,前文提到的各種技術(shù)特性實(shí)則都能在Imagination的光追架構(gòu)上有所體現(xiàn)。比如彈性擴(kuò)展方案:此處GPU的基本單元是其中的SPU。RAC作為光追單元簇也是包含其中,并可做擴(kuò)展的——兩個(gè)ALU引擎共享一個(gè)RAC。而SPU本身也包含了其他完整的固定功能單元。

Imagination在推行高能效GPU一事上的思路還是相當(dāng)清晰的,雖說研討會(huì)上談到的不少技術(shù)仍有偏向自家架構(gòu)和技術(shù)的意思,不過大方向的確沒錯(cuò)。即不只是手機(jī)這樣的移動(dòng)設(shè)備,包括PC、汽車、數(shù)據(jù)中心、云等不同規(guī)模GPU算力需求的設(shè)備和應(yīng)用場(chǎng)景都會(huì)越來越看重效率——不管是帶寬效率、算力密度還是整體能效比。

這就要求在架構(gòu)層面有可擴(kuò)展的彈性設(shè)計(jì)、各種能夠節(jié)約帶寬資源和提升效率的技術(shù),再加上符合現(xiàn)代GPU發(fā)展需求的新特性:如安全、虛擬化。不管達(dá)成這些目標(biāo)的具體技術(shù)是不是基于tile的、延后渲染的,或者各類數(shù)據(jù)壓縮方案,未來市場(chǎng)對(duì)GPU的技術(shù)需求都將是如此。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    52249

    瀏覽量

    436810
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4915

    瀏覽量

    130714
  • 架構(gòu)
    +關(guān)注

    關(guān)注

    1

    文章

    528

    瀏覽量

    25870

原文標(biāo)題:從手機(jī)到云,如果GPU都需要能效,那架構(gòu)該長(zhǎng)什么樣?

文章出處:【微信號(hào):Imgtec,微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    GPU架構(gòu)深度解析

    GPU架構(gòu)深度解析從圖形處理到通用計(jì)算的進(jìn)化之路圖形處理單元(GPU),作為現(xiàn)代計(jì)算機(jī)中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)展成為強(qiáng)大的并行計(jì)算引擎,廣泛應(yīng)用于人工智能、科學(xué)計(jì)算
    的頭像 發(fā)表于 05-30 10:36 ?157次閱讀
    <b class='flag-5'>GPU</b><b class='flag-5'>架構(gòu)</b>深度解析

    ARM Mali GPU 深度解讀

    ARM Mali GPU 深度解讀 ARM Mali 是 Arm 公司面向移動(dòng)設(shè)備、嵌入式系統(tǒng)和基礎(chǔ)設(shè)施市場(chǎng)設(shè)計(jì)的圖形處理器(GPU)IP 核,憑借其異構(gòu)計(jì)算架構(gòu)、能效優(yōu)化和生態(tài)協(xié)同,成為全球移動(dòng)
    的頭像 發(fā)表于 05-29 10:12 ?432次閱讀

    iTOP-3588S開發(fā)板四核心架構(gòu)GPU內(nèi)置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    ,8GB內(nèi)存,32GBEMMC。 四核心架構(gòu)GPU內(nèi)置GPU可以完全兼容0penGLES1.1、2.0和3.2。 內(nèi)置NPU RK3588S內(nèi)置NPU,支持INT4/INT8/INT16/FP16混合運(yùn)算
    發(fā)表于 05-15 10:36

    芯原發(fā)布新一代Vitality架構(gòu)GPU IP系列

    芯原股份近日宣布,正式推出全新Vitality架構(gòu)的圖形處理器(GPU)IP系列。這一新一代GPU架構(gòu)以其卓越的計(jì)算性能和廣泛的應(yīng)用領(lǐng)域,吸引了業(yè)界的廣泛關(guān)注。 Vitality
    的頭像 發(fā)表于 12-24 10:55 ?835次閱讀

    芯原推出新一代高性能Vitality架構(gòu)GPU IP系列

    芯原股份(芯原,股票代碼:688521.SH)今日宣布推出全新Vitality架構(gòu)的圖形處理器(GPU)IP系列,具備高性能計(jì)算能力,廣泛適用于云游戲、AI PC、獨(dú)立顯卡和集成顯卡等應(yīng)用領(lǐng)域。 芯
    的頭像 發(fā)表于 12-19 15:55 ?434次閱讀

    芯原發(fā)布全新Vitality架構(gòu)GPU IP系列

    芯原股份(芯原,股票代碼:688521.SH)今日宣布推出全新Vitality架構(gòu)的圖形處理器(GPU)IP系列,具備高性能計(jì)算能力,廣泛適用于云游戲、AI PC、獨(dú)立顯卡和集成顯卡等應(yīng)用領(lǐng)域。
    的頭像 發(fā)表于 12-19 15:26 ?779次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    和不支持的NVIDIA GPU硬件,如支持的有L40S、RTX 5000 Ada Gen等,不支持的如Kepler和Maxwell部分型號(hào)被標(biāo)記為棄用。同時(shí)提到GPU計(jì)算要求64位計(jì)算機(jī)架構(gòu),不同代
    發(fā)表于 12-16 14:25

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    在數(shù)據(jù)挖掘工作中,我經(jīng)常需要處理海量數(shù)據(jù)的深度學(xué)習(xí)任務(wù),這讓我對(duì)GPU架構(gòu)和張量運(yùn)算充滿好奇。閱讀《算力芯片》第7-9章,讓我對(duì)這些關(guān)鍵技術(shù)有了全新認(rèn)識(shí)。 GPU架構(gòu)從早期的固定功能流
    發(fā)表于 11-24 17:12

    GPU服務(wù)器AI網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)

    眾所周知,在大型模型訓(xùn)練中,通常采用每臺(tái)服務(wù)器配備多個(gè)GPU的集群架構(gòu)。在上一篇文章《高性能GPU服務(wù)器AI網(wǎng)絡(luò)架構(gòu)(上篇)》中,我們對(duì)GPU
    的頭像 發(fā)表于 11-05 16:20 ?1096次閱讀
    <b class='flag-5'>GPU</b>服務(wù)器AI網(wǎng)絡(luò)<b class='flag-5'>架構(gòu)</b>設(shè)計(jì)

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU

    本篇閱讀學(xué)習(xí)第七、八章,了解GPU架構(gòu)演進(jìn)及CPGPU存儲(chǔ)體系與線程管理 █從圖形到計(jì)算的GPU架構(gòu)演進(jìn) GPU圖像計(jì)算發(fā)展 ●從三角形開始
    發(fā)表于 11-03 12:55

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書概覽

    GPU、NPU,給我們剖析了算力芯片的微架構(gòu)。書中有對(duì)芯片方案商處理器的講解,理論聯(lián)系實(shí)際,使讀者能更好理解算力芯片。 全書共11章,由淺入深,較系統(tǒng)全面進(jìn)行講解。下面目錄對(duì)全書內(nèi)容有一個(gè)整體了解
    發(fā)表于 10-15 22:08

    【「大模型時(shí)代的基礎(chǔ)架構(gòu)」閱讀體驗(yàn)】+ 未知領(lǐng)域的感受

    ”,好奇于這種大模型算力中心到底是如何建設(shè)的,用什么設(shè)備、什么架構(gòu)建設(shè)的?對(duì)這些問題真是一無所知,甚至都沒有想過,帶著這份好奇開始閱讀。 先瀏覽目錄,共分十三章,目錄中出現(xiàn)最多的就是GPU,比如機(jī)器學(xué)習(xí)
    發(fā)表于 10-08 10:40

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    。本書對(duì)華為等廠商推出的NPU芯片設(shè)計(jì)也做了架構(gòu)描述,中國(guó)也擁有獨(dú)立自主知識(shí)產(chǎn)權(quán)的高算力芯片,并且支持多芯片、高帶寬互連。本書也回顧了近20年來主流的CPU、GPU芯片架構(gòu)的特點(diǎn),介紹了存儲(chǔ)與互連總線技術(shù)
    發(fā)表于 09-02 10:09

    GPU云服務(wù)器架構(gòu)解析及應(yīng)用優(yōu)勢(shì)

    GPU云服務(wù)器作為一種高性能計(jì)算資源,近年來在人工智能、大數(shù)據(jù)分析、圖形渲染等領(lǐng)域得到了廣泛應(yīng)用。它結(jié)合了云計(jì)算的靈活性與GPU的強(qiáng)大計(jì)算能力,為企業(yè)和個(gè)人用戶提供了一種高效、便捷的計(jì)算解決方案。下面我們將從架構(gòu)解析和技術(shù)優(yōu)勢(shì)兩
    的頭像 發(fā)表于 08-14 09:43 ?805次閱讀

    gpu服務(wù)器與cpu服務(wù)器的區(qū)別對(duì)比,終于知道怎么選了!

    gpu服務(wù)器與cpu服務(wù)器的區(qū)別主要體現(xiàn)在架構(gòu)設(shè)計(jì)、性能特點(diǎn)、能耗效率、應(yīng)用場(chǎng)景、市場(chǎng)定位等方面,在以上幾個(gè)方面均存在顯著差異。CPU服務(wù)器更適合數(shù)據(jù)庫管理和企業(yè)應(yīng)用,而GPU服務(wù)器更
    的頭像 發(fā)表于 08-01 11:41 ?934次閱讀