GPU的核心競(jìng)爭(zhēng)力在于架構(gòu)等因素決定的性能先進(jìn)性和計(jì)算生態(tài)壁壘。國(guó)內(nèi)GPU廠商紛紛大力投入研發(fā)快速迭代架構(gòu),推動(dòng)產(chǎn)業(yè)開(kāi)放構(gòu)建自主生態(tài),加速追趕全球頭部企業(yè)。國(guó)產(chǎn)替代需求持續(xù)釋放疊加國(guó)際局勢(shì)不確定性加劇,AI&數(shù)據(jù)中心、智能汽車、游戲等GPU需求有望高增,國(guó)產(chǎn)GPU迎來(lái)發(fā)展黃金期,我們看好國(guó)產(chǎn)GPU公司的發(fā)展與投資機(jī)遇。
第一,我們從性能和生態(tài)2個(gè)維度構(gòu)建了GPU完整的研究體系。1)性能:決定GPU是否“高效”,其中微架構(gòu)/制程是影響GPU性能的核心要素。2)生態(tài):CUDA構(gòu)筑通用計(jì)算堅(jiān)固壁壘。
第二,提出在評(píng)估GPU性能的指標(biāo)的重要性上:微架構(gòu)、制程、流處理器數(shù)量、核心頻率對(duì)GPU性能影響較大。我們?cè)敿?xì)梳理了GPU的微架構(gòu)、制程、顯存容量/位寬/帶寬/頻率、核心頻率等各類性能參數(shù)及重要性程度,并利用“核心數(shù)*核心頻率*2”公式對(duì)性能算力進(jìn)行量化,揭示可用3DMark、MLPerf 等GPU軟件跑分進(jìn)行相關(guān)性能測(cè)試評(píng)估。
第三,詳細(xì)拆解了NVIDIA Fermi和Hopper兩大典型微架構(gòu)的具體硬件實(shí)現(xiàn),在頂點(diǎn)處理、光柵化計(jì)算、紋理貼圖、像素處理的圖形渲染流水線上對(duì)Fermi架構(gòu)進(jìn)行了拆分;在指令接收、調(diào)度、分配、計(jì)算執(zhí)行的通用計(jì)算流水線上對(duì)Hopper架構(gòu)進(jìn)行了簡(jiǎn)單易懂的描述,并指明更多、更專、更智能等未來(lái)架構(gòu)升級(jí)迭代的方向。
第四,明晰了生態(tài)是構(gòu)建通用計(jì)算壁壘的基石。提出GPU研發(fā)難度在圖形渲染硬件和通用計(jì)算軟件生態(tài)層面,在IP、軟件棧方面研發(fā)門檻較高,需要較長(zhǎng)的積累,先發(fā)者優(yōu)勢(shì)明顯。CUDA生態(tài)從2006年推出至今,經(jīng)過(guò)不斷發(fā)展完善,幾乎已在行業(yè)生態(tài)內(nèi)處于壟斷地位。
第五,深度復(fù)盤Nvidia/AMD(ATI)的產(chǎn)品迭代和競(jìng)爭(zhēng)發(fā)展史,通過(guò)對(duì)NVIDIA長(zhǎng)期保持領(lǐng)先和AMD(ATI)反超進(jìn)行總結(jié)得出結(jié)論:架構(gòu)創(chuàng)新升級(jí)和新興領(lǐng)域前瞻探索是領(lǐng)跑GPU行業(yè)的關(guān)鍵。
第六,梳理和測(cè)算了國(guó)內(nèi)GPU在AI&數(shù)據(jù)中心、智能汽車、游戲行業(yè)的市場(chǎng)空間和發(fā)展趨勢(shì)。
以下為報(bào)告原文,節(jié)選部分內(nèi)容,更多內(nèi)容請(qǐng)參看原報(bào)告“GPU研究框架(2023)”,以及“服務(wù)器基礎(chǔ)知識(shí)全解(終極版)-182頁(yè)P(yáng)PT”,“服務(wù)器基礎(chǔ)知識(shí)全解(終極版)-182頁(yè)P(yáng)DF”。
以上內(nèi)容節(jié)選部分內(nèi)容,更多內(nèi)容請(qǐng)參看原報(bào)告“GPU研究框架(2023)”,以及“服務(wù)器基礎(chǔ)知識(shí)全解(終極版)-182頁(yè)P(yáng)PT”,“服務(wù)器基礎(chǔ)知識(shí)全解(終極版)-182頁(yè)P(yáng)DF”。
-
gpu
+關(guān)注
關(guān)注
28文章
4909瀏覽量
130628 -
智能汽車
+關(guān)注
關(guān)注
30文章
3049瀏覽量
108162 -
微架構(gòu)
+關(guān)注
關(guān)注
0文章
22瀏覽量
7150
原文標(biāo)題:GPU微架構(gòu)及生態(tài)研究框架(2023)
文章出處:【微信號(hào):架構(gòu)師技術(shù)聯(lián)盟,微信公眾號(hào):架構(gòu)師技術(shù)聯(lián)盟】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
GPU架構(gòu)深度解析

ARM Mali GPU 深度解讀
iTOP-3588S開(kāi)發(fā)板四核心架構(gòu)GPU內(nèi)置GPU可以完全兼容0penGLES1.1、2.0和3.2。
iTOP-3588開(kāi)發(fā)板采用瑞芯微RK3588處理器四核心架構(gòu)GPU內(nèi)置獨(dú)立NPU強(qiáng)大的視頻編解碼
微服務(wù)器架構(gòu)幾種典型的基礎(chǔ)框架,你了解嗎?
芯原發(fā)布新一代Vitality架構(gòu)GPU IP系列
《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變
GPU服務(wù)器AI網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)

評(píng)論