女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU微架構(gòu)及生態(tài)研究框架(2023)

架構(gòu)師技術(shù)聯(lián)盟 ? 來(lái)源:架構(gòu)師技術(shù)聯(lián)盟 ? 2023-07-09 10:55 ? 次閱讀

GPU的核心競(jìng)爭(zhēng)力在于架構(gòu)等因素決定的性能先進(jìn)性和計(jì)算生態(tài)壁壘。國(guó)內(nèi)GPU廠商紛紛大力投入研發(fā)快速迭代架構(gòu),推動(dòng)產(chǎn)業(yè)開(kāi)放構(gòu)建自主生態(tài),加速追趕全球頭部企業(yè)。國(guó)產(chǎn)替代需求持續(xù)釋放疊加國(guó)際局勢(shì)不確定性加劇,AI&數(shù)據(jù)中心智能汽車、游戲等GPU需求有望高增,國(guó)產(chǎn)GPU迎來(lái)發(fā)展黃金期,我們看好國(guó)產(chǎn)GPU公司的發(fā)展與投資機(jī)遇。

第一,我們從性能和生態(tài)2個(gè)維度構(gòu)建了GPU完整的研究體系。1)性能:決定GPU是否“高效”,其中微架構(gòu)/制程是影響GPU性能的核心要素。2)生態(tài):CUDA構(gòu)筑通用計(jì)算堅(jiān)固壁壘。

第二,提出在評(píng)估GPU性能的指標(biāo)的重要性上:微架構(gòu)、制程、流處理器數(shù)量、核心頻率對(duì)GPU性能影響較大。我們?cè)敿?xì)梳理了GPU的微架構(gòu)、制程、顯存容量/位寬/帶寬/頻率、核心頻率等各類性能參數(shù)及重要性程度,并利用“核心數(shù)*核心頻率*2”公式對(duì)性能算力進(jìn)行量化,揭示可用3DMark、MLPerf 等GPU軟件跑分進(jìn)行相關(guān)性能測(cè)試評(píng)估。

第三,詳細(xì)拆解了NVIDIA Fermi和Hopper兩大典型微架構(gòu)的具體硬件實(shí)現(xiàn),在頂點(diǎn)處理、光柵化計(jì)算、紋理貼圖、像素處理的圖形渲染流水線上對(duì)Fermi架構(gòu)進(jìn)行了拆分;在指令接收、調(diào)度、分配、計(jì)算執(zhí)行的通用計(jì)算流水線上對(duì)Hopper架構(gòu)進(jìn)行了簡(jiǎn)單易懂的描述,并指明更多、更專、更智能等未來(lái)架構(gòu)升級(jí)迭代的方向。

第四,明晰了生態(tài)是構(gòu)建通用計(jì)算壁壘的基石。提出GPU研發(fā)難度在圖形渲染硬件和通用計(jì)算軟件生態(tài)層面,在IP、軟件棧方面研發(fā)門檻較高,需要較長(zhǎng)的積累,先發(fā)者優(yōu)勢(shì)明顯。CUDA生態(tài)從2006年推出至今,經(jīng)過(guò)不斷發(fā)展完善,幾乎已在行業(yè)生態(tài)內(nèi)處于壟斷地位。

第五,深度復(fù)盤Nvidia/AMD(ATI)的產(chǎn)品迭代和競(jìng)爭(zhēng)發(fā)展史,通過(guò)對(duì)NVIDIA長(zhǎng)期保持領(lǐng)先和AMD(ATI)反超進(jìn)行總結(jié)得出結(jié)論:架構(gòu)創(chuàng)新升級(jí)和新興領(lǐng)域前瞻探索是領(lǐng)跑GPU行業(yè)的關(guān)鍵。

第六,梳理和測(cè)算了國(guó)內(nèi)GPU在AI&數(shù)據(jù)中心、智能汽車、游戲行業(yè)的市場(chǎng)空間和發(fā)展趨勢(shì)。

以下為報(bào)告原文,節(jié)選部分內(nèi)容,更多內(nèi)容請(qǐng)參看原報(bào)告“GPU研究框架(2023)”,以及“服務(wù)器基礎(chǔ)知識(shí)全解(終極版)-182頁(yè)P(yáng)PT”,“服務(wù)器基礎(chǔ)知識(shí)全解(終極版)-182頁(yè)P(yáng)DF”。


607bd42c-1ded-11ee-962d-dac502259ad0.png

60c56b32-1ded-11ee-962d-dac502259ad0.png

61e55220-1ded-11ee-962d-dac502259ad0.png

625485e6-1ded-11ee-962d-dac502259ad0.png

62aef526-1ded-11ee-962d-dac502259ad0.png

62d046cc-1ded-11ee-962d-dac502259ad0.png

6329c7e2-1ded-11ee-962d-dac502259ad0.png

63b6c840-1ded-11ee-962d-dac502259ad0.png

641ce6e8-1ded-11ee-962d-dac502259ad0.png

646b5800-1ded-11ee-962d-dac502259ad0.png

64e791ea-1ded-11ee-962d-dac502259ad0.png

6504cbde-1ded-11ee-962d-dac502259ad0.png

65379a5a-1ded-11ee-962d-dac502259ad0.png

656cbc4e-1ded-11ee-962d-dac502259ad0.png

65bd848a-1ded-11ee-962d-dac502259ad0.png

66344444-1ded-11ee-962d-dac502259ad0.png

66acc202-1ded-11ee-962d-dac502259ad0.png

6716a546-1ded-11ee-962d-dac502259ad0.png

6744b7ba-1ded-11ee-962d-dac502259ad0.png

67a659a2-1ded-11ee-962d-dac502259ad0.png

67dee434-1ded-11ee-962d-dac502259ad0.png

680e5462-1ded-11ee-962d-dac502259ad0.png

6874b6b2-1ded-11ee-962d-dac502259ad0.png

690c3212-1ded-11ee-962d-dac502259ad0.png

69814a48-1ded-11ee-962d-dac502259ad0.png

69de2628-1ded-11ee-962d-dac502259ad0.png

6a1329cc-1ded-11ee-962d-dac502259ad0.png

6a7a779e-1ded-11ee-962d-dac502259ad0.png

6b03de8a-1ded-11ee-962d-dac502259ad0.png

6b43685c-1ded-11ee-962d-dac502259ad0.png

6b7dced4-1ded-11ee-962d-dac502259ad0.png

6bc97780-1ded-11ee-962d-dac502259ad0.png

6c2c9a90-1ded-11ee-962d-dac502259ad0.png

6c6d063e-1ded-11ee-962d-dac502259ad0.png

6c89631a-1ded-11ee-962d-dac502259ad0.png

6cc9e322-1ded-11ee-962d-dac502259ad0.png

6d04e76a-1ded-11ee-962d-dac502259ad0.png

6d721326-1ded-11ee-962d-dac502259ad0.png

6de6331e-1ded-11ee-962d-dac502259ad0.png

6e1d5308-1ded-11ee-962d-dac502259ad0.png

6e4ec212-1ded-11ee-962d-dac502259ad0.png

6e983dc0-1ded-11ee-962d-dac502259ad0.png

6eff89d0-1ded-11ee-962d-dac502259ad0.png

6f720e38-1ded-11ee-962d-dac502259ad0.png

6fa62a38-1ded-11ee-962d-dac502259ad0.png

6fe7effe-1ded-11ee-962d-dac502259ad0.png

702e26f4-1ded-11ee-962d-dac502259ad0.png

7058dfca-1ded-11ee-962d-dac502259ad0.png

70d5eff6-1ded-11ee-962d-dac502259ad0.png

70fd79cc-1ded-11ee-962d-dac502259ad0.png

以上內(nèi)容節(jié)選部分內(nèi)容,更多內(nèi)容請(qǐng)參看原報(bào)告“GPU研究框架(2023)”,以及“服務(wù)器基礎(chǔ)知識(shí)全解(終極版)-182頁(yè)P(yáng)PT”,“服務(wù)器基礎(chǔ)知識(shí)全解(終極版)-182頁(yè)P(yáng)DF”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4909

    瀏覽量

    130628
  • 智能汽車
    +關(guān)注

    關(guān)注

    30

    文章

    3049

    瀏覽量

    108162
  • 微架構(gòu)
    +關(guān)注

    關(guān)注

    0

    文章

    22

    瀏覽量

    7150

原文標(biāo)題:GPU微架構(gòu)及生態(tài)研究框架(2023)

文章出處:【微信號(hào):架構(gòu)師技術(shù)聯(lián)盟,微信公眾號(hào):架構(gòu)師技術(shù)聯(lián)盟】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    GPU架構(gòu)深度解析

    GPU架構(gòu)深度解析從圖形處理到通用計(jì)算的進(jìn)化之路圖形處理單元(GPU),作為現(xiàn)代計(jì)算機(jī)中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)展成為強(qiáng)大的并行計(jì)算引擎,廣泛應(yīng)用于人工智能、科學(xué)計(jì)算
    的頭像 發(fā)表于 05-30 10:36 ?93次閱讀
    <b class='flag-5'>GPU</b><b class='flag-5'>架構(gòu)</b>深度解析

    ARM Mali GPU 深度解讀

    ARM Mali GPU 深度解讀 ARM Mali 是 Arm 公司面向移動(dòng)設(shè)備、嵌入式系統(tǒng)和基礎(chǔ)設(shè)施市場(chǎng)設(shè)計(jì)的圖形處理器(GPU)IP 核,憑借其異構(gòu)計(jì)算架構(gòu)、能效優(yōu)化和生態(tài)協(xié)同,
    的頭像 發(fā)表于 05-29 10:12 ?217次閱讀

    iTOP-3588S開(kāi)發(fā)板四核心架構(gòu)GPU內(nèi)置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    性能強(qiáng) iTOP-3588S開(kāi)發(fā)板采用瑞芯RK3588S處理器,是全新一代AloT高端應(yīng)用芯片,搭載八核64位CPU,四核Cortex-A76和四核Cortex-A55架構(gòu)主頻高達(dá)2.4GHZ
    發(fā)表于 05-15 10:36

    iTOP-3588開(kāi)發(fā)板采用瑞芯RK3588處理器四核心架構(gòu)GPU內(nèi)置獨(dú)立NPU強(qiáng)大的視頻編解碼

    架構(gòu),主頻高達(dá)2.4GHz。 四核心架構(gòu)GPU 集成Mali G610 MP4四核GPU、支持OpenGLES 1.1.2.0、 3.2, OpenCL 2.2和Vulkan1.2。帶
    發(fā)表于 04-09 16:09

    微服務(wù)器架構(gòu)幾種典型的基礎(chǔ)框架,你了解嗎?

    SpringCloud、Dubbo、Dropwizard、Akka等是常見(jiàn)微服務(wù)框架。SpringCloud基于SpringBoot,生態(tài)豐富;Dropwizard輕量且繼承SpringBoot優(yōu)點(diǎn)
    的頭像 發(fā)表于 03-04 11:05 ?309次閱讀

    芯原發(fā)布新一代Vitality架構(gòu)GPU IP系列

    芯原股份近日宣布,正式推出全新Vitality架構(gòu)的圖形處理器(GPU)IP系列。這一新一代GPU架構(gòu)以其卓越的計(jì)算性能和廣泛的應(yīng)用領(lǐng)域,吸引了業(yè)界的廣泛關(guān)注。 Vitality
    的頭像 發(fā)表于 12-24 10:55 ?792次閱讀

    《算力芯片 高性能 CPUGPUNPU 架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    在數(shù)據(jù)挖掘工作中,我經(jīng)常需要處理海量數(shù)據(jù)的深度學(xué)習(xí)任務(wù),這讓我對(duì)GPU架構(gòu)和張量運(yùn)算充滿好奇。閱讀《算力芯片》第7-9章,讓我對(duì)這些關(guān)鍵技術(shù)有了全新認(rèn)識(shí)。 GPU架構(gòu)從早期的固定功能流
    發(fā)表于 11-24 17:12

    GPU服務(wù)器AI網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)

    眾所周知,在大型模型訓(xùn)練中,通常采用每臺(tái)服務(wù)器配備多個(gè)GPU的集群架構(gòu)。在上一篇文章《高性能GPU服務(wù)器AI網(wǎng)絡(luò)架構(gòu)(上篇)》中,我們對(duì)GPU
    的頭像 發(fā)表于 11-05 16:20 ?1029次閱讀
    <b class='flag-5'>GPU</b>服務(wù)器AI網(wǎng)絡(luò)<b class='flag-5'>架構(gòu)</b>設(shè)計(jì)

    【「算力芯片 | 高性能 CPU/GPU/NPU 架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU

    每個(gè)CUDA單元在 OpenCL 編程框架中都有對(duì)應(yīng)的單元。 倒金字塔結(jié)構(gòu)GPU存儲(chǔ)體系 共享內(nèi)存是開(kāi)發(fā)者可配置的編程資源,使用門檻較高,編程上需要更多的人工顯式處理。 在并行計(jì)算架構(gòu)中,線程
    發(fā)表于 11-03 12:55

    【「算力芯片 | 高性能 CPU/GPU/NPU 架構(gòu)分析」閱讀體驗(yàn)】--全書概覽

    GPU、NPU,給我們剖析了算力芯片的架構(gòu)。書中有對(duì)芯片方案商處理器的講解,理論聯(lián)系實(shí)際,使讀者能更好理解算力芯片。 全書共11章,由淺入深,較系統(tǒng)全面進(jìn)行講解。下面目錄對(duì)全書內(nèi)容有一個(gè)整體了解
    發(fā)表于 10-15 22:08

    【「大模型時(shí)代的基礎(chǔ)架構(gòu)」閱讀體驗(yàn)】+ 第一、二章學(xué)習(xí)感受

    的專用加速器。 第二章主要介紹了如何通過(guò)軟件控制GPU的計(jì)算單元高效的實(shí)現(xiàn)并行計(jì)算,其中提到CUDA這個(gè)并行計(jì)算開(kāi)發(fā)框架,使用該框架可以很容易的調(diào)用GPU中的海量計(jì)算單元進(jìn)行并行計(jì)算,
    發(fā)表于 10-10 10:36

    指令集架構(gòu)架構(gòu)的區(qū)別

    指令集架構(gòu)(Instruction Set Architecture,ISA)與架構(gòu)(Microarchitecture)是計(jì)算機(jī)體系結(jié)構(gòu)中的兩個(gè)重要概念,它們?cè)谔幚砥鞯脑O(shè)計(jì)和實(shí)現(xiàn)中扮演著不同的角色。以下是對(duì)兩者區(qū)別的詳細(xì)闡述
    的頭像 發(fā)表于 10-05 15:10 ?1043次閱讀

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 架構(gòu)分析

    追求單核心性能轉(zhuǎn)向追求并行度,關(guān)注并研究算力芯片,這個(gè)方向是絕對(duì)沒(méi)錯(cuò)的。這些年作者在自己所工作的量化金融行業(yè)取得的成績(jī)有目共睹,他作為算力芯片的用戶,熟悉芯片產(chǎn)品布局、邏輯單元構(gòu)成、架構(gòu)演變歷程
    發(fā)表于 09-02 10:09

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.41】大模型時(shí)代的基礎(chǔ)架構(gòu):大模型算力中心建設(shè)指南

    基于TOGAF方法論,剖析業(yè)界知名案例的設(shè)計(jì)方案。 全書總計(jì)13章。第1章講解AI與大模型時(shí)代對(duì)基礎(chǔ)架構(gòu)的需求;第2章講解軟件程序與專用硬件的結(jié)合,涉及GPU并行運(yùn)算庫(kù)、機(jī)器學(xué)習(xí)程序的開(kāi)發(fā)框架和分布式AI訓(xùn)練
    發(fā)表于 08-16 18:33

    GPU云服務(wù)器架構(gòu)解析及應(yīng)用優(yōu)勢(shì)

    GPU云服務(wù)器作為一種高性能計(jì)算資源,近年來(lái)在人工智能、大數(shù)據(jù)分析、圖形渲染等領(lǐng)域得到了廣泛應(yīng)用。它結(jié)合了云計(jì)算的靈活性與GPU的強(qiáng)大計(jì)算能力,為企業(yè)和個(gè)人用戶提供了一種高效、便捷的計(jì)算解決方案。下面我們將從架構(gòu)解析和技術(shù)優(yōu)勢(shì)兩
    的頭像 發(fā)表于 08-14 09:43 ?778次閱讀