女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU平臺(tái)生態(tài):英偉達(dá)CUDA和AMD ROCm對(duì)比分析

智能計(jì)算芯世界 ? 來(lái)源:架構(gòu)師技術(shù)聯(lián)盟 ? 2023-06-06 14:36 ? 次閱讀

成熟且完善的平臺(tái)生態(tài)是GPU廠(chǎng)商的護(hù)城河。相較于持續(xù)迭代的微架構(gòu)帶來(lái)的技術(shù)壁壘硬實(shí)力,成熟的軟件生態(tài)形成的強(qiáng)大用戶(hù)粘性將在長(zhǎng)時(shí)間內(nèi)塑造GPU廠(chǎng)商的軟實(shí)力。以英偉達(dá)CUDA為例的軟硬件設(shè)計(jì)架構(gòu)提供了硬件的直接訪(fǎng)問(wèn)接口,不必依賴(lài)圖形API映射,降低GPGPU開(kāi)發(fā)者編譯難度,以此實(shí)現(xiàn)高粘性的開(kāi)發(fā)者生態(tài)。目前主流的開(kāi)發(fā)平臺(tái)還包括AMD ROCm以及OpenCL。

CUDA(Compute Unified Device Architectecture),是NVIDIA于2006年推出的通用并行計(jì)算架構(gòu),包含CUDA指令集架構(gòu)(ISA)和GPU內(nèi)部的并行計(jì)算引擎。該架構(gòu)允許開(kāi)發(fā)者使用高級(jí)編程語(yǔ)言(例如C語(yǔ)言)利用GPU硬件的并行計(jì)算能力并對(duì)計(jì)算任務(wù)進(jìn)行分配和管理,CUDA提供了一種比CPU更有效的解決大規(guī)模數(shù)據(jù)計(jì)算問(wèn)題的方案,在深度學(xué)習(xí)訓(xùn)練和推理領(lǐng)域被廣泛使用。

7853142a-042f-11ee-90ce-dac502259ad0.png

CUDA除了是并行計(jì)算架構(gòu)外,還是CPU和GPU協(xié)調(diào)工作的通用語(yǔ)言。在CUDA編程模型中,主要有Host(主機(jī))和Device(設(shè)備)兩個(gè)概念,Host包含CPU和主機(jī)內(nèi)存,Device包含GPU和顯存,兩者之間通過(guò)PCI Express總線(xiàn)進(jìn)行數(shù)據(jù)傳輸。在具體的CUDA實(shí)現(xiàn)中,程序通常劃分為兩部分,在主機(jī)上運(yùn)行的Host代碼和在設(shè)備上運(yùn)行的Device代碼。Host代碼負(fù)責(zé)程序整體的流程控制和數(shù)據(jù)交換,而Device代碼則負(fù)責(zé)執(zhí)行具體的計(jì)算任務(wù)。

一個(gè)完整的CUDA程序是由一系列的設(shè)備端函數(shù)并行部分和主機(jī)端的串行處理部分共同組成的,主機(jī)和設(shè)備通過(guò)這種方式可以高效地協(xié)同工作,實(shí)現(xiàn)GPU的加速計(jì)算。

78655c16-042f-11ee-90ce-dac502259ad0.png

CUDA在Host運(yùn)行的函數(shù)庫(kù)包括了開(kāi)發(fā)庫(kù)(Libraries)、運(yùn)行時(shí)(Runtime)和驅(qū)動(dòng)(Driver)三大部分。其中,Libraries提供了一些常見(jiàn)的數(shù)學(xué)和科學(xué)計(jì)算任務(wù)運(yùn)算庫(kù),Runtime API提供了便捷的應(yīng)用開(kāi)發(fā)接口和運(yùn)行期組件,開(kāi)發(fā)者可以通過(guò)調(diào)用API自動(dòng)管理GPU資源,而Driver API提供了一系列C函數(shù)庫(kù),能更底層、更高效地控制GPU資源,但相應(yīng)的開(kāi)發(fā)者需要手動(dòng)管理模塊編譯等復(fù)雜任務(wù)。

787714ba-042f-11ee-90ce-dac502259ad0.png

CUDA在Device上執(zhí)行的函數(shù)為內(nèi)核函數(shù)(Kernel)通常用于并行計(jì)算和數(shù)據(jù)處理。在Kernel中,并行部分由K個(gè)不同的CUDA線(xiàn)程并行執(zhí)行K次,而有別于普通的C/C++函數(shù)只有1次。每一個(gè)CUDA內(nèi)核都以一個(gè)聲明指定器開(kāi)始,程序員通過(guò)使用內(nèi)置變量__global__為每個(gè)線(xiàn)程提供一個(gè)唯一的全局ID。一組線(xiàn)程被稱(chēng)為CUDA塊(block)。CUDA塊被分組為一個(gè)網(wǎng)格(grid),一個(gè)內(nèi)核以線(xiàn)程塊的網(wǎng)格形式執(zhí)行。每個(gè)CUDA塊由一個(gè)流式多處理器(SM)執(zhí)行,不能遷移到GPU中的其他SM,一個(gè)SM可以運(yùn)行多個(gè)并發(fā)的CUDA塊,取決于CUDA塊所需的資源,每個(gè)內(nèi)核在一個(gè)設(shè)備上執(zhí)行,CUDA支持在一個(gè)設(shè)備上同時(shí)運(yùn)行多個(gè)內(nèi)核。

7881a0e2-042f-11ee-90ce-dac502259ad0.png

788b7edc-042f-11ee-90ce-dac502259ad0.png

豐富而成熟的軟件生態(tài)是CUDA被廣泛使用的關(guān)鍵原因。

(1)編程語(yǔ)言:CUDA從最初的1.0版本僅支持C語(yǔ)言編程,到現(xiàn)在的CUDA 12.0支持C、C++、Fortran、Python等多種編程語(yǔ)言。此外,NVIDIA還支持了如PyCUDA、ltimesh Hybridizer、OpenACC等眾多第三方工具鏈,不斷提升開(kāi)發(fā)者的使用體驗(yàn)。

(2)庫(kù):NVIDIA在CUDA平臺(tái)上提供了名為CUDA-X的集合層,開(kāi)發(fā)人員可以通過(guò)CUDA-X快速部署如cuBLA、NPP、NCCL、cuDNN、TensorRT、OpenCV等多領(lǐng)域常用庫(kù)。

(3)其他:NVIDIA還為CUDA開(kāi)發(fā)人員提供了容器部署流程簡(jiǎn)化以及集群環(huán)境擴(kuò)展應(yīng)用程序的工具,讓?xiě)?yīng)用程序更易加速,使得CUDA技術(shù)能夠適用于更廣泛的領(lǐng)域。

ROCm(Radeon Open Compute Platform)是AMD基于開(kāi)源項(xiàng)目的GPU計(jì)算生態(tài)系統(tǒng),類(lèi)似于NVIDIA的CUDA。ROCm支持多種編程語(yǔ)言、編譯器、庫(kù)和工具,以加速科學(xué)計(jì)算、人工智能機(jī)器學(xué)習(xí)等領(lǐng)域的應(yīng)用。ROCm還支持多種加速器廠(chǎng)商和架構(gòu),提供了開(kāi)放的可移植性和互操作性。

ROCm支持HIP(類(lèi)CUDA)和OpenCL兩種GPU編程模型,可實(shí)現(xiàn)CUDA到ROCm的遷移。最新的ROCm 5.0支持AMD Infinity Hub上的人工智能框架容器,包括TensorFlow 1.x、PyTorch 1.8、MXNet等,同時(shí)改進(jìn)了ROCm庫(kù)和工具的性能和穩(wěn)定性,包括MIOpen、MIVisionX、rocBLAS、rocFFT、rocRAND等。

7897e212-042f-11ee-90ce-dac502259ad0.png

78a13970-042f-11ee-90ce-dac502259ad0.png

OpenCL(Open Compute Language),是面向異構(gòu)系統(tǒng)通用并行編程、可以在多個(gè)平臺(tái)和設(shè)備上運(yùn)行的開(kāi)放標(biāo)準(zhǔn)。OpenCL支持多種編程語(yǔ)言和環(huán)境,并提供豐富的工具來(lái)幫助開(kāi)發(fā)和調(diào)試,可以同時(shí)利用CPU、GPU、DSP等不同類(lèi)型的加速器來(lái)執(zhí)行任務(wù),并支持?jǐn)?shù)據(jù)傳輸和同步。

78b03a1a-042f-11ee-90ce-dac502259ad0.png

78b8f9ca-042f-11ee-90ce-dac502259ad0.png

此外,OpenCL支持細(xì)粒度和粗粒度并行編程模型,可根據(jù)應(yīng)用需求選擇合適模型提高性能和效率。而OpenCL可移植性有限,不同平臺(tái)和設(shè)備的功能支持和性能表現(xiàn)存在一定差異,與CUDA相比缺少?gòu)V泛的社區(qū)支持和成熟的生態(tài)圈。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5557

    瀏覽量

    135847
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4908

    瀏覽量

    130622
  • C語(yǔ)言
    +關(guān)注

    關(guān)注

    180

    文章

    7630

    瀏覽量

    140178
  • CUDA
    +關(guān)注

    關(guān)注

    0

    文章

    122

    瀏覽量

    14049
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3920

    瀏覽量

    93081

原文標(biāo)題:GPU平臺(tái)生態(tài):英偉達(dá)CUDA和AMD ROCm對(duì)比分析

文章出處:【微信號(hào):AI_Architect,微信公眾號(hào):智能計(jì)算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    英偉達(dá)AMD、英特爾GPU產(chǎn)品及優(yōu)勢(shì)匯總

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)隨著人工智能技術(shù)的快速發(fā)展,GPU的市場(chǎng)規(guī)模在全球范圍內(nèi)持續(xù)提升。目前,GPU市場(chǎng)主要由英偉達(dá)AMD和英特爾
    的頭像 發(fā)表于 05-10 00:59 ?6661次閱讀

    軟件生態(tài)上超越CUDA,究竟有多難?

    神壇的,還是圍繞CUDA打造的一系列軟件生態(tài)。 ? 英偉達(dá)——CUDA的絕對(duì)統(tǒng)治 ? 相信對(duì)GPU
    的頭像 發(fā)表于 06-20 00:09 ?4210次閱讀

    打破英偉達(dá)CUDA壁壘?AMD顯卡現(xiàn)在也能無(wú)縫適配CUDA

    電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)一直以來(lái),圍繞CUDA打造的軟件生態(tài),是英偉達(dá)GPU領(lǐng)域最大的護(hù)城河,尤其是隨著目前AI領(lǐng)域的發(fā)展加速,市場(chǎng)
    的頭像 發(fā)表于 07-19 00:16 ?5691次閱讀

    英偉達(dá)發(fā)布新一代 GPU 架構(gòu)圖靈和 GPU 系列 Quadro RTX

    在 8 月 14 日的 SIGGRAPH 2018 大會(huì)上,英偉達(dá) CEO 黃仁勛正式發(fā)布了新一代 GPU 架構(gòu) Turing(圖靈),以及一系列基于圖靈架構(gòu)的 GPU,包括全球首批支
    發(fā)表于 08-15 10:59

    AMD迎頭猛追Intel 全球首發(fā)7nm GPU很威風(fēng)!

    與MI50加速器大幅提升運(yùn)算效能、高速連接、高速傳輸存儲(chǔ)器頻寬,并更新ROCm開(kāi)放軟件平臺(tái),滿(mǎn)足要求最嚴(yán)苛的深度學(xué)習(xí)、高效能運(yùn)算、云端以及渲染等應(yīng)用。資料顯示,AMD發(fā)表AMD Rad
    發(fā)表于 11-20 11:35

    恩智浦S32V/英偉達(dá)DRIVE PX2/TI的TDA4/寒武紀(jì)1M/高通SA8155對(duì)比分析哪個(gè)好?

    恩智浦S32V/英偉達(dá)DRIVE PX2/TI的TDA4/寒武紀(jì)1M/高通SA8155對(duì)比分析哪個(gè)好?
    發(fā)表于 09-30 07:03

    英偉達(dá)DPU的過(guò)“芯”之處

    芯片的路徑”,在一個(gè)是DOCA試圖再一次復(fù)制“CUDAGPU通用化過(guò)程中所起到的開(kāi)創(chuàng)生態(tài)之功”。如果和不久前英偉達(dá)收購(gòu)ARM的消息結(jié)合起來(lái)
    發(fā)表于 03-29 14:42

    英偉達(dá)黃仁勛:GPU加速計(jì)算是發(fā)展方向

    據(jù)介紹,英偉達(dá)已經(jīng)售出15億塊GPU,如今在使用的每塊GPU都兼容CUDA。而英偉
    的頭像 發(fā)表于 12-18 14:26 ?2712次閱讀

    國(guó)產(chǎn)GPU繞不開(kāi)的CUDA生態(tài)

    CUDA(Compute Unified Device Architecture,統(tǒng)一計(jì)算架構(gòu))是由英偉達(dá)所推出的一種集成技術(shù),是該公司對(duì)于GPGPU的正式名稱(chēng)。通過(guò)這個(gè)技術(shù),用戶(hù)可利用NVIDIA的
    的頭像 發(fā)表于 11-29 09:36 ?4586次閱讀

    GPU平臺(tái)生態(tài)英偉達(dá)CUDAAMD ROCm對(duì)比分析

    CUDA 除了是并行計(jì)算架構(gòu)外,還是 CPU 和 GPU 協(xié)調(diào)工作的通用語(yǔ)言。在CUDA 編程模型中,主要有 Host(主機(jī))和 Device(設(shè)備)兩個(gè)概念,Host 包含 CPU 和主機(jī)內(nèi)存,Device 包含
    的頭像 發(fā)表于 05-18 09:57 ?2947次閱讀
    <b class='flag-5'>GPU</b><b class='flag-5'>平臺(tái)</b><b class='flag-5'>生態(tài)</b>,<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b><b class='flag-5'>CUDA</b>和<b class='flag-5'>AMD</b> <b class='flag-5'>ROCm</b><b class='flag-5'>對(duì)比分析</b>

    AMD 發(fā)布新的AMD ROCm 5.6開(kāi)放軟件平臺(tái)

    ? ? ? ?? 近日,AMD 發(fā)布了新的 AMD ROCm 5.6 開(kāi)放軟件平臺(tái)AMD AI群組高級(jí)副總裁 Vamsi Boppana
    的頭像 發(fā)表于 07-25 16:29 ?1173次閱讀

    英偉達(dá)A100和A40的對(duì)比

    英偉達(dá)A100和A40的對(duì)比 A100是英偉達(dá)推出的一款強(qiáng)大的數(shù)據(jù)中心GPU,采用全新的Ampe
    的頭像 發(fā)表于 08-08 15:08 ?2w次閱讀

    GPU技術(shù)、生態(tài)及算力分析

    對(duì)比AMD從2013年開(kāi)始建設(shè)GPU生態(tài),近10年時(shí)間后用于通用計(jì)算的ROCm開(kāi)放式軟件平臺(tái)才逐
    的頭像 發(fā)表于 01-14 10:06 ?1660次閱讀
    <b class='flag-5'>GPU</b>技術(shù)、<b class='flag-5'>生態(tài)</b>及算力<b class='flag-5'>分析</b>

    AMD將推新GPU,效能媲美英偉達(dá)RTX 4080

    據(jù)悉,AMD正努力研制新品級(jí)GPU,性能堪比英偉達(dá)的RTX 4080,而售價(jià)卻只有后者的一半。據(jù)多個(gè)在線(xiàn)社區(qū)反映,AMD即將發(fā)布的Radeo
    的頭像 發(fā)表于 01-31 10:00 ?3927次閱讀

    英國(guó)公司實(shí)現(xiàn)英偉達(dá)CUDA軟件在AMD GPU上的無(wú)縫運(yùn)行

    7月18日最新資訊,英國(guó)創(chuàng)新科技企業(yè)Spectral Compute震撼發(fā)布了其革命性GPGPU編程工具包——“SCALE”,該工具包實(shí)現(xiàn)了英偉達(dá)CUDA軟件在AMD
    的頭像 發(fā)表于 07-18 14:40 ?955次閱讀