NVIDIA 發(fā)布的 CUDA 開(kāi)發(fā)環(huán)境 CUDA 11.6 的最新版本。本版本的重點(diǎn)是增強(qiáng) CUDA 應(yīng)用程序的編程模型和性能。 CUDA 繼續(xù)推動(dòng) GPU 加速度的邊界,并為 HPC 、可視化、 AI 、 ML 和 DL 和數(shù)據(jù)科學(xué)中的新應(yīng)用奠定基礎(chǔ)。
CUDA 11.6 有幾個(gè)重要特性。這篇文章概述了關(guān)鍵功能:
GSP 驅(qū)動(dòng)程序架構(gòu)現(xiàn)在默認(rèn)為圖靈和安培 GPU
新 API 允許禁用實(shí)例化圖中的節(jié)點(diǎn)
完全支持 128 位整數(shù)類型
協(xié)作組命名空間更新
CUDA 編譯器更新
Nsight Compute 2022.1 版本
CUDA 11.6 附帶 R510 驅(qū)動(dòng)程序,這是一個(gè)更新分支。 CUDA 11.6 工具包可供下載 。
GSP 驅(qū)動(dòng)程序體系結(jié)構(gòu)
GSP 驅(qū)動(dòng)程序體系結(jié)構(gòu)現(xiàn)在是所有列出的圖靈和安培 GPU 的默認(rèn)驅(qū)動(dòng)程序模式。較舊的驅(qū)動(dòng)程序體系結(jié)構(gòu)作為后備支持。有關(guān)更多信息,請(qǐng)參閱 R510 驅(qū)動(dòng)程序自述 。
實(shí)例化的圖形節(jié)點(diǎn) API 添加
我們添加了一個(gè)新的 API cudaGraphNodeSetEnabled,以允許禁用實(shí)例化圖中的節(jié)點(diǎn)。在此版本中,支持僅限于內(nèi)核節(jié)點(diǎn)。相應(yīng)的 API cudaGraphNodeGetEnabled允許查詢節(jié)點(diǎn)的啟用狀態(tài)。我們還添加了禁用空內(nèi)核圖節(jié)點(diǎn)啟動(dòng)的功能。
128 位整數(shù)支持
CUDA 11.6 包括 128 位整數(shù)(__int128)數(shù)據(jù)類型的完整版本,包括編譯器和開(kāi)發(fā)工具支持。主機(jī)端編譯器必須支持__int128類型才能使用此功能。
協(xié)作組名稱空間
協(xié)作組名稱空間已更新為新函數(shù),以提高命名、函數(shù)范圍以及單元維度和大小的一致性。
CUDA 編譯器
在編譯過(guò)程中向目標(biāo)安裝的 GPU 添加了-arch=native編譯選項(xiàng)。這擴(kuò)展了現(xiàn)有的-gencode=arch=compute_xx,code=sm_xx體系結(jié)構(gòu)規(guī)范
添加從nvlink創(chuàng)建 PTX 文件的功能
不推薦的功能
不推薦使用用于設(shè)備上 fork 和 join 并行的cudaDeviceSynchronize(),以便為具有更高性能的替換編程模型做準(zhǔn)備。這些函數(shù)在本版本中繼續(xù)工作,但這些工具會(huì)發(fā)出有關(guān)即將發(fā)生的更改的警告。
CentOS Linux 8 已經(jīng)到了生命的盡頭 在 2021 年 12 月 31 日,對(duì)這個(gè)操作系統(tǒng)的支持現(xiàn)在在 CUDA 工具包中被棄用。 CentOS Linux 8 支持將在未來(lái)版本中完全取消。
關(guān)于作者
Rob Armstrong 是 CUDA 工具包的主要技術(shù)產(chǎn)品經(jīng)理。 20 多年來(lái),他一直專注于使用異構(gòu)硬件平臺(tái)加速軟件,并對(duì)計(jì)算機(jī)體系結(jié)構(gòu)和硬件/軟件交互特別感興趣。
Arthy Sundaram 是 CUDA 平臺(tái)的技術(shù)產(chǎn)品經(jīng)理。她擁有哥倫比亞大學(xué)計(jì)算機(jī)科學(xué)碩士學(xué)位。她感興趣的領(lǐng)域是操作系統(tǒng)、編譯器和計(jì)算機(jī)體系結(jié)構(gòu)。
Fred Oh 是 CUDA 、 CUDA on WSL 和 CUDA Python 的高級(jí)產(chǎn)品營(yíng)銷經(jīng)理。弗雷德?lián)碛屑又荽髮W(xué)戴維斯分校計(jì)算機(jī)科學(xué)和數(shù)學(xué)學(xué)士學(xué)位。他的職業(yè)生涯開(kāi)始于一名 UNIX 軟件工程師,負(fù)責(zé)將內(nèi)核服務(wù)和設(shè)備驅(qū)動(dòng)程序移植到 x86 體系結(jié)構(gòu)。他喜歡《星球大戰(zhàn)》、《星際迷航》和 NBA 勇士隊(duì)。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5238瀏覽量
105759 -
gpu
+關(guān)注
關(guān)注
28文章
4909瀏覽量
130648
發(fā)布評(píng)論請(qǐng)先 登錄
普華基礎(chǔ)軟件開(kāi)源車用操作系統(tǒng)迎來(lái)全新版本
SOA架構(gòu)開(kāi)發(fā)小助手PAVELINK.SOA-Converter 2.1.2新版本發(fā)布

云計(jì)算開(kāi)發(fā)工具包的功能
GUI Guider v1.9.0全新版本上線
新版本 IDE 的啟動(dòng)速度變快了?原來(lái)是在背后做了這些!

最新Simplicity SDK軟件開(kāi)發(fā)工具包發(fā)布
經(jīng)緯恒潤(rùn)INTEWORK-VBA新版本正式發(fā)布

達(dá)索系統(tǒng)SOLIDWORKS2025新版本即將來(lái)襲
品英Pickering最新版本的微波開(kāi)關(guān)設(shè)計(jì)工具, 增強(qiáng)了仿真能力和原理圖設(shè)計(jì)功能

經(jīng)緯恒潤(rùn)INTEWORK-TPA 新版本正式發(fā)布

GUI Guider V1.8.0全新版本正式上線
使用freeRTOS開(kāi)發(fā)工具包時(shí),在哪里可以找到freeRTOS的版本?
單元測(cè)試工具TESSY 新版本亮點(diǎn)速覽:提供測(cè)試駕駛艙視圖、超級(jí)覆蓋率、代碼訪問(wèn)分析、增強(qiáng)覆蓋率審查

新增6個(gè)實(shí)用功能!華秋DFM新版本來(lái)了

華秋DFM新版本 #持續(xù)優(yōu)化 #服務(wù)升級(jí)

評(píng)論