實時光線追蹤提升了電子游戲中的光照藝術效果,但該過程需要消耗大量算力。為了減少消耗,NVIDIA 開發了一款顯存實用程序,它將規整和二次分配技術相結合,可優化和減少加速結構的顯存消耗。我們已將此解決方案變為名叫 RTXMU 的 SDK,并在今天將其作為開源版本提供。它專為支持各種 DXR 或 Vulkan 光線追蹤應用程序而構建。
通過利用 RTXMU 規整加速結構,可消除初始構建操作中浪費的顯存。對于使用 RTXMU 的應用程序,NVIDIA RTX 顯卡的顯存占用量減少了大約 50%。此外,利用 RTXMU 二次分配加速結構緩沖區可防止出現碎片和浪費的空間。包含數千個不同的小 BLAS 的場景將從二次分配中受益匪淺。
RTXMU 如何立即提供幫助?
RTXMU 易于集成,可立即帶來好處。
二次分配和規整顯存管理器需要花費大量工程時間進行驗證。RTXMU 可縮短開發者將規整和二次分配技術集成到 RTX 游戲中所需的時間。
RTXMU 還會抽象化 BLAS 的顯存和規整狀態管理,并管理規整尺寸回讀和規整副本所需的所有屏障。
更深入地說,RTXMU 使用 BLAS 數據結構的句柄間接層來防止錯誤管理 CPU 內存(包括訪問已取消分配或不存在的 BLAS)。此外,二次分配通過將更多 BLAS 裝入 64 KB 或 4 MB 頁面中,帶來了提高 TLB(頁表緩存)命中率的好處。
簡而言之,RTXMU 讓開發者毫不費力地就能讓實時光線追蹤游戲和應用程序更快速地運行。
關于作者
Ethan Einhorn 是一位有21年游戲行業經驗的資深人士,曾擔任編輯、營銷、制作和創意指導等職位。目前,他是 NVIDIA 的高級產品營銷經理。
審核編輯:郭婷
-
NVIDIA
+關注
關注
14文章
5242瀏覽量
105771 -
應用程序
+關注
關注
38文章
3322瀏覽量
58728
發布評論請先 登錄
借助NVIDIA技術加速半導體芯片制造
云電競服務器 工作原理

NVIDIA實現神經網絡渲染技術的突破性增強功能
NVIDIA發布DLSS 4技術:多幀生成技術革新游戲體驗
NVIDIA宣布NVIDIA Isaac重要更新
$1999 的 RTX 5090 來了

機械革命與NVIDIA聯手首發RTX 50系列游戲本
AMD與NVIDIA GPU優缺點
微軟推出DirectSR接口,集成FSR 3.1等SR技術提升游戲體驗
Foxconn利用NVIDIA AI和Omniverse訓練機器人
顯存技術不斷升級,AI計算中如何選擇合適的顯存
基于 FPGA 的飛機大戰游戲系統設計
IP地址和網絡游戲
NVIDIA 究竟做了什么?《The First Descendant》幀率躍升 44%

評論