高性能圖形處理單元 (GPU) 的內(nèi)部計算架構(gòu)已從固定功能圖形執(zhí)行單元發(fā)展為完全可編程的單指令多數(shù)據(jù) (SIMD) 處理器陣列。這種演變是由視頻游戲社區(qū)的需求推動的,即并行執(zhí)行通用物理計算,以使煙霧、碎片、火災(zāi)和流體等行為更加逼真。將這些相同類型的重復(fù)并行計算卸載和加速到 GPU 上的能力為雷達、聲納和圖像處理等軍事技術(shù)提供了巨大的潛力。高效實施的關(guān)鍵是新一代工具,如 OpenCL 和 CUDA,它們集成了跨異構(gòu) CPU/GPU 架構(gòu)的代碼開發(fā)以及支持它們的內(nèi)存和 I/O 帶寬。
單邊處理光線
高性能 GPU 設(shè)備的核心通常具有多達 128 個 32 位單精度處理器內(nèi)核,主頻為 1 GHz 或更高。它們被組織為并行 SIMD 陣列,以便處理器組可以在不同的數(shù)據(jù)集上并行執(zhí)行相同的指令。作為 GPU 運行時,主要要求是利用動畫 3D 圖形功能,例如著色器。然而,GPU 正在從特定的著色器處理器演變而成為更通用的數(shù)學(xué)處理器,現(xiàn)在稱為“流處理器”。借助正確的工具,GPU 可以更廣泛地應(yīng)用于加速多種基于 PC 的應(yīng)用程序,例如基因研究、地震處理、氣象處理和 DSP,其成本遠低于其他更具體的硬件加速形式。
一家主要的GPU制造商NVIDIA開發(fā)了一種稱為CUDA的軟件環(huán)境,以將GPU的潛力釋放到這些其他應(yīng)用領(lǐng)域。CUDA 通過允許通過隱藏 GPU 流處理器及其與 CPU 接口的抽象函數(shù)庫進行內(nèi)聯(lián) C 代碼開發(fā)來支持 CPU 和 GPU 的組合。這提供了一個非常靈活的編程接口,并允許將來對流處理器進行增長甚至根本性更改,而不會影響現(xiàn)有代碼。為了減少錯誤的范圍,CUDA 采用簡單的編程模型,在內(nèi)部管理多個線程以優(yōu)化處理器利用率,因此無需編寫顯式線程代碼。
沒有圖形的圖形 GPU
矛盾的是,會有一類嵌入式應(yīng)用程序根本不會生成任何本地圖形輸出。通常,此類可能包括無人機或水下遙控車輛(ROV)或許多其他類型的無人傳感器中的圖像處理。具有 GPU 的嵌入式 PC 成為圖像增強、穩(wěn)定、模式識別、目標跟蹤、視頻編碼或加密/解密的理想平臺。這些都是可以用常規(guī) C 代碼編寫以在高性能 PC 上運行的應(yīng)用程序,但可以通過 GPU 流處理器加速以運行速度快幾個數(shù)量級。GPU 提供已經(jīng)集成到許多 PC 配置中的通用并行處理,并且通過使用現(xiàn)成的工具(如 CUDA、MathWorks 的 MATLAB 和移植的 VSIPL DSP 庫)來構(gòu)建、測試和驗證應(yīng)用程序,需要的專業(yè)技能低于 FPGA 開發(fā)。
PCI Express 是性能的關(guān)鍵
嵌入式傳感器處理應(yīng)用需要高數(shù)據(jù)帶寬來接收和處理連續(xù)的傳入原始圖像數(shù)據(jù)流。CUDA 處理多線程并因此最大化 GPU SIMD 陣列的處理負載的能力取決于外部接口及其本地內(nèi)存接口的性能。高端GPU設(shè)備將使用16通道PCI Express 2.0,是早期PCI Express 1.0數(shù)據(jù)速率的兩倍,理論上每通道500 MBps。對于堅固耐用的嵌入式應(yīng)用,這非常適合VPX (ANSI/VITA 46)封裝標準的流行3U和6U格式,并具有擴展的高速連接性。GE Fanuc Intelligent Platforms的MAGIC1強固型嵌入式PC(如圖1所示)基于3U VPX外形,并經(jīng)過重新設(shè)計和增強,以支持NVIDIA支持CUDA的GPU。雖然這種嵌入式PC非常適合3U格式,但6U配置文件還具有空間和更大的連接性,有可能基于許多多核處理器和GPU使用PCI Express 2.0作為互連的新型強大多計算引擎。
GPU 正在迅速發(fā)展,創(chuàng)造了一種處理能力,可在許多不同的市場中得到廣泛的應(yīng)用。CUDA 和類似的開發(fā)環(huán)境提供了對這種未開發(fā)性能儲備的可訪問性。因此,堅固耐用的軍事和航空航天領(lǐng)域似乎將改變復(fù)雜、耗時的傳感器應(yīng)用的開發(fā)、測試、驗證和成功部署方式。
審核編輯:郭婷
-
處理器
+關(guān)注
關(guān)注
68文章
19811瀏覽量
233605 -
gpu
+關(guān)注
關(guān)注
28文章
4912瀏覽量
130675
發(fā)布評論請先 登錄
GPU架構(gòu)深度解析

GoPoint嵌入式開發(fā)平臺 釋放i.MX潛力 簡化Linux開發(fā)

《CST Studio Suite 2024 GPU加速計算指南》
常見GPU問題及解決方法
GPU與VR技術(shù)結(jié)合應(yīng)用
如何提高GPU性能
GPU在圖形設(shè)計中的重要性
GPU深度學(xué)習(xí)應(yīng)用案例
GPU超頻設(shè)置技巧
GPU加速計算平臺是什么
GPU計算主板學(xué)習(xí)資料第735篇:基于3U VPX的AGX Xavier GPU計算主板 信號計算主板 視頻處理 相機信號

GPU服務(wù)器用途

評論