女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

UWA推出全新GPU性能測評工具,支持多款PowerVR芯片優(yōu)化

穎脈Imgtec ? 2023-08-14 10:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

移動設(shè)備GPU 性能優(yōu)化對玩家游戲體驗至關(guān)重要。侑虎科技 UWA 一直專注于游戲和 VR 應(yīng)用的性能優(yōu)化,移動設(shè)備 GPU 優(yōu)化是其關(guān)注的重點,為了更好地滿足開發(fā)者針對不同 GPU 芯片的性能測評與優(yōu)化,日前他們在全新升級的UWA SDK 2.4.8版本中,推出了 GPU 性能測評工具—UWA GOT Online GPU 模式。這也是 UWA 繼去年GPU Counter 功能更新增加Imagination PowerVR GPU 芯片支持后的一次重要升級。

全新的UWA GOT Online GPU 模式帶來了更全面的GPU 性能優(yōu)化方案。在 UWA 官方公開的 GOT Online 支持設(shè)備列表中,可以看到對多款I(lǐng)magination PowerVR GPU的支持:GE8100、GE8200、GE8300、GE8310、GE8430、GE8320、GE8325、GE8340 等,并且會持續(xù)刷新支持Imagination PowerVR GPU的型號,表中還列出了GPU耗時均值、GPU著色、GPU帶寬、GPU圖元處理、GPU負載等多個評測優(yōu)化維度。Imagination 將與 UWA 持續(xù)合作幫助開發(fā)者對GPU 進行更好地優(yōu)化。

30d3fd9a-3a48-11ee-bbcf-dac502259ad0.png

現(xiàn)在,讓我們一一介紹這些重要功能。

  • 性能簡報:該頁面可以快速地幫助開發(fā)者把控項目的GPU性能壓力情況

  • GPU分析:分別從渲染和帶寬兩個角度,對GPU性能壓力進行分析

  • 渲染資源分析:開啟紋理和網(wǎng)格資源分析功能,定位這些資源的具體使用情況

  • Overdraw快照:更便捷地定位Overdraw壓力來源

GPU溫度:快速判斷設(shè)備發(fā)熱的原因是否主要來自GPU


性能簡報

如下圖,UWA列出了測試時的FPS、GPU Clocks數(shù)據(jù),并用淺紅色背景標注了GPU Bound幀。GPU Bound表示GPU性能高壓區(qū)間,此時GPU計算耗費的時鐘周期數(shù)過高,可能無法支持滿幀運作。

3104379e-3a48-11ee-bbcf-dac502259ad0.png

同時,UWA也在圖表下列出了GPU性能、渲染統(tǒng)計、紋理資源分析和網(wǎng)格資源分析4個模塊的參數(shù)情況和對應(yīng)的優(yōu)化任務(wù)隊列。

311ba4c4-3a48-11ee-bbcf-dac502259ad0.png

312901dc-3a48-11ee-bbcf-dac502259ad0.png

314aab7a-3a48-11ee-bbcf-dac502259ad0.png

簡報的目的是幫助大家在茫茫多的性能指標中,快速篩選出高優(yōu)先級的優(yōu)化任務(wù)。如需要針對某些指標做更為深層的下探,就可以使用下文中的各個功能進行分析。


GPU分析

在指標匯總下,展示了測試過程中獲取到的各項GPU參數(shù)。同時,UWA也根據(jù)這些指標間的關(guān)聯(lián),分別從渲染和帶寬兩個角度,幫助開發(fā)者對GPU性能壓力進行具體分析。

1. 指標匯總

GPU TimeGPU Time即每幀的GPU耗時。GPU耗時的推薦值和CPU耗時一樣,當項目需要維持在30幀時,GPU耗時應(yīng)低于33ms(UWA推薦控制在28ms更佳)。同時,UWA也列出了渲染耗時Fragment Time和頂點處理耗時Non-Fragment Time數(shù)據(jù)作為補充。

3164c5b4-3a48-11ee-bbcf-dac502259ad0.png


Clocks

GPU Clocks表示渲染一幀耗費的GPU時鐘周期數(shù),和GPU Times一樣,也是用于衡量GPU性能的主要指標。通過GPU Clocks,開發(fā)者可以快速定位項目的GPU壓力主要來自哪些場景,并結(jié)合其他GPU參數(shù)對GPU壓力情況進行具體分析。

318471de-3a48-11ee-bbcf-dac502259ad0.png


GPU Utilization

Fragment Utilization和Non Fragment Utilization分別表示圖元處理和非圖元處理任務(wù)處于活動狀態(tài)的時間百分比。

31a409a4-3a48-11ee-bbcf-dac502259ad0.png

當Non Fragment Utilization高時,開發(fā)者可以從面片數(shù)、面剔除、模型復(fù)雜度等角度著手進行優(yōu)化;而當Fragment Utilization高時,則考慮項目中是否存在Overdraw過高、Fragment Shader過于復(fù)雜等問題。


GPU Shaded

在GPU Shaded下,可以獲取到相關(guān)的Fragment shaded、Vertices shaded、Cycles/Pixel指標數(shù)據(jù)。

31c88b4e-3a48-11ee-bbcf-dac502259ad0.png

其中Cycles/Pixel表示平均每個像素耗費的GPU時鐘周期。當畫面的Shader復(fù)雜度過高/或者Overdraw過高時,GPU需要消耗大量的時鐘周期對Shader進行運算,容易造成GPU耗時變高,造成卡頓。通過Cycles/Pixel,即可快速定位高Cycles的場景,需要進一步判斷場景的GPU壓力是否是由于Shader復(fù)雜度過高還是Overdraw過高造成,進行有針對性的優(yōu)化。

31eb6326-3a48-11ee-bbcf-dac502259ad0.png

Fragment shaded表示每幀F(xiàn)ragment shader執(zhí)行了多少次,用Fragment shaded數(shù)除以設(shè)備分辨率,可以側(cè)面反映項目的Overdraw情況。

當Overdraw較高時,容易引起發(fā)熱和能耗方面的問題。我們可以通過降低半透明粒子特效的粒子數(shù)量、使用不規(guī)則面片代替矩形面片渲染粒子特效或UI等方式,減少項目的Overdraw層數(shù),降低GPU壓力。

31f12108-3a48-11ee-bbcf-dac502259ad0.png

而Vertices shaded則表示每幀Vertex shader執(zhí)行了多少次。使用Vertices shaded除以輸入圖元數(shù),即可得到平均每個圖元進行了多少次Vertices shaded。UWA推薦平均每個圖元執(zhí)行次數(shù)應(yīng)控制在1.5次以下。

3207e47e-3a48-11ee-bbcf-dac502259ad0.png


GPU Bandwidth

和CPU一樣,GPU Bandwidth也是芯片耗電的重要指標。當GPU持續(xù)進行高負載外部讀寫時,掉電就會過快。UWA的GPU Bandwidth模塊統(tǒng)計了測試過程中單幀的讀寫帶寬總量,通過查看GPU Bandwidth模塊,可以快速定位測試過程中帶寬較高的場景和原因,并進行進一步測試優(yōu)化。

32228806-3a48-11ee-bbcf-dac502259ad0.png


GPU Memory Bus Utilization

GPU Memory Bus Utilization,即每幀GPU內(nèi)存總線負載。它表示當前GPU帶寬消耗占總可用帶寬的百分比。當GPU Memory Bus Utilization持續(xù)較高時,說明GPU訪問內(nèi)存的頻率過于頻繁,可以通過減少紋理資源與網(wǎng)格資源的大小和數(shù)量控制GPU緩存的占比。

324644f8-3a48-11ee-bbcf-dac502259ad0.png


GPU Primitive

渲染面是產(chǎn)生GPU壓力的重要因素之一,渲染面過多可能是模型過于復(fù)雜;也可能是地形、大建筑物等大面積模型沒有進行適當?shù)牟鸱郑瑢е逻M入視域體的面片可能不多,但提交GPU的渲染面依然很多。

對于這種情況,我們可以通過GPU Primitive下的各項參數(shù)來進行初步判斷。

3267ca42-3a48-11ee-bbcf-dac502259ad0.png

Input Primitives:提交到GPU端的圖元總數(shù),該數(shù)值基本等同于引擎端統(tǒng)計的渲染面片總數(shù)。

Visible Primitives:在GPU端通過各種裁剪之后,留下的參與渲染的三角面。

Culled Primitives:因為在視域體外而被裁剪的三角面,因為朝向而被裁剪的三角面。

GPU圖元處理數(shù)量過多會對設(shè)備的帶寬和能耗造成較大的影響,應(yīng)盡量在程序端完成剔除,并減小送往GPU的圖元數(shù)。在3D場景中,比較理想的情況下,可見圖元的數(shù)量應(yīng)該接近或高于 50%(對于大部分模型,有一半三角面會因為朝向被裁剪)。如果某些角度下,可見圖元的比例非常低,則很可能存在上文提到的第二種情況,從而可以針對性地檢查和優(yōu)化場景中,這個角度下,被提交到GPU的大面積模型。

32874d68-3a48-11ee-bbcf-dac502259ad0.png

2. GPU渲染分析

GPU Clocks是衡量GPU性能的主要指標,結(jié)合該曲線,開發(fā)者可以快速判斷各個場景中的GPU壓力。

32a22584-3a48-11ee-bbcf-dac502259ad0.png

同時,UWA也展示出了GPU Shaded、GPU Primitive指標的均值和性能走勢。當某個場景中的GPU Clocks較高時,通過這些指標的推薦值和性能曲線,開發(fā)者就可以快速判斷是哪些參數(shù)造成的GPU渲染計算壓力,并采取相應(yīng)的優(yōu)化方案。

32b5b4c8-3a48-11ee-bbcf-dac502259ad0.png


3. GPU帶寬分析

由于GPU讀、寫帶寬較高時都會造成大量的發(fā)熱和耗電,需要開發(fā)者重點關(guān)注。

在相關(guān)參數(shù)中,也展示了GPU Memory Bus Utilization、GPU Primitive參數(shù)。比如當GPU Primitives較高時,就說明提交到GPU端的圖元總數(shù)較多,可能引起較高的帶寬壓力。

32dacb32-3a48-11ee-bbcf-dac502259ad0.png32f66784-3a48-11ee-bbcf-dac502259ad0.png


渲染資源分析

當參與渲染的紋理和網(wǎng)格資源越多、采樣越多時,資源內(nèi)存會變高,GPU帶寬和GPU Clocks也會相應(yīng)上漲。為了保證讓參與渲染計算的資源物盡其用,開發(fā)者可以手動開啟紋理和網(wǎng)格資源分析功能,定位這些資源的具體使用情況。

3323d69c-3a48-11ee-bbcf-dac502259ad0.png

紋理資源分析

在紋理資源分析頁,除了紋理資源的內(nèi)存、數(shù)量、尺寸等參數(shù)外,我們還可以查看紋理渲染利用率、是否開啟Mipmap和Mipmap采樣率等數(shù)據(jù)。

33f87fe6-3a48-11ee-bbcf-dac502259ad0.png

34277332-3a48-11ee-bbcf-dac502259ad0.png

通過紋理渲染利用率,開發(fā)者即可快速定位到一直在內(nèi)存中但從未參與過渲染的紋理資源,以此排查是否存在場景中不可見的渲染物體、不合理的打包和加載策略等可能造成此種浪費的因素。

344f6f18-3a48-11ee-bbcf-dac502259ad0.png

347f65ba-3a48-11ee-bbcf-dac502259ad0.png

而通過Mipmap 0層采樣率是否較低(低于20%),則可以判斷哪些紋理資源的尺寸過大,開發(fā)者就可以通過降低這些紋理資源分辨率緩解內(nèi)存和GPU壓力,同時也不會影響畫面效果。

網(wǎng)格資源分析

在網(wǎng)格資源分析頁,除了和紋理資源相似的資源渲染利用率外,我們也可以查看網(wǎng)格的最大屏占比和最小渲染密度數(shù)據(jù)。渲染利用率為0的網(wǎng)格資源和紋理資源優(yōu)化方式相似,而網(wǎng)格最大屏占比和最小渲染密度則可以用于排查網(wǎng)格資源的精度是否合理。

3499167c-3a48-11ee-bbcf-dac502259ad0.png

當網(wǎng)格的最大屏占比小于0.02%時,說明網(wǎng)格在手機屏幕中只占很小的一部分,可見性較低。如果同時網(wǎng)格的復(fù)雜度較高,就說明網(wǎng)格的精度過高,開發(fā)者可以考慮使用更低精度的模型進行替換。

34bf2a7e-3a48-11ee-bbcf-dac502259ad0.png

34d2a342-3a48-11ee-bbcf-dac502259ad0.png

渲染密度則表示在平均每一萬像素中網(wǎng)格的頂點數(shù),如果該值大于1000,則說明我們在很小的畫面中繪制了過于復(fù)雜的網(wǎng)格。因此,當此網(wǎng)格的渲染密度最小時,該數(shù)值仍然高于1000,那么此網(wǎng)格的頂點數(shù)大概率是過高的,開發(fā)者可以考慮對這些網(wǎng)格資源進行減面操作,或使用LOD分級處理。


Overdraw快照

Overdraw表示項目運行過程中單幀中整個屏幕被填充的倍數(shù)。在游戲運行過程中,場景中半透明物體的重合會使得同一個像素點在一幀中會被繪制多次,容易造成Overdraw過高,引起設(shè)備發(fā)熱。

在Overdraw快照模塊,UWA通過Fragment Shaded(渲染像素總數(shù))與設(shè)備渲染分辨率,換算得到了Overdraw的計算值,以幫助開發(fā)者對項目的Overdraw情況進行排查。

34e9c144-3a48-11ee-bbcf-dac502259ad0.png

在測試GPU模式時,開發(fā)者可以手動Dump采集場景中具體的Overdraw情況。

350535c8-3a48-11ee-bbcf-dac502259ad0.png

在Overdraw快照模塊,即可查看Dump幀各個相機的Overdraw情況。其中Overlay-UI(UWA)相機展示的是UGUI中Overlay部分的Overdraw信息,即所有沒有掛在任何相機下UI的Overdraw信息。

35385264-3a48-11ee-bbcf-dac502259ad0.png

在柱狀圖下方,還可以查看所選柱狀圖的Overdraw熱力圖,其中顏色越紅,表示該處像素在當前幀中被填充的次數(shù)較多,Overdraw較高,GPU的壓力就越大。

355204e8-3a48-11ee-bbcf-dac502259ad0.png

開發(fā)者可以結(jié)合報告截圖和Overdraw熱力圖,更便捷地定位項目的Overdraw壓力來源。


GPU溫度

GPU壓力較高時容易引起設(shè)備發(fā)熱。UWA統(tǒng)計了設(shè)備的GPU、CPU、電池溫度,以便開發(fā)者判斷設(shè)備發(fā)熱的原因是否主要來自GPU。

3573bf5c-3a48-11ee-bbcf-dac502259ad0.png

若確認是由于GPU壓力導致發(fā)熱,接下來可以進一步排查與GPU溫度情況有關(guān)的參數(shù),譬如FPS、GPU Clocks、GPU bandwidth。而功率則會和GPU溫度相互影響,也是反應(yīng)能耗和發(fā)熱問題的重要參數(shù)。

358c657a-3a48-11ee-bbcf-dac502259ad0.png

這里特別建議大家:由于CPU和GPU芯片位置較近,當CPU壓力較大產(chǎn)生發(fā)熱時,也可能帶動GPU一起發(fā)熱。所以在優(yōu)化GPU發(fā)熱問題時,也要適當結(jié)合CPU壓力情況進行排查分析。總的來說,當項目存在耗電快、溫度高的現(xiàn)象時,開發(fā)者可以從GPU性能壓力、GPU帶寬、CPU主線程、CPU子線程等方面著手,優(yōu)化發(fā)熱問題。

UWA提供的性能測評工具更進一步地拆分和細化了項目的GPU壓力成因,為您帶來前所未有的優(yōu)化體驗。UWA的目標是讓您更便捷、高效地定位項目的GPU壓力來源,告別盲目猜測,擁抱精準優(yōu)化。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    460

    文章

    52517

    瀏覽量

    440875
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4946

    瀏覽量

    131239
  • vr
    vr
    +關(guān)注

    關(guān)注

    34

    文章

    9675

    瀏覽量

    152686
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】+NVlink技術(shù)從應(yīng)用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」書中的芯片知識是比較接近當前的頂尖芯片水平的,同時包含了
    發(fā)表于 06-18 19:31

    英諾達推出RTL功耗優(yōu)化工具

    英諾達(成都)電子科技有限公司隆重推出芯片設(shè)計早期RTL級功耗優(yōu)化工具—EnFortius RTL Power Explorer(ERPE),該工具可以高效、全面地在RTL設(shè)計階段進行
    的頭像 發(fā)表于 03-20 17:06 ?562次閱讀

    Flexus X 實例性能測評

    潛在性能瓶頸,確保在高并發(fā)和海量數(shù)據(jù)處理等極端情況下系統(tǒng)的穩(wěn)定性有重要意義。 測評的結(jié)果還幫助企業(yè)對優(yōu)化?IT 支出,避免性能不足導致的業(yè)務(wù)中斷有決策作用。因此,
    的頭像 發(fā)表于 12-24 12:18 ?511次閱讀
    Flexus X 實例<b class='flag-5'>性能</b><b class='flag-5'>測評</b>

    芯原推出新一代高性能Vitality架構(gòu)GPU IP系列

    芯原股份(芯原,股票代碼:688521.SH)今日宣布推出全新Vitality架構(gòu)的圖形處理器(GPU)IP系列,具備高性能計算能力,廣泛適用于云游戲、AI PC、獨立顯卡和集成顯卡等
    的頭像 發(fā)表于 12-19 15:55 ?493次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    問題,但會降低舊GPU硬件性能,可通過NVIDIA控制面板或命令行工具nvidia - smi管理。 - TCC模式(Windows only):某些GPU計算需要啟用,可通過命令行
    發(fā)表于 12-16 14:25

    南方測繪多款實景三維軟件產(chǎn)品通過官方測評

    為推進地理信息產(chǎn)業(yè)高質(zhì)量發(fā)展,助力數(shù)字中國建設(shè),為相關(guān)行業(yè)或重大工程提供成熟、合格的地理信息軟件產(chǎn)品,根據(jù)市場、用戶、相關(guān)部門、行業(yè)的需求,中國地理信息產(chǎn)業(yè)協(xié)會開展了地理信息相關(guān)軟件測評工作,結(jié)果于近期公示。
    的頭像 發(fā)表于 12-13 10:35 ?1220次閱讀

    Cincoze德承推出兩款全新GPU嵌入式工控機

    ,高性能GPU全長卡可擴展型工業(yè)工控機GP-3100系列,搭載了全新的第14代Intel? Core?處理器(Raptor Lake-S Refresh),并支持最多兩張250W全長
    的頭像 發(fā)表于 12-11 14:47 ?1364次閱讀

    英諾達推出兩款全新靜態(tài)驗證EDA工具

    (2024年12月5日,四川成都)英諾達(成都)電子科技有限公司隆重推出兩款全新的靜態(tài)驗證EDA工具:EnAltiusCDC跨域檢查工具和Lint RTL代碼檢查
    的頭像 發(fā)表于 12-05 10:13 ?1087次閱讀
    英諾達<b class='flag-5'>推出</b>兩款<b class='flag-5'>全新</b>靜態(tài)驗證EDA<b class='flag-5'>工具</b>

    國科微亮相2024 UWA聯(lián)盟會員大會

    近日,2024 UWA SUMMIT暨世界超高清視頻產(chǎn)業(yè)聯(lián)盟會員大會在深圳開幕,超高清產(chǎn)業(yè)生態(tài)體驗展同期舉辦。作為UWA聯(lián)盟會員單位、超高清視頻賽道領(lǐng)先企業(yè),國科微重磅展出4K/8K超高清解碼芯片系列與4K/8K超高清顯示
    的頭像 發(fā)表于 11-30 09:35 ?795次閱讀

    英特爾12月或發(fā)布Battlemage GPU芯片

    近日,有關(guān)英特爾即將在12月發(fā)布全新Battlemage GPU芯片的傳聞再次被證實。據(jù)硬件挖掘者和泄密者Tomasz Gawrońsk分享的預(yù)告圖顯示,英特爾極有可能在AMD RDNA 4和英偉達Blackwell之前,率先
    的頭像 發(fā)表于 11-19 17:37 ?821次閱讀

    天璣9400技術(shù)詳解:如何蟬聯(lián)GPU性能、能效雙冠軍

    全新高度,引發(fā)了廣泛好評。 天璣9400搭載全新頂級12核GPU G925,相較上代擁有超過41%的峰值性能飛躍,在保持與上一代相同的峰值性能
    的頭像 發(fā)表于 11-07 14:00 ?823次閱讀
    天璣9400技術(shù)詳解:如何蟬聯(lián)<b class='flag-5'>GPU</b><b class='flag-5'>性能</b>、能效雙冠軍

    如何構(gòu)建及優(yōu)化GPU云網(wǎng)絡(luò)

    并從計算節(jié)點成本優(yōu)化、集群網(wǎng)絡(luò)與拓撲的選擇等方面論述如何構(gòu)建及優(yōu)化GPU云網(wǎng)絡(luò)。
    的頭像 發(fā)表于 11-06 16:03 ?1029次閱讀
    如何構(gòu)建及<b class='flag-5'>優(yōu)化</b><b class='flag-5'>GPU</b>云網(wǎng)絡(luò)

    如何優(yōu)化SOC芯片性能

    優(yōu)化SOC(System on Chip,系統(tǒng)級芯片芯片性能是一個復(fù)雜而多維的任務(wù),涉及多個方面的優(yōu)化策略。以下是一些關(guān)鍵的
    的頭像 發(fā)表于 10-31 15:50 ?1741次閱讀

    使用Arthas火焰圖工具的Java應(yīng)用性能分析和優(yōu)化經(jīng)驗

    分享作者在使用Arthas火焰圖工具進行Java應(yīng)用性能分析和優(yōu)化的經(jīng)驗。
    的頭像 發(fā)表于 10-28 09:27 ?1294次閱讀
    使用Arthas火焰圖<b class='flag-5'>工具</b>的Java應(yīng)用<b class='flag-5'>性能</b>分析和<b class='flag-5'>優(yōu)化</b>經(jīng)驗

    名單公布!【書籍評測活動NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    。本書對華為等廠商推出的NPU芯片設(shè)計也做了架構(gòu)描述,中國也擁有獨立自主知識產(chǎn)權(quán)的高算力芯片,并且支持芯片、高帶寬互連。本書也回顧了近20
    發(fā)表于 09-02 10:09