女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

UWA平臺支持PowerVR芯片,新增四大GPU模塊分析

穎脈Imgtec ? 2022-10-19 11:18 ? 次閱讀

日前,游戲和VR應用性能優化平臺 UWA 宣布新的 GPU Counter 功能更新:增加了對 PowerVR 品牌 GPU 芯片的支持。針對 PowerVR GPUCounter,UWA提供了 GPU 負載、GPU 著色、GPU 帶寬、GPU 圖元 4 個模塊的分析。最新的 UWA SDK 2.4.4 已發布,下載最新版 SDK,并使用搭載 PowerVR GPU IP 芯片的設備進行測試,即可在GOT Online Overview的GPU模塊下查看到對應的數據,掌握GPU壓力和性能消耗情況。

以下針對PowerVR GPU Counter,圍繞UWA所提供的GPU 負載、GPU著色、GPU帶寬、GPU圖元4個模塊的分析進行詳細說明。


1、GPU負載

GPU Counter下的GPU負載包含Non Fragment Utilization和Fragment Utilization兩個性能指標,分別代表非片段處理占整體GPU處理耗時百分比和片段處理開銷占整體GPU處理開銷百分比。

9ddd0478-4f29-11ed-b116-dac502259ad0.png

在GPU上運行的工作負載由作業管理器統一協調,該任務管理器負責將工作負載調度到GPU內部的各個處理單元上,它將兩個FIFO工作隊列,稱為作業插槽。其中,一個插槽用于非片段工作負載,另一個插槽則用于片段著色工作負載。當出現GPU瓶頸時,正常情況下Non Fragment Utilization和Fragment Utilization至少有一個是接近100%,如果兩者都低于100%,則有可能是Non Fragment和Fragment之間存在數據依賴關系。

當Non Fragment Utilization過高時,開發者可以從頂點數、復雜的Compute Shader的使用情況以及Geometry Shader、Tessellation Shader等角度著手進行優化。當Fragment Utilization過高時,則可以考慮項目中是否存在是否存在片段數目過多、片段Shader過于復雜。


2、GPU著色

包含Overdraw和Cycles/Pixel兩個指標。

9df65c16-4f29-11ed-b116-dac502259ad0.png

Overdraw(過度繪制)

該項表示項目運行過程中,單幀中整個屏幕被填充的倍數。倍數越高,則GPU的壓力越大。在游戲運行過程中,場景中半透明物體的重合會使得同一個像素點在一幀中會被繪制多次,造成Overdraw過高的情況。如下圖所示,UI和粒子特效層疊導致容易出現Overdraw。9e0b3a28-4f29-11ed-b116-dac502259ad0.png

Cycles/Pixel

表示平均每個像素耗費的GPU時鐘周期。一般來說,Shader復雜度會極大地影響GPUCycles占用的情況。當畫面的Shader復雜度過高時,GPU需要消耗大量的時鐘周期對Shader進行運算,容易造成GPU耗時變高,造成卡頓。

因此,通過查看GPU著色模塊,就可以快速定位高Overdraw和高Cycles的場景,判斷這個場景的GPU壓力較高是Overdraw還是Shader復雜度過高造成的,進行有針對性的優化。


3、GPU帶寬

CPU一樣,GPU帶寬也是芯片耗電的重要指標。當GPU持續進行高負載外部讀寫時,掉電就會過快。

UWA的GPU帶寬模塊統計了測試過程中單幀的讀寫帶寬總量,通過查看GPU帶寬模塊,可以快速定位測試過程中帶寬較高的場景和原因,并進行進一步測試優化。9e3ef5e8-4f29-11ed-b116-dac502259ad0.png


4、GPU圖元處理渲染面是產生GPU壓力的重要因素之一,我們可以通過 Overview 模式里的 Triangle 指標來查看和分析哪些畫面的渲染面較多。

9e4bc48a-4f29-11ed-b116-dac502259ad0.png

渲染面過多,一方面可能是模型過于復雜,一般可以通過 LOD、HLOD 等常用技術來簡化遠距離的模型,在不影響畫質的情況下顯著降低渲染面;另一方面,可能是地形、大建筑物等大面積模型沒有進行適當的拆分,導致進入視域體的面片可能不多,但提交GPU的渲染面依然很多。對于第二種情況,我們可以通過新功能“GPU圖元”來進行初步的判斷。

9e798d84-4f29-11ed-b116-dac502259ad0.png

總圖元數:提交到GPU端的圖元總數,該數值基本等同于引擎端統計的渲染面片總數。可見圖元數:在GPU端通過各種裁剪之后,留下的參與渲染的三角面。可見圖元不包括:因為在視域體外而被裁剪的三角面,因為朝向而被裁剪的三角面。因此,在3D場景中,比較理想的情況下,可見圖元的數量應該接近或高于 50%(對于大部分模型,有一半三角面會因為朝向被裁剪)。如果某些角度下,可見圖元的比例非常低,則很可能存在上文提到的第二種情況,從而可以針對性地檢查和優化場景中,這個角度下,被提交到GPU的大面積模型。

GPU圖元處理數量過多會對設備的帶寬和能耗造成較大的影響,應盡量在程序端完成剔除,并減小送往GPU的圖元數。

需要注意的是,基于架構不同,同一參數在不同品牌芯片上的推薦值也會存在差異,不同設備間橫向對比的意義不大,更推薦大家在相同的設備上進行縱向對比。同時,由于同品牌芯片的架構之間也會存在差異,UWA目前僅支持部分芯片的GPU Counter數據采集,具體支持設備列表可通過下圖或登錄UWA官網對“Mali/Power VR/Adreno GPUCounter支持設備”列表進行查詢:

https://www.uwa4d.com/main/supported.html9ec4f774-4f29-11ed-b116-dac502259ad0.png以上就是這次關于搭載 PowerVR GPU IP 芯片的新功能介紹了,希望會對開發者們在 GPU 優化上和項目的整體性能監控上有所幫助。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    459

    文章

    52119

    瀏覽量

    435593
  • vr
    vr
    +關注

    關注

    34

    文章

    9666

    瀏覽量

    152019
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    iTOP-3588S開發板核心架構GPU內置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    ,8GB內存,32GBEMMC。 核心架構GPU內置GPU可以完全兼容0penGLES1.1、2.0和3.2。 內置NPU RK3588S內置NPU,支持INT4/INT8/INT1
    發表于 05-15 10:36

    GPU加速計算平臺的優勢

    傳統的CPU雖然在日常計算任務中表現出色,但在面對大規模并行計算需求時,其性能往往捉襟見肘。而GPU加速計算平臺憑借其獨特的優勢,吸引了行業內人士的廣泛關注和應用。下面,AI部落小編為大家分享GPU加速計算
    的頭像 發表于 02-23 16:16 ?307次閱讀

    賽逸展2025響應四大行業協會倡議,審慎采購美國芯片!

    ,中國互聯網協會、中國汽車工業協會、中國半導體行業協會、中國通信企業協會發表聲明,呼吁國內企業審慎選擇采購美國芯片。賽逸展堅定不移地與中國四大行業協會站在一起,迅速加入四大協會陣營,全力支持
    的頭像 發表于 12-05 09:56 ?339次閱讀

    國科微亮相2024 UWA聯盟會員大會

    近日,2024 UWA SUMMIT暨世界超高清視頻產業聯盟會員大會在深圳開幕,超高清產業生態體驗展同期舉辦。作為UWA聯盟會員單位、超高清視頻賽道領先企業,國科微重磅展出4K/8K超高清解碼芯片系列與4K/8K超高清顯示
    的頭像 發表于 11-30 09:35 ?676次閱讀

    UVLED固化機結構的四大模塊

    UVLED固化機作為一種高效、節能的固化設備,在多個行業中發揮著重要作用。其結構設計的合理性直接決定了設備的性能和使用效果。UVLED固化機的四大模塊主要包括光源系統、控制系統、散熱系統和傳送系統
    的頭像 發表于 11-25 16:10 ?694次閱讀
    UVLED固化機結構的<b class='flag-5'>四大</b><b class='flag-5'>模塊</b>

    《算力芯片 高性能 CPUGPUNPU 微架構分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    CPU、GPU的演進歷程,AI專用芯片或將引領未來計算平臺的新方向。正如愛因斯坦所說:\"想象力比知識更重要\" —— 在芯片設計領域,創新思維帶來的突破往往令人驚嘆。
    發表于 11-24 17:12

    軟銀升級人工智能計算平臺,安裝4000顆英偉達Hopper GPU

    達Ampere GPU。通過新增的4000顆Hopper GPU,該平臺的總計算性能已躍升至每秒約4.7百億億次。
    的頭像 發表于 11-04 16:18 ?732次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--了解算力芯片GPU

    本篇閱讀學習第七、八章,了解GPU架構演進及CPGPU存儲體系與線程管理 █從圖形到計算的GPU架構演進 GPU圖像計算發展 ●從三角形開始的幾何階段 在現代圖形渲染中,三角形是最常用的基本圖形元素
    發表于 11-03 12:55

    Orin芯片的編程語言支持

    Orin是一款高度集成、高性能的車載計算平臺,由英偉達推出,并采用了英偉達自家的Volta架構GPU和其他高級處理器技術。關于Orin芯片的編程語言支持,可以從以下幾個方面進行介紹:
    的頭像 發表于 10-27 16:45 ?843次閱讀

    GPU加速計算平臺是什么

    GPU加速計算平臺,簡而言之,是利用圖形處理器(GPU)的強大并行計算能力來加速科學計算、數據分析、機器學習等復雜計算任務的軟硬件結合系統。
    的頭像 發表于 10-25 09:23 ?494次閱讀

    GPU算力租用平臺是什么

    GPU算力租用平臺是一種基于云計算的服務模式,它允許用戶通過互聯網按需租用高性能GPU資源,而無需自行購買、部署和維護這些硬件。
    的頭像 發表于 10-16 10:15 ?555次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽

    本帖最后由 1653149838.791300 于 2024-10-16 22:19 編輯 感謝平臺提供的書籍,厚厚的一本,很有分量,感謝作者的傾力付出成書。 本書主要講算力芯片CPU
    發表于 10-15 22:08

    名單公布!【書籍評測活動NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構分析

    。本書對華為等廠商推出的NPU芯片設計也做了架構描述,中國也擁有獨立自主知識產權的高算力芯片,并且支持芯片、高帶寬互連。本書也回顧了近20年來主流的CPU、
    發表于 09-02 10:09

    探秘四大主流芯片架構:誰將主宰未來科技?

    在科技日新月異的今天,芯片作為現代電子設備的心臟,其架構的選擇與設計顯得尤為重要。目前市場上主流的芯片架構有種:X86、ARM、RISC-V和MIPS。它們各具特色,廣泛應用于各種電子設備中。本文將詳細剖析這
    的頭像 發表于 07-31 11:15 ?4193次閱讀
    探秘<b class='flag-5'>四大</b>主流<b class='flag-5'>芯片</b>架構:誰將主宰未來科技?

    凌科推出M24型連接器卡扣模塊升級新品

    近日,凌科LP、BD、YM、DH四大系列M24型10芯/12芯/19芯/24芯推出性能提升版的新品。上述新品最大的亮點就是優化了模塊結構,新增了卡扣式模塊,有效化解了焊線后組裝存在易散
    的頭像 發表于 06-07 08:13 ?513次閱讀
    凌科推出M24型連接器卡扣<b class='flag-5'>模塊</b>升級新品