RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

UWA平臺(tái)支持PowerVR芯片,新增四大GPU模塊分析

穎脈Imgtec ? 2022-10-19 11:18 ? 次閱讀

日前,游戲和VR應(yīng)用性能優(yōu)化平臺(tái) UWA 宣布新的 GPU Counter 功能更新:增加了對(duì) PowerVR 品牌 GPU 芯片的支持。針對(duì) PowerVR GPUCounter,UWA提供了 GPU 負(fù)載、GPU 著色、GPU 帶寬、GPU 圖元 4 個(gè)模塊的分析。最新的 UWA SDK 2.4.4 已發(fā)布,下載最新版 SDK,并使用搭載 PowerVR GPU IP 芯片的設(shè)備進(jìn)行測(cè)試,即可在GOT Online Overview的GPU模塊下查看到對(duì)應(yīng)的數(shù)據(jù),掌握GPU壓力和性能消耗情況。

以下針對(duì)PowerVR GPU Counter,圍繞UWA所提供的GPU 負(fù)載、GPU著色、GPU帶寬、GPU圖元4個(gè)模塊的分析進(jìn)行詳細(xì)說明。


1、GPU負(fù)載

GPU Counter下的GPU負(fù)載包含Non Fragment Utilization和Fragment Utilization兩個(gè)性能指標(biāo),分別代表非片段處理占整體GPU處理耗時(shí)百分比和片段處理開銷占整體GPU處理開銷百分比。

9ddd0478-4f29-11ed-b116-dac502259ad0.png

在GPU上運(yùn)行的工作負(fù)載由作業(yè)管理器統(tǒng)一協(xié)調(diào),該任務(wù)管理器負(fù)責(zé)將工作負(fù)載調(diào)度到GPU內(nèi)部的各個(gè)處理單元上,它將兩個(gè)FIFO工作隊(duì)列,稱為作業(yè)插槽。其中,一個(gè)插槽用于非片段工作負(fù)載,另一個(gè)插槽則用于片段著色工作負(fù)載。當(dāng)出現(xiàn)GPU瓶頸時(shí),正常情況下Non Fragment Utilization和Fragment Utilization至少有一個(gè)是接近100%,如果兩者都低于100%,則有可能是Non Fragment和Fragment之間存在數(shù)據(jù)依賴關(guān)系。

當(dāng)Non Fragment Utilization過高時(shí),開發(fā)者可以從頂點(diǎn)數(shù)、復(fù)雜的Compute Shader的使用情況以及Geometry Shader、Tessellation Shader等角度著手進(jìn)行優(yōu)化。當(dāng)Fragment Utilization過高時(shí),則可以考慮項(xiàng)目中是否存在是否存在片段數(shù)目過多、片段Shader過于復(fù)雜。


2、GPU著色

包含Overdraw和Cycles/Pixel兩個(gè)指標(biāo)。

9df65c16-4f29-11ed-b116-dac502259ad0.png

Overdraw(過度繪制)

該項(xiàng)表示項(xiàng)目運(yùn)行過程中,單幀中整個(gè)屏幕被填充的倍數(shù)。倍數(shù)越高,則GPU的壓力越大。在游戲運(yùn)行過程中,場(chǎng)景中半透明物體的重合會(huì)使得同一個(gè)像素點(diǎn)在一幀中會(huì)被繪制多次,造成Overdraw過高的情況。如下圖所示,UI和粒子特效層疊導(dǎo)致容易出現(xiàn)Overdraw。9e0b3a28-4f29-11ed-b116-dac502259ad0.png

Cycles/Pixel

表示平均每個(gè)像素耗費(fèi)的GPU時(shí)鐘周期。一般來說,Shader復(fù)雜度會(huì)極大地影響GPUCycles占用的情況。當(dāng)畫面的Shader復(fù)雜度過高時(shí),GPU需要消耗大量的時(shí)鐘周期對(duì)Shader進(jìn)行運(yùn)算,容易造成GPU耗時(shí)變高,造成卡頓。

因此,通過查看GPU著色模塊,就可以快速定位高Overdraw和高Cycles的場(chǎng)景,判斷這個(gè)場(chǎng)景的GPU壓力較高是Overdraw還是Shader復(fù)雜度過高造成的,進(jìn)行有針對(duì)性的優(yōu)化。


3、GPU帶寬

CPU一樣,GPU帶寬也是芯片耗電的重要指標(biāo)。當(dāng)GPU持續(xù)進(jìn)行高負(fù)載外部讀寫時(shí),掉電就會(huì)過快。

UWA的GPU帶寬模塊統(tǒng)計(jì)了測(cè)試過程中單幀的讀寫帶寬總量,通過查看GPU帶寬模塊,可以快速定位測(cè)試過程中帶寬較高的場(chǎng)景和原因,并進(jìn)行進(jìn)一步測(cè)試優(yōu)化。9e3ef5e8-4f29-11ed-b116-dac502259ad0.png


4、GPU圖元處理渲染面是產(chǎn)生GPU壓力的重要因素之一,我們可以通過 Overview 模式里的 Triangle 指標(biāo)來查看和分析哪些畫面的渲染面較多。

9e4bc48a-4f29-11ed-b116-dac502259ad0.png

渲染面過多,一方面可能是模型過于復(fù)雜,一般可以通過 LOD、HLOD 等常用技術(shù)來簡化遠(yuǎn)距離的模型,在不影響畫質(zhì)的情況下顯著降低渲染面;另一方面,可能是地形、大建筑物等大面積模型沒有進(jìn)行適當(dāng)?shù)牟鸱?,?dǎo)致進(jìn)入視域體的面片可能不多,但提交GPU的渲染面依然很多。對(duì)于第二種情況,我們可以通過新功能“GPU圖元”來進(jìn)行初步的判斷。

9e798d84-4f29-11ed-b116-dac502259ad0.png

總圖元數(shù):提交到GPU端的圖元總數(shù),該數(shù)值基本等同于引擎端統(tǒng)計(jì)的渲染面片總數(shù)。可見圖元數(shù):在GPU端通過各種裁剪之后,留下的參與渲染的三角面。可見圖元不包括:因?yàn)樵谝曈蝮w外而被裁剪的三角面,因?yàn)槌蚨徊眉舻娜敲?。因此,?D場(chǎng)景中,比較理想的情況下,可見圖元的數(shù)量應(yīng)該接近或高于 50%(對(duì)于大部分模型,有一半三角面會(huì)因?yàn)槌虮徊眉簦?。如果某些角度下,可見圖元的比例非常低,則很可能存在上文提到的第二種情況,從而可以針對(duì)性地檢查和優(yōu)化場(chǎng)景中,這個(gè)角度下,被提交到GPU的大面積模型。

GPU圖元處理數(shù)量過多會(huì)對(duì)設(shè)備的帶寬和能耗造成較大的影響,應(yīng)盡量在程序端完成剔除,并減小送往GPU的圖元數(shù)。

需要注意的是,基于架構(gòu)不同,同一參數(shù)在不同品牌芯片上的推薦值也會(huì)存在差異,不同設(shè)備間橫向?qū)Ρ鹊囊饬x不大,更推薦大家在相同的設(shè)備上進(jìn)行縱向?qū)Ρ?。同時(shí),由于同品牌芯片的架構(gòu)之間也會(huì)存在差異,UWA目前僅支持部分芯片的GPU Counter數(shù)據(jù)采集,具體支持設(shè)備列表可通過下圖或登錄UWA官網(wǎng)對(duì)“Mali/Power VR/Adreno GPUCounter支持設(shè)備”列表進(jìn)行查詢:

https://www.uwa4d.com/main/supported.html9ec4f774-4f29-11ed-b116-dac502259ad0.png以上就是這次關(guān)于搭載 PowerVR GPU IP 芯片的新功能介紹了,希望會(huì)對(duì)開發(fā)者們?cè)?GPU 優(yōu)化上和項(xiàng)目的整體性能監(jiān)控上有所幫助。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    455

    文章

    50714

    瀏覽量

    423135
  • vr
    vr
    +關(guān)注

    關(guān)注

    34

    文章

    9638

    瀏覽量

    150207
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    賽逸展2025響應(yīng)四大行業(yè)協(xié)會(huì)倡議,審慎采購美國芯片!

    ,中國互聯(lián)網(wǎng)協(xié)會(huì)、中國汽車工業(yè)協(xié)會(huì)、中國半導(dǎo)體行業(yè)協(xié)會(huì)、中國通信企業(yè)協(xié)會(huì)發(fā)表聲明,呼吁國內(nèi)企業(yè)審慎選擇采購美國芯片。賽逸展堅(jiān)定不移地與中國四大行業(yè)協(xié)會(huì)站在一起,迅速加入四大協(xié)會(huì)陣營,全力支持
    的頭像 發(fā)表于 12-05 09:56 ?126次閱讀

    國科微亮相2024 UWA聯(lián)盟會(huì)員大會(huì)

    近日,2024 UWA SUMMIT暨世界超高清視頻產(chǎn)業(yè)聯(lián)盟會(huì)員大會(huì)在深圳開幕,超高清產(chǎn)業(yè)生態(tài)體驗(yàn)展同期舉辦。作為UWA聯(lián)盟會(huì)員單位、超高清視頻賽道領(lǐng)先企業(yè),國科微重磅展出4K/8K超高清解碼芯片系列與4K/8K超高清顯示
    的頭像 發(fā)表于 11-30 09:35 ?362次閱讀

    UVLED固化機(jī)結(jié)構(gòu)的四大模塊

    UVLED固化機(jī)作為一種高效、節(jié)能的固化設(shè)備,在多個(gè)行業(yè)中發(fā)揮著重要作用。其結(jié)構(gòu)設(shè)計(jì)的合理性直接決定了設(shè)備的性能和使用效果。UVLED固化機(jī)的四大模塊主要包括光源系統(tǒng)、控制系統(tǒng)、散熱系統(tǒng)和傳送系統(tǒng)
    的頭像 發(fā)表于 11-25 16:10 ?186次閱讀
    UVLED固化機(jī)結(jié)構(gòu)的<b class='flag-5'>四大</b><b class='flag-5'>模塊</b>

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    CPU、GPU的演進(jìn)歷程,AI專用芯片或?qū)⒁I(lǐng)未來計(jì)算平臺(tái)的新方向。正如愛因斯坦所說:\"想象力比知識(shí)更重要\" —— 在芯片設(shè)計(jì)領(lǐng)域,創(chuàng)新思維帶來的突破往往令人驚嘆。
    發(fā)表于 11-24 17:12

    軟銀升級(jí)人工智能計(jì)算平臺(tái),安裝4000顆英偉達(dá)Hopper GPU

    達(dá)Ampere GPU。通過新增的4000顆Hopper GPU,該平臺(tái)的總計(jì)算性能已躍升至每秒約4.7百億億次。
    的頭像 發(fā)表于 11-04 16:18 ?427次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU

    本篇閱讀學(xué)習(xí)第七、八章,了解GPU架構(gòu)演進(jìn)及CPGPU存儲(chǔ)體系與線程管理 █從圖形到計(jì)算的GPU架構(gòu)演進(jìn) GPU圖像計(jì)算發(fā)展 ●從三角形開始的幾何階段 在現(xiàn)代圖形渲染中,三角形是最常用的基本圖形元素
    發(fā)表于 11-03 12:55

    Orin芯片的編程語言支持

    Orin是一款高度集成、高性能的車載計(jì)算平臺(tái),由英偉達(dá)推出,并采用了英偉達(dá)自家的Volta架構(gòu)GPU和其他高級(jí)處理器技術(shù)。關(guān)于Orin芯片的編程語言支持,可以從以下幾個(gè)方面進(jìn)行介紹:
    的頭像 發(fā)表于 10-27 16:45 ?269次閱讀

    GPU加速計(jì)算平臺(tái)是什么

    GPU加速計(jì)算平臺(tái),簡而言之,是利用圖形處理器(GPU)的強(qiáng)大并行計(jì)算能力來加速科學(xué)計(jì)算、數(shù)據(jù)分析、機(jī)器學(xué)習(xí)等復(fù)雜計(jì)算任務(wù)的軟硬件結(jié)合系統(tǒng)。
    的頭像 發(fā)表于 10-25 09:23 ?245次閱讀

    GPU算力租用平臺(tái)是什么

    GPU算力租用平臺(tái)是一種基于云計(jì)算的服務(wù)模式,它允許用戶通過互聯(lián)網(wǎng)按需租用高性能GPU資源,而無需自行購買、部署和維護(hù)這些硬件。
    的頭像 發(fā)表于 10-16 10:15 ?200次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書概覽

    本帖最后由 1653149838.791300 于 2024-10-16 22:19 編輯 感謝平臺(tái)提供的書籍,厚厚的一本,很有分量,感謝作者的傾力付出成書。 本書主要講算力芯片CPU
    發(fā)表于 10-15 22:08

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    。本書對(duì)華為等廠商推出的NPU芯片設(shè)計(jì)也做了架構(gòu)描述,中國也擁有獨(dú)立自主知識(shí)產(chǎn)權(quán)的高算力芯片,并且支持芯片、高帶寬互連。本書也回顧了近20年來主流的CPU、
    發(fā)表于 09-02 10:09

    探秘四大主流芯片架構(gòu):誰將主宰未來科技?

    在科技日新月異的今天,芯片作為現(xiàn)代電子設(shè)備的心臟,其架構(gòu)的選擇與設(shè)計(jì)顯得尤為重要。目前市場(chǎng)上主流的芯片架構(gòu)有種:X86、ARM、RISC-V和MIPS。它們各具特色,廣泛應(yīng)用于各種電子設(shè)備中。本文將詳細(xì)剖析這
    的頭像 發(fā)表于 07-31 11:15 ?2655次閱讀
    探秘<b class='flag-5'>四大</b>主流<b class='flag-5'>芯片</b>架構(gòu):誰將主宰未來科技?

    凌科推出M24型連接器卡扣模塊升級(jí)新品

    近日,凌科LP、BD、YM、DH四大系列M24型10芯/12芯/19芯/24芯推出性能提升版的新品。上述新品最大的亮點(diǎn)就是優(yōu)化了模塊結(jié)構(gòu),新增了卡扣式模塊,有效化解了焊線后組裝存在易散
    的頭像 發(fā)表于 06-07 08:13 ?283次閱讀
    凌科推出M24型連接器卡扣<b class='flag-5'>模塊</b>升級(jí)新品

    8芯M16接口四大優(yōu)點(diǎn)

      德索工程師說道8芯M16接口作為一種高性能的電氣連接器,憑借其獨(dú)特的設(shè)計(jì)和優(yōu)越的性能,在多個(gè)領(lǐng)域得到了廣泛的應(yīng)用。以下是關(guān)于8芯M16接口的四大優(yōu)點(diǎn),進(jìn)行詳細(xì)的分析和闡述。
    的頭像 發(fā)表于 05-23 17:43 ?401次閱讀
    8芯M16接口<b class='flag-5'>四大</b>優(yōu)點(diǎn)

    MES實(shí)施的四大疑惑

    電子發(fā)燒友網(wǎng)站提供《MES實(shí)施的四大疑惑.docx》資料免費(fèi)下載
    發(fā)表于 03-01 15:35 ?0次下載
    RM新时代网站-首页