RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

搭載 PowerVR GPU IP 芯片的新功能介紹

Dbwd_Imgtec ? 來源:Imagination Tech ? 作者:Imagination Tech ? 2022-10-17 14:57 ? 次閱讀

日前,游戲和VR應(yīng)用性能優(yōu)化平臺 UWA 宣布新的 GPU Counter 功能更新:增加了對 PowerVR 品牌 GPU 芯片的支持。針對 PowerVR GPUCounter,UWA提供了 GPU 負載、GPU 著色、GPU 帶寬、GPU 圖元 4 個模塊的分析。 最新的 UWA SDK 2.4.4 已發(fā)布,下載最新版 SDK,并使用搭載 PowerVR GPU IP 芯片的設(shè)備進行測試,即可在GOT Online Overview的GPU模塊下查看到對應(yīng)的數(shù)據(jù),掌握GPU壓力和性能消耗情況。

以下針對PowerVR GPU Counter,圍繞UWA所提供的GPU 負載、GPU著色、GPU帶寬、GPU圖元4個模塊的分析進行詳細說明。

1、GPU負載

GPU Counter下的GPU負載包含Non Fragment Utilization和Fragment Utilization兩個性能指標,分別代表非片段處理占整體GPU處理耗時百分比和片段處理開銷占整體GPU處理開銷百分比。

91e6c744-4dc6-11ed-a3b6-dac502259ad0.png

在GPU上運行的工作負載由作業(yè)管理器統(tǒng)一協(xié)調(diào),該任務(wù)管理器負責將工作負載調(diào)度到GPU內(nèi)部的各個處理單元上,它將兩個FIFO工作隊列,稱為作業(yè)插槽。其中,一個插槽用于非片段工作負載,另一個插槽則用于片段著色工作負載。 當出現(xiàn)GPU瓶頸時,正常情況下Non Fragment Utilization和Fragment Utilization至少有一個是接近100%,如果兩者都低于100%,則有可能是Non Fragment和Fragment之間存在數(shù)據(jù)依賴關(guān)系。

當Non Fragment Utilization過高時,開發(fā)者可以從頂點數(shù)、復(fù)雜的Compute Shader的使用情況以及Geometry Shader、Tessellation Shader等角度著手進行優(yōu)化。當Fragment Utilization過高時,則可以考慮項目中是否存在是否存在片段數(shù)目過多、片段Shader過于復(fù)雜。

2、GPU著色

包含Overdraw和Cycles/Pixel兩個指標。

921a7ec2-4dc6-11ed-a3b6-dac502259ad0.png

Overdraw(過度繪制)

該項表示項目運行過程中,單幀中整個屏幕被填充的倍數(shù)。倍數(shù)越高,則GPU的壓力越大。在游戲運行過程中,場景中半透明物體的重合會使得同一個像素點在一幀中會被繪制多次,造成Overdraw過高的情況。如下圖所示,UI和粒子特效層疊導(dǎo)致容易出現(xiàn)Overdraw。 92493866-4dc6-11ed-a3b6-dac502259ad0.png

Cycles/Pixel

表示平均每個像素耗費的GPU時鐘周期。一般來說,Shader復(fù)雜度會極大地影響GPUCycles占用的情況。當畫面的Shader復(fù)雜度過高時,GPU需要消耗大量的時鐘周期對Shader進行運算,容易造成GPU耗時變高,造成卡頓。

因此,通過查看GPU著色模塊,就可以快速定位高Overdraw和高Cycles的場景,判斷這個場景的GPU壓力較高是Overdraw還是Shader復(fù)雜度過高造成的,進行有針對性的優(yōu)化。

3、GPU帶寬

CPU一樣,GPU帶寬也是芯片耗電的重要指標。當GPU持續(xù)進行高負載外部讀寫時,掉電就會過快。

UWA的GPU帶寬模塊統(tǒng)計了測試過程中單幀的讀寫帶寬總量,通過查看GPU帶寬模塊,可以快速定位測試過程中帶寬較高的場景和原因,并進行進一步測試優(yōu)化。 93496c0e-4dc6-11ed-a3b6-dac502259ad0.png

4、GPU圖元處理 渲染面是產(chǎn)生GPU壓力的重要因素之一,我們可以通過 Overview 模式里的 Triangle 指標來查看和分析哪些畫面的渲染面較多。

9361d974-4dc6-11ed-a3b6-dac502259ad0.png

渲染面過多,一方面可能是模型過于復(fù)雜,一般可以通過 LOD、HLOD 等常用技術(shù)來簡化遠距離的模型,在不影響畫質(zhì)的情況下顯著降低渲染面;另一方面,可能是地形、大建筑物等大面積模型沒有進行適當?shù)牟鸱?,?dǎo)致進入視域體的面片可能不多,但提交GPU的渲染面依然很多。 對于第二種情況,我們可以通過新功能“GPU圖元”來進行初步的判斷。

939e87fc-4dc6-11ed-a3b6-dac502259ad0.png

總圖元數(shù):提交到GPU端的圖元總數(shù),該數(shù)值基本等同于引擎端統(tǒng)計的渲染面片總數(shù)。 可見圖元數(shù):在GPU端通過各種裁剪之后,留下的參與渲染的三角面。 可見圖元不包括:因為在視域體外而被裁剪的三角面,因為朝向而被裁剪的三角面。因此,在3D場景中,比較理想的情況下,可見圖元的數(shù)量應(yīng)該接近或高于 50%(對于大部分模型,有一半三角面會因為朝向被裁剪)。如果某些角度下,可見圖元的比例非常低,則很可能存在上文提到的第二種情況,從而可以針對性地檢查和優(yōu)化場景中,這個角度下,被提交到GPU的大面積模型。

93baad4c-4dc6-11ed-a3b6-dac502259ad0.png

GPU圖元處理數(shù)量過多會對設(shè)備的帶寬和能耗造成較大的影響,應(yīng)盡量在程序端完成剔除,并減小送往GPU的圖元數(shù)。

需要注意的是,基于架構(gòu)不同,同一參數(shù)在不同品牌芯片上的推薦值也會存在差異,不同設(shè)備間橫向?qū)Ρ鹊囊饬x不大,更推薦大家在相同的設(shè)備上進行縱向?qū)Ρ?。同時,由于同品牌芯片的架構(gòu)之間也會存在差異,UWA目前僅支持部分芯片的GPU Counter數(shù)據(jù)采集,具體支持設(shè)備列表可通過下圖或登錄UWA官網(wǎng)對“Mali/Power VR/Adreno GPUCounter支持設(shè)備”列表進行查詢:

93e76d64-4dc6-11ed-a3b6-dac502259ad0.png ? 以上就是這次關(guān)于搭載 PowerVR GPU IP 芯片的新功能介紹了,希望會對開發(fā)者們在 GPU 優(yōu)化上和項目的整體性能監(jiān)控上有所幫助?! ?/p>

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    455

    文章

    50714

    瀏覽量

    423136
  • 模塊
    +關(guān)注

    關(guān)注

    7

    文章

    2695

    瀏覽量

    47431
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4729

    瀏覽量

    128890
  • SDK
    SDK
    +關(guān)注

    關(guān)注

    3

    文章

    1035

    瀏覽量

    45899

原文標題:UWA平臺支持PowerVR芯片,新增四大GPU模塊分析

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】--了解算力芯片GPU

    著色器(Pixel shader)是圖形流水線中算力相當強大的功能單元,因為它可以為每個片段執(zhí)行復(fù)雜的計算,從而為最終渲染的圖像添加細節(jié)和視覺效果。 DirectX API推動 GPU 演進
    發(fā)表于 11-03 12:55

    基于GPU器件行為的創(chuàng)新分布式功能安全機制為智能駕駛保駕護航

    在鎖步和重復(fù)校驗兩種常見的功能安全機制之外,全球領(lǐng)先的GPU IP廠商Imagination帶來一種全新的、高性價比的分布式功能安全機制。
    的頭像 發(fā)表于 10-11 13:14 ?236次閱讀
    基于<b class='flag-5'>GPU</b>器件行為的創(chuàng)新分布式<b class='flag-5'>功能</b>安全機制為智能駕駛保駕護航

    Zigbee 3.0的新功能

    電子發(fā)燒友網(wǎng)站提供《Zigbee 3.0的新功能.pdf》資料免費下載
    發(fā)表于 09-26 10:45 ?0次下載
    Zigbee 3.0的<b class='flag-5'>新功能</b>

    HSW-IP5356功能介紹

    英集芯的IP5356M是一款功能強大的移動電源SOC,它集成了多種快充協(xié)議和電源管理功能,展現(xiàn)了卓越的兼容性和高效性。IP5356M支持高壓SCP、雙向PD3.0等快充協(xié)議,能為各種移
    發(fā)表于 08-09 14:48 ?1次下載

    Arm發(fā)布針對旗艦智能手機的新一代CPU和GPU IP

    全球領(lǐng)先的芯片設(shè)計公司Arm宣布了針對旗艦智能手機市場的全新CPU和GPU IP設(shè)計方案——Cortex-X925 CPU和Immortalis G925 GPU。這兩款產(chǎn)品均基于Ar
    的頭像 發(fā)表于 05-31 09:44 ?585次閱讀

    大模型快速發(fā)展,GPU IP有何作用

    ? 電子發(fā)燒友網(wǎng)報道(文/李彎彎)隨著人工智能技術(shù)的快速發(fā)展,GPU作為重要的算力支撐時常被提及。國內(nèi)外重要的GPU芯片公司也為人熟知,包括英偉達、AMD、英特爾,景嘉微、海光信息、天數(shù)智芯、摩爾
    的頭像 發(fā)表于 05-29 00:05 ?2332次閱讀

    OpenAI推出ChatGPT實時數(shù)據(jù)分析新功能

    近日,OpenAI在ChatGPT中推出了令人矚目的實時數(shù)據(jù)分析新功能。這一創(chuàng)新功能為用戶提供了前所未有的數(shù)據(jù)處理體驗,極大地提升了數(shù)據(jù)處理的便捷性。
    的頭像 發(fā)表于 05-20 11:28 ?600次閱讀

    炬芯科技智能手表SoC采用芯原2.5D GPU IP

    近日,芯原股份與低功耗AIoT芯片設(shè)計廠商炬芯科技股份有限公司(炬芯科技)達成合作。炬芯科技在其高集成度的雙模藍牙智能手表SoC ATS3085S和ATS3089系列中,成功采用了芯原提供的低功耗且功能豐富的2.5D圖形處理器(GPU
    的頭像 發(fā)表于 05-16 14:58 ?1361次閱讀

    STM32G4芯片怎么使用最新功能三角函數(shù)?

    求助各位大佬: STM32G4芯片怎么使用最新功能三角函數(shù)?
    發(fā)表于 04-15 08:17

    嘉楠科技商用量產(chǎn)端側(cè)AIoT芯片K230采用芯原ISP IPGPU IP

    芯原股份今日宣布,與嘉楠科技達成重要合作。嘉楠科技全球首發(fā)的支持RISC-V Vector 1.0標準的商用量產(chǎn)端側(cè)AIoT芯片K230,成功集成了芯原的三大核心IP技術(shù):圖像信號處理器IP ISP8000、畸變矯正處理器
    的頭像 發(fā)表于 03-27 10:06 ?767次閱讀

    XPT2046芯片功能介紹

    電子發(fā)燒友網(wǎng)站提供《XPT2046芯片功能介紹.pdf》資料免費下載
    發(fā)表于 03-26 09:10 ?3次下載

    嘉楠端側(cè)AIoT芯片K230集成芯原ISP IPGPU IP

    AIoT芯片K230,成功集成了芯原的圖像信號處理器(ISP)IP ISP8000、畸變矯正(DeWarp)處理器IP DW200,以及2.5D圖形處理器(GPU
    的頭像 發(fā)表于 03-14 10:02 ?1286次閱讀

    嘉楠基于RISC-V的端側(cè)AIoT SoC采用了芯原的ISP IPGPU IP

    原的圖像信號處理器 (ISP) IP ISP8000、畸變矯正 (DeWarp) 處理器IP DW200,以及2.5D圖形處理器 (GPU) IP GCNanoV。
    的頭像 發(fā)表于 03-14 09:03 ?503次閱讀

    gpu是什么和cpu的區(qū)別

    GPU和CPU是兩種常見的計算機處理器,它們在結(jié)構(gòu)和功能上有很大的區(qū)別。在這篇文章中,我們將探討GPU和CPU的區(qū)別,并詳細介紹它們的原理、應(yīng)用領(lǐng)域和性能特點。 一、概述 1.1
    的頭像 發(fā)表于 02-20 11:24 ?1.9w次閱讀

    IP5518多功能電源管理芯片

    IP5518 是英集芯的一款集成 5V 升壓轉(zhuǎn)換器、鋰電池充電管理、電池電量指示的多功能電源管理芯片,為 TWS藍牙耳機充電倉提供完整的電源解決方案。IP5518 的高集成度與豐富
    發(fā)表于 12-27 09:58 ?2次下載
    RM新时代网站-首页