RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Imagination 與 MulticoreWare 合作將 GPU 技術(shù)用于全新的雙目視覺方案

穎脈Imgtec ? 2022-11-30 15:41 ? 次閱讀

Imagination 近日宣布了與MulticoreWare.Inc公司的合作,后者是多核和異構(gòu)計(jì)算環(huán)境軟件解決方案和開發(fā)工具的領(lǐng)先供應(yīng)商。MulticoreWare公司在展銳T710開發(fā)板上實(shí)現(xiàn)雙目視覺算法stereoBM的openCL版本的移植和優(yōu)化,移植后的算法在GPU平臺(tái)上性能提升明顯。展銳T710開發(fā)板內(nèi)部集成了Imagination GM9446顯示芯片,主頻為800MHz,采用12nm工藝制造,支持openCL4.0, openCL1.2和openGL3.0版本,最高性能能夠達(dá)到128 FP32 FLOPs/Clock 和256 FP16 FLOPs/Clock。CPU支持八核處理器,主頻2.0GHz, 內(nèi)部集成AI神經(jīng)網(wǎng)絡(luò)處理器NPU,綜合算力達(dá)4.2TOPS。29a56fb8-7045-11ed-b116-dac502259ad0.png為了進(jìn)一步提升開發(fā)板的算力,MulticoreWare團(tuán)隊(duì)在雙目視覺stereoBM的OpenCL實(shí)現(xiàn)中,使用了開發(fā)板的Imagination GM9446系列GPU作為運(yùn)算核心,相對(duì)于傳統(tǒng)CPU的雙目視覺算法stereo版本得到了極高的加速比。這組算法的設(shè)計(jì)充分使用了Imagination GM9446的特點(diǎn),采用大窗口尺寸和小分辨率圖像620x188,local memory存儲(chǔ)優(yōu)化等方式提高了程序的性能。

算法經(jīng)過調(diào)整不同的參數(shù),窗口winSize大小為21,n_disp為64的時(shí)候,性能達(dá)到最佳。通常kernel越復(fù)雜,寄存器占用的空間就越大,最大工作組的大小就越小,有時(shí)候發(fā)揮不出來并行流水線的最大數(shù)量,從而影響性能。

29c21514-7045-11ed-b116-dac502259ad0.png

MulticoreWare公司團(tuán)隊(duì)在對(duì)kernel代碼優(yōu)化內(nèi)部的寄存器使用量,根據(jù)GM9446內(nèi)部結(jié)構(gòu),設(shè)置合理的global全局工作組大小256x圖片高度,local工作大小為256,從而最大程度發(fā)揮GPU并行流水線的并發(fā)量,一般情況下,第一個(gè)維度的工作組大小應(yīng)該是wave大小的倍數(shù)(例如32),這樣可以充分利用wave資源,MulticoreWare團(tuán)隊(duì)根據(jù)多年優(yōu)化經(jīng)驗(yàn),手動(dòng)調(diào)整工作組大小以滿足這個(gè)條件來保證性能有所提升。29d69908-7045-11ed-b116-dac502259ad0.png此外內(nèi)存讀取也是影響kernel運(yùn)行效率的一方面,在OpenCL中一般有全局global內(nèi)存,本地local內(nèi)存,常量Constant和Private四種形式組成,MulticoreWare公司團(tuán)隊(duì)在將stereo算法重新調(diào)整內(nèi)存布局,將主機(jī)內(nèi)存使用零拷貝技術(shù)與GPU內(nèi)存直接填充,另外將內(nèi)核kernel多次內(nèi)存訪問的數(shù)據(jù),從global內(nèi)存轉(zhuǎn)存到local內(nèi)存中,雖然增加了一次轉(zhuǎn)存數(shù)據(jù)的時(shí)間,但是對(duì)于對(duì)此存取數(shù)據(jù)整體時(shí)間是縮減的,從降低IO時(shí)間的角度整體提高了kernel內(nèi)核的運(yùn)行效率,性能也有所改善。運(yùn)行10次后進(jìn)行效率對(duì)比,GPU比CPU計(jì)算最高提速80倍左右,平均提速50倍左右。

CPU(展銳T710 2.0GHz)

CPU(Unisoc T710, 2.0GHz)

GPU

(Imagination GM9446)

倍數(shù)

Multiple

131.935 ms0.76 ms41.9
256.17 ms0.699 ms80.3
354.22 ms0.72 ms75.3
451.67 ms0.77 ms67
531.72 ms0.74 ms42.8
627.12 ms0.73 ms37.1
733.35 ms0.77 ms43.3
850.12 ms0.75 ms66.8
931.29 ms0.71 ms44
1029.73 ms0.72 ms41.29

未來Imagination和MulticoreWare兩家公司將致力于共同促進(jìn)OpenCL在行業(yè)中的廣泛采用,鼓勵(lì)OpenCL廣泛應(yīng)用于異構(gòu)計(jì)算、APU、以及CPU和GPU獨(dú)立計(jì)算的領(lǐng)域中,實(shí)現(xiàn)計(jì)算資源利用率最大化、高效率處理數(shù)據(jù)傳輸。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4729

    瀏覽量

    128890
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Imagination 系列研討會(huì) |中國生成式 AI 的發(fā)展

    近期,Imagination陸續(xù)推出全新系列研討會(huì),涵蓋邊緣AI如何推動(dòng)工業(yè)物聯(lián)網(wǎng)的發(fā)展,生成式AI,智能汽車未來發(fā)展趨勢等等多個(gè)熱門話題。本期研討會(huì)中,Imagination中國區(qū)
    的頭像 發(fā)表于 12-09 16:57 ?251次閱讀
    <b class='flag-5'>Imagination</b> 系列研討會(huì) |中國生成式 AI 的發(fā)展

    用于機(jī)器視覺應(yīng)用的智能機(jī)器視覺控制平臺(tái)

    看51camera的合作伙伴Neousys宸曜科技的Nuvis系列工控機(jī)。Nuvis系列機(jī)器視覺控制平臺(tái)是適用于現(xiàn)如今機(jī)器視覺市場的高整合機(jī)器視覺解
    的頭像 發(fā)表于 11-23 01:08 ?162次閱讀
    適<b class='flag-5'>用于</b>機(jī)器<b class='flag-5'>視覺</b>應(yīng)用的智能機(jī)器<b class='flag-5'>視覺</b>控制平臺(tái)

    Imagination DXS GPU榮獲ASIL-B官方認(rèn)證

    全球硅知識(shí)產(chǎn)權(quán)(IP)領(lǐng)域的佼佼者Imagination Technologies宣布了一項(xiàng)重要成就:其專為汽車領(lǐng)域打造的Imagination DXS GPU IP,已成功通過SGS-TüV Saar的全面審核與評(píng)估,正式獲得
    的頭像 發(fā)表于 11-14 16:37 ?439次閱讀

    在線研討會(huì) | Imagination產(chǎn)品總監(jiān)全面解讀最新DXS GPU

    不久前,Imagination重磅推出其最新的、用于車載智能和交互的汽車圖形處理器(GPU)IP產(chǎn)品ImaginationDXSGPU。為了讓更多對(duì)GPU感興趣的讀者全面了解DXSGP
    的頭像 發(fā)表于 10-10 08:07 ?196次閱讀
    在線研討會(huì) | <b class='flag-5'>Imagination</b>產(chǎn)品總監(jiān)全面解讀最新DXS <b class='flag-5'>GPU</b>

    Imagination DXS GPU:重塑汽車智能與交互的未來

    增長。在此背景下,Imagination公司最新推出的DXS GPU IP產(chǎn)品,以其可擴(kuò)展性、靈活性和強(qiáng)大的計(jì)算能力,為車載智能與交互系統(tǒng)注入了新的活力。
    的頭像 發(fā)表于 09-23 13:06 ?778次閱讀

    Imagination推出性能最高且具有高等級(jí)功能安全性的汽車GPU IP

    Imagination DXS GPU 進(jìn)一步擴(kuò)大其在汽車領(lǐng)域的領(lǐng)先地位
    的頭像 發(fā)表于 09-14 17:41 ?365次閱讀

    Imagination GPU為邊緣智能提供高效率的加速

    作者:Imagination
    的頭像 發(fā)表于 09-11 13:10 ?250次閱讀
    <b class='flag-5'>Imagination</b> <b class='flag-5'>GPU</b>為邊緣智能提供高效率的加速

    新加坡電信與日立深化合作,共推數(shù)據(jù)中心與GPU技術(shù)

    新加坡電信與日立公司近日宣布,雙方已正式簽署諒解備忘錄,標(biāo)志著雙方在數(shù)據(jù)中心及圖形處理器(GPU)云技術(shù)領(lǐng)域的合作邁入新階段。此次合作是在雙方6月初步
    的頭像 發(fā)表于 08-26 16:25 ?592次閱讀

    什么是GPU技術(shù)?它有哪些應(yīng)用?

    GPU技術(shù),即圖形處理器(Graphics Processing Unit)技術(shù),是一種專門設(shè)計(jì)用于處理圖像和圖形數(shù)據(jù)的微處理器技術(shù)。隨著計(jì)
    的頭像 發(fā)表于 08-22 14:34 ?2278次閱讀

    微鏈道愛與浪潮信息合作,AI視覺技術(shù)邁入全新階段

    的服務(wù)器解決方案提供商浪潮信息正式簽署了元腦生態(tài)戰(zhàn)略合作協(xié)議,標(biāo)志著雙方在AI視覺技術(shù)領(lǐng)域的合作邁入了一個(gè)
    的頭像 發(fā)表于 07-08 17:00 ?534次閱讀

    大模型快速發(fā)展,GPU IP有何作用

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)隨著人工智能技術(shù)的快速發(fā)展,GPU作為重要的算力支撐時(shí)常被提及。國內(nèi)外重要的GPU芯片公司也為人熟知,包括英偉達(dá)、AMD、英特爾,景嘉微、海光信息、天數(shù)智芯、摩爾
    的頭像 發(fā)表于 05-29 00:05 ?2333次閱讀

    奧比中光正式發(fā)布全新Gemini 330系列雙目3D相機(jī)

    4月29日,奧比中光正式發(fā)布全新Gemini 330系列雙目3D相機(jī),首發(fā)產(chǎn)品包括Gemini 335、Gemini 335L兩款通用型高性能雙目3D相機(jī)。
    的頭像 發(fā)表于 04-30 10:41 ?631次閱讀
    奧比中光正式發(fā)布<b class='flag-5'>全新</b>Gemini 330系列<b class='flag-5'>雙目</b>3D相機(jī)

    FPGA在深度學(xué)習(xí)應(yīng)用中或取代GPU

    對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行任何更改,也不需要學(xué)習(xí)任何新工具。不過你可以保留你的 GPU 用于訓(xùn)練?!?Zebra 提供了深度學(xué)習(xí)代碼轉(zhuǎn)換為 FPGA 硬件指令的抽象層 AI 硬件前景
    發(fā)表于 03-21 15:19

    視覺、激光、結(jié)構(gòu)光?掃地機(jī)器人導(dǎo)航避障技術(shù)盤點(diǎn)

    的核心標(biāo)準(zhǔn)。 目前主流的掃地機(jī)器人導(dǎo)航避障技術(shù)路徑為雙目視覺、激光雷達(dá)、3D結(jié)構(gòu)光(線激光)三條,每條技術(shù)路徑都存在著各自的特點(diǎn)。 視覺方案
    的頭像 發(fā)表于 02-01 16:01 ?1291次閱讀

    【昉·星光 2 高性能RISC-V單板計(jì)算機(jī)體驗(yàn)】體驗(yàn)Imagination GPU帶來的絲滑3D圖形渲染效果

    一、寫在前面 VisionFive2開發(fā)板的主芯片JH7110內(nèi)部繼承了Imagination的IMG BXE-4-32 MC1 GPU,最高頻率 600MHz。根據(jù)官方介紹信息,如果擴(kuò)展至四核
    發(fā)表于 12-24 21:24
    RM新时代网站-首页