RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何快速設(shè)計(jì)和部署智能機(jī)器視覺系統(tǒng)

海闊天空的專欄 ? 來源:Jeff Shepard ? 作者:Jeff Shepard ? 2023-10-03 14:31 ? 次閱讀

作者:Jeff Shepard

許多應(yīng)用對(duì)機(jī)器視覺的需求在不斷增長(zhǎng),包括安防、交通和城市攝像頭、零售分析、自動(dòng)檢測(cè)、過程控制和視覺引導(dǎo)機(jī)器人技術(shù)。實(shí)現(xiàn)機(jī)器視覺是一個(gè)復(fù)雜的過程,需要整合不同的技術(shù)和子系統(tǒng),包括高性能硬件和先進(jìn)的人工智能/機(jī)器學(xué)習(xí)AI/ML) 軟件。機(jī)器視覺從優(yōu)化視頻采集技術(shù)和視覺 I/O以滿足應(yīng)用需求開始,并延伸到多個(gè)圖像處理管道以實(shí)現(xiàn)高效連接。機(jī)器視覺最終取決于嵌入式視覺系統(tǒng)是否能夠通過高性能硬件執(zhí)行基于視覺的實(shí)時(shí)分析。這些硬件如現(xiàn)場(chǎng)可編程門陣列(FPGA)、系統(tǒng)級(jí)模塊 (SOM)、系統(tǒng)級(jí)芯片 (SoC),甚至是運(yùn)行所需的 AI/ML 圖像處理和識(shí)別軟件的系統(tǒng)級(jí)芯片上多處理器系統(tǒng)(MPSoC)。這可能是一個(gè)復(fù)雜、昂貴且耗時(shí)的過程,可能會(huì)頻繁導(dǎo)致成本超支、進(jìn)度延誤。

與其從頭開始,設(shè)計(jì)者還不如采用一種經(jīng)過精心策劃的高性能開發(fā)平臺(tái),從而在加快上市時(shí)間、控制成本并降低開發(fā)風(fēng)險(xiǎn)的同時(shí),支持應(yīng)用實(shí)現(xiàn)高度靈活性和高性能?;赟OM 的開發(fā)平臺(tái)可以提供集成硬件和軟件環(huán)境,讓開發(fā)人員專注于應(yīng)用定制并節(jié)省多達(dá)九個(gè)月的開發(fā)時(shí)間。除了開發(fā)環(huán)境外,同樣的 SOM架構(gòu)還可用于商業(yè)和工業(yè)環(huán)境下的生產(chǎn)優(yōu)化配置,以提高應(yīng)用的可靠性和質(zhì)量,進(jìn)一步降低風(fēng)險(xiǎn)并加快上市時(shí)間。

本文首先回顧與開發(fā)高性能機(jī)器視覺系統(tǒng)有關(guān)的挑戰(zhàn),然后介紹 AMD Xilinx 的 Kria KV260 視覺 AI入門套件提供的全面開發(fā)環(huán)境,最后以基于 Kira 26 平臺(tái)設(shè)計(jì)的即用型 SOM 為例進(jìn)行介紹。該平臺(tái)用于插入帶有特定解決方案外設(shè)的載板。

該開發(fā)板從數(shù)據(jù)類型優(yōu)化開始

深度學(xué)習(xí)算法的需求在不斷增加。不是每個(gè)應(yīng)用都需要高精度計(jì)算。目前正在使用的較低精度數(shù)據(jù)類型如 INT8,或者使用自定義數(shù)據(jù)格式?;?GPU的系統(tǒng)可能面臨這樣的挑戰(zhàn),即試圖修改為高精度數(shù)據(jù)優(yōu)化的架構(gòu),以有效地適應(yīng)低精度數(shù)據(jù)格式。Kria K26 SOM 可重新配置,使其能夠支持從 FP32 到INT8 等多種數(shù)據(jù)類型??芍貜?fù)配置也有助于實(shí)現(xiàn)較低總體能耗。例如,與 FP32 運(yùn)行相比,針對(duì) INT8 優(yōu)化的運(yùn)行所消耗的能量會(huì)少一個(gè)數(shù)量級(jí)(圖 1)。

1.png

最優(yōu)架構(gòu)帶來最小功耗

根據(jù)典型的電源使用模式,基于多核 GPU 或 CPU 架構(gòu)的設(shè)計(jì)可能功耗大。

內(nèi)核部分能耗占 30%

內(nèi)部存儲(chǔ)器 (L1, L2, L3) 能耗占 30%

外部存儲(chǔ)器(如 DDR)能耗為 40%

GPU 需要頻繁地訪問低效率 DDR 內(nèi)存以支持可編程性,這是高帶寬計(jì)算需求的瓶頸。Kria K26 SOM 中使用的 Zynq MPSoC架構(gòu)支持開發(fā)只需少量訪問或不訪問外部存儲(chǔ)器的應(yīng)用。例如,在典型的汽車應(yīng)用中,GPU 和各種模塊之間的通信需要多次訪問外部 DDR 存儲(chǔ)器來完成,而基于 ZynqMPSoC 的解決方案包含了一個(gè)旨在避免大多數(shù) DDR 訪問的管道(圖 2)。

2.png

修剪的優(yōu)勢(shì)

可以通過人工智能優(yōu)化工具來增強(qiáng) K26 SOM
上的神經(jīng)網(wǎng)絡(luò)性能,這種工具可以實(shí)現(xiàn)數(shù)據(jù)優(yōu)化和修剪。神經(jīng)網(wǎng)絡(luò)被過度參數(shù)化的情況非常常見,從而導(dǎo)致了高水平冗余。這種情況可通過數(shù)據(jù)修剪和模型壓縮來進(jìn)行優(yōu)化。使用Xilinx 的人工智能優(yōu)化器可使模型復(fù)雜度降低至原來的 1/50,而對(duì)模型精度的影響卻微乎其微。例如,一個(gè)單次檢測(cè)器 (SSD) 加上一個(gè) VGG 卷積神經(jīng)網(wǎng)(CNN) 架構(gòu)且具有 117 千兆運(yùn)算 (Gops) 能力,使用人工智能優(yōu)化器經(jīng)過 11 次迭代修剪后得到了改進(jìn)。優(yōu)化前,該模型在 ZynqUltraScale+ MPSoC 上每秒運(yùn)行 18 幀 (FPS)。經(jīng)過 11 次迭代——該模型的第 12 次運(yùn)行,其復(fù)雜性從 117 Gops 降低至11.6Gops(約前者的 1/10),性能從 18 FPS 提升至 103 FPS(前者的 5 倍),物體檢測(cè)準(zhǔn)確性從 61.55 平均精度 (mAP)下降到 60.4 mAP(僅降低 1%)(圖 3)。

3.png

基于 Uncanny Vision 的視覺分析軟件,開發(fā)出用于汽車車牌檢測(cè)、識(shí)別的機(jī)器學(xué)習(xí)應(yīng)用,也稱為汽車車牌識(shí)別 (ANPR) 應(yīng)用。ANPR用于自動(dòng)收費(fèi)系統(tǒng)、高速公路監(jiān)控、安全門和停車場(chǎng)入口以及其他應(yīng)用。這種車牌識(shí)別應(yīng)用包括一個(gè)基于人工智能的信息管道,對(duì)視頻進(jìn)行解碼并預(yù)處理圖像,然后進(jìn)行 ML檢測(cè)和 OCR 字符識(shí)別(圖 4)。

4.png

實(shí)現(xiàn)車牌識(shí)別需要一個(gè)或多個(gè) H.264 或 H.265 編碼的實(shí)時(shí)流媒體協(xié)議 (RTSP)饋送,這些饋送經(jīng)過解碼或未經(jīng)過壓縮。解碼后的視頻幀經(jīng)過縮放、裁剪、色彩空間轉(zhuǎn)換和標(biāo)準(zhǔn)化(預(yù)處理),然后發(fā)送至 ML 檢測(cè)算法。實(shí)現(xiàn)高性能車牌識(shí)別需要多階段 AI信息管道。在第一階段中,檢測(cè)并定位圖像中的車輛,創(chuàng)建關(guān)注區(qū)域 (ROI)。同時(shí),其他算法優(yōu)化圖像質(zhì)量,供 OCR字符識(shí)別算法隨后使用,并以跨多幀的方式追蹤車輛運(yùn)動(dòng)。車輛 ROI 會(huì)被進(jìn)一步裁剪,生成供 OCR 算法處理的號(hào)牌 ROI,以確定號(hào)牌中的字符。與其他基于 GPU或 CPU 的商業(yè) SOM 相比,Uncanny Vision 的 ANPR 應(yīng)用在 Kira KV260 SOM 上的運(yùn)行速度快 2 到 3 倍,每個(gè)RTSP feed 的成本不到 100 美元。

智能視覺開發(fā)環(huán)境

對(duì)于交通和城市攝像頭、零售分析、安防、工業(yè)自動(dòng)化和機(jī)器人等智能視覺應(yīng)用的設(shè)計(jì)者來說,他們可以采用 Kria K26 SOM AI Starter開發(fā)環(huán)境。這種開發(fā)環(huán)境采用 Zynq? UltraScale+? MPSoC 架構(gòu)建立,并有一個(gè)不斷增長(zhǎng)的策劃應(yīng)用軟件包庫(圖 5)。AI StarterSOM 包括一個(gè)四核 Arm Cortex-A53 處理器,超過 25 萬個(gè)邏輯單元以及一個(gè) H.264/265 視頻編解碼器。SOM 還具有 4GB DDR4存儲(chǔ)器、245 個(gè) IO 和 1.4 tera-ops人工智能計(jì)算,以支持創(chuàng)建高性能視覺人工智能應(yīng)用,進(jìn)而實(shí)現(xiàn)了與其他硬件方法相比,能以更低延遲、更低功耗提供超 3倍的性能。預(yù)構(gòu)建應(yīng)用可使初始設(shè)計(jì)在不到一小時(shí)內(nèi)即可開始運(yùn)行。

5.png

為了幫助快速啟動(dòng)采用 Kria K26 SOM 的開發(fā)過程,AMD Xilinx 提供了 KV260 視覺 AI入門套件,其中包括電源適配器、以太網(wǎng)線、microSD 卡、USB 線、HDMI 線和攝像頭模塊(圖 6)。如果不需要整個(gè)入門套件,開發(fā)人員可以簡(jiǎn)單地購(gòu)買可選的電源適配器,以開始使用 Kira K26 SOM。

6.png

能夠加速開發(fā)的另一個(gè)原因是功能全面,包括豐富的 1.8 V、3.3 V 單端和差分 I/O、四個(gè) 6 Gb/s 收發(fā)器和四個(gè) 12.5 Gb/s收發(fā)器。有了這些功能,就能夠開發(fā)這樣的應(yīng)用——即在這些應(yīng)用中每個(gè) SOM 具有更多的圖像傳感器且這些應(yīng)用配備如 MIPI、LVDS、SLVS 和 SLVS-EC等各種傳感器接口。對(duì)于這些接口來說,其支持設(shè)備并不總限于應(yīng)用特定型標(biāo)準(zhǔn)產(chǎn)品 (ASSP) 或 GPU。開發(fā)人員還可以通過嵌入式可編程邏輯實(shí)現(xiàn)DisplayPort、HDMI、PCIe、USB2.0/3.0 和用戶定義的標(biāo)準(zhǔn)。

最后,通過將 K26 SOM 廣泛的硬件能力、軟件環(huán)境與生產(chǎn)就緒型視覺應(yīng)用相結(jié)合,簡(jiǎn)化人工智能應(yīng)用的開發(fā)并使其變得更加容易。這些視覺應(yīng)用可以在不需要FPGA 硬件設(shè)計(jì)的情況下實(shí)現(xiàn),并使軟件開發(fā)人員能夠快速集成定制的 AI 模型和應(yīng)用代碼,甚至修改視覺管道。Xilinx 的 Vitis統(tǒng)一軟件開發(fā)平臺(tái)和庫支持常見的設(shè)計(jì)環(huán)境,如 TensorFlow、Pytorch 和 Café 框架以及多種編程語言,包括 C、C++、OpenCL? 和Python。還有一個(gè)嵌入式應(yīng)用商店,用于使用來自 Xilinx 及其生態(tài)系統(tǒng)合作伙伴的 Kria SOM 的邊緣應(yīng)用。Xilinx產(chǎn)品免費(fèi)、開源,包括智能攝像頭跟蹤和人臉檢測(cè)、帶有智能視覺的自然語言處理功能等。

生產(chǎn)優(yōu)化型 Kira 26 SOM

一旦開發(fā)過程完成,就可以提供 K26 SOM 的生產(chǎn)就緒型版本,該版本用于插入配有特定解決方案外設(shè)的載板,可以加速向制造過渡(圖 7)?;镜?K26SOM 是商業(yè)級(jí)器件,其溫度等級(jí)為 0℃ 至 +85℃ 結(jié)溫(通過內(nèi)部溫度傳感器測(cè)量)。還可提供 工業(yè)級(jí)版本 K26 SOM,其額定工作溫度為 -40°C 至+100°C。

工業(yè)市場(chǎng)要求在惡劣的環(huán)境下具有更長(zhǎng)的運(yùn)行壽命。工業(yè)級(jí) Kria SOM 在 100°C 結(jié)溫和 80% 相對(duì)濕度下可運(yùn)行 10 年,并可承受高達(dá) 40 g的沖擊和 5 g 的均方根 (RMS) 振動(dòng)。該版本還具有最短十年的生產(chǎn)可用性,以支持長(zhǎng)的產(chǎn)品生命周期。

7.png

結(jié)語

諸如安全、交通和城市攝像頭、零售分析、自動(dòng)檢測(cè)、過程控制和視覺引導(dǎo)的機(jī)器人等機(jī)器視覺應(yīng)用設(shè)計(jì)者,可以采用 Kria K26 SOM AI啟動(dòng)器,以加快上市時(shí)間,協(xié)助控制成本并降低開發(fā)風(fēng)險(xiǎn)。這種基于 SOM的開發(fā)平臺(tái)提供了一個(gè)軟硬件集成環(huán)境,讓開發(fā)者能專注于應(yīng)用定制并節(jié)省多達(dá)九個(gè)月的開發(fā)時(shí)間。同樣的 SOM架構(gòu)可用于商業(yè)和工業(yè)環(huán)境中的生產(chǎn)優(yōu)化配置,進(jìn)一步加快上市時(shí)間。工業(yè)版的最低生產(chǎn)可用性為 10 年,可支持很長(zhǎng)的產(chǎn)品生命周期。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 嵌入式
    +關(guān)注

    關(guān)注

    5082

    文章

    19104

    瀏覽量

    304793
  • 機(jī)器視覺
    +關(guān)注

    關(guān)注

    161

    文章

    4369

    瀏覽量

    120278
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30728

    瀏覽量

    268882
  • SOM
    SOM
    +關(guān)注

    關(guān)注

    0

    文章

    58

    瀏覽量

    15709
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    機(jī)器視覺系統(tǒng)在注塑行業(yè)的應(yīng)用

    機(jī)器視覺是通過采用非接觸式的光學(xué)感知設(shè)備自動(dòng)接收和解析真實(shí)場(chǎng)景的影像,以獲取信息和控制機(jī)器或工藝過程。機(jī)器視覺系統(tǒng)基本配置包含工業(yè)相機(jī)與鏡頭
    發(fā)表于 06-09 14:55

    機(jī)器視覺系統(tǒng)應(yīng)用于標(biāo)簽外觀視覺檢查!

    `機(jī)器視覺系統(tǒng)可以快速獲取大量信息,而且易于自動(dòng)處理,也易于同設(shè)計(jì)信息以及加工控制信息集成,因此,在現(xiàn)代自動(dòng)化生產(chǎn)過程中,人們將機(jī)器視覺系統(tǒng)
    發(fā)表于 11-18 16:13

    服務(wù)機(jī)器人的視覺系統(tǒng)怎么設(shè)計(jì)?

    隨著計(jì)算機(jī)科學(xué)和自動(dòng)控制技術(shù)的發(fā)展,越來越多的不同種類的智能機(jī)器人出現(xiàn)在工廠、生活當(dāng)中,機(jī)器視覺系統(tǒng)作為智能
    發(fā)表于 04-07 07:27

    工業(yè)機(jī)器人與智能視覺系統(tǒng)應(yīng)用實(shí)訓(xùn)平臺(tái)介紹

    ZNAI-1工業(yè)機(jī)器人與智能視覺系統(tǒng)應(yīng)用實(shí)訓(xùn)平臺(tái)一、產(chǎn)品概述工業(yè)機(jī)器人與智能視覺系統(tǒng)應(yīng)用實(shí)訓(xùn)平臺(tái)
    發(fā)表于 07-01 11:48

    ZN-1AI工業(yè)機(jī)器人與智能視覺系統(tǒng)應(yīng)用實(shí)訓(xùn)平臺(tái)介紹

    ZN-1AI工業(yè)機(jī)器人與智能視覺系統(tǒng)應(yīng)用實(shí)訓(xùn)平臺(tái)一、產(chǎn)品概述 ZN-1AI以工業(yè)機(jī)器人與機(jī)器視覺
    發(fā)表于 07-01 10:07

    機(jī)器視覺系統(tǒng)是指什么? 機(jī)器視覺系統(tǒng)的工作原理是什么?

    機(jī)器視覺系統(tǒng)是指什么?機(jī)器視覺系統(tǒng)的工作原理是什么?影響機(jī)器視覺系統(tǒng)輸入的重要因素有哪些?
    發(fā)表于 07-16 11:23

    機(jī)器視覺系統(tǒng)有何應(yīng)用

    隨著越來越多的制造商采用工業(yè)4.0模型,工業(yè)市場(chǎng)對(duì)視覺系統(tǒng)的需求也將增長(zhǎng)。在這個(gè)新時(shí)代,制造商將集成先進(jìn)的機(jī)器人技術(shù)、機(jī)器學(xué)習(xí)、 3D深度測(cè)繪和工業(yè)物聯(lián)網(wǎng),以提高組織和生產(chǎn)能力。機(jī)器
    發(fā)表于 12-20 06:04

    機(jī)器視覺系統(tǒng)原理及基礎(chǔ)知識(shí)

    機(jī)器視覺系統(tǒng)的目的就是給機(jī)器或自動(dòng)生產(chǎn)線添加一套視覺系統(tǒng),其原理是由計(jì)算機(jī)或圖像處理器以及相關(guān)設(shè)備來模擬人的視覺行為,完成得到人的
    發(fā)表于 12-16 14:40 ?0次下載
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>視覺系統(tǒng)</b>原理及基礎(chǔ)知識(shí)

    機(jī)器視覺_ni機(jī)器視覺系統(tǒng)-技術(shù)專輯

    在現(xiàn)代自動(dòng)化生產(chǎn)過程中,人們將機(jī)器視覺系統(tǒng)廣泛地用于工況監(jiān)視、成品檢驗(yàn)和質(zhì)量控制等領(lǐng)域。本專題內(nèi)容涉及機(jī)器視覺是什么,ni機(jī)器
    發(fā)表于 08-03 11:33
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>視覺</b>_ni<b class='flag-5'>機(jī)器</b><b class='flag-5'>視覺系統(tǒng)</b>-技術(shù)專輯

    如何使用NI快速構(gòu)建機(jī)器視覺系統(tǒng)

    本演示介紹如何使用NI 交互式的機(jī)器視覺開發(fā)軟件環(huán)境VBAI,快速構(gòu)建機(jī)器視覺系統(tǒng)。無需編程,配合NI新款
    的頭像 發(fā)表于 06-25 03:06 ?4145次閱讀
    如何使用NI<b class='flag-5'>快速</b>構(gòu)建<b class='flag-5'>機(jī)器</b><b class='flag-5'>視覺系統(tǒng)</b>

    機(jī)器視覺系統(tǒng)詳解

    機(jī)器視覺系統(tǒng)詳解說明。
    發(fā)表于 04-19 15:16 ?21次下載

    機(jī)器視覺系統(tǒng)概述

    機(jī)器視覺系統(tǒng)概述說明。
    發(fā)表于 04-21 10:07 ?12次下載

    機(jī)器視覺系統(tǒng)的經(jīng)典應(yīng)用

    機(jī)器視覺系統(tǒng)的經(jīng)典應(yīng)用。
    發(fā)表于 05-28 10:25 ?15次下載

    機(jī)器視覺系統(tǒng)的組成及應(yīng)用

    且精度不高,用機(jī)器視覺檢測(cè)方法可以大大提高生產(chǎn)效率和生產(chǎn)的自動(dòng)化程度。而且機(jī)器視覺易于實(shí)現(xiàn)信息集成,是實(shí)現(xiàn)計(jì)算機(jī)集成制造的基礎(chǔ)技術(shù)。正是由于機(jī)器
    發(fā)表于 08-09 18:02 ?2775次閱讀

    機(jī)器視覺系統(tǒng)包括哪些

    機(jī)器視覺系統(tǒng)包括哪些 機(jī)器視覺系統(tǒng)就是利用機(jī)器代替人眼來作各種測(cè)量和判斷。它是計(jì)算機(jī)學(xué)科的一個(gè)重要分支,它綜合了光學(xué)、機(jī)械、電子、計(jì)算機(jī)軟硬
    發(fā)表于 06-29 11:33 ?889次閱讀
    RM新时代网站-首页