RM新时代平台网址,rm新时代理财官网

今天的計(jì)算機(jī)視覺(jué)（CV）技術(shù)正處于一個(gè)轉(zhuǎn)折點(diǎn)，主要趨勢(shì)正在融合，使云技術(shù)在微小的邊緣AI設(shè)備中變得無(wú)處不在。技術(shù)進(jìn)步使這種以云為中心的人工智能技術(shù)能夠擴(kuò)展到邊緣，新的發(fā)展將使邊緣的人工智能視覺(jué)無(wú)處不在。

有三個(gè)主要的技術(shù)趨勢(shì)使這種演變。新的精益神經(jīng)網(wǎng)絡(luò)算法適合微型設(shè)備的內(nèi)存空間和計(jì)算能力。新的硅架構(gòu)為神經(jīng)網(wǎng)絡(luò)處理提供了比傳統(tǒng)微控制器（MCU）高幾個(gè)數(shù)量級(jí)的效率。用于較小微處理器的AI框架正在成熟，減少了在邊緣開(kāi)發(fā)微型機(jī)器學(xué)習(xí)（ML）實(shí)現(xiàn)（tinyML）的障礙。

當(dāng)所有這些元素結(jié)合在一起時(shí)，毫瓦級(jí)的微型處理器可以擁有強(qiáng)大的神經(jīng)處理單元，這些單元可以執(zhí)行非常高效的卷積神經(jīng)網(wǎng)絡(luò)（CNN）-視覺(jué)處理中最常見(jiàn)的ML架構(gòu)-利用成熟且易于使用的開(kāi)發(fā)工具鏈。這將在我們生活的各個(gè)方面實(shí)現(xiàn)令人興奮的新用例。

邊緣CV的承諾

數(shù)字圖像處理（過(guò)去的叫法）用于從半導(dǎo)體制造和檢測(cè)到高級(jí)駕駛員輔助系統(tǒng)（ADAS）功能（如車(chē)道偏離警告和盲點(diǎn)檢測(cè)），再到移動(dòng)的設(shè)備上的圖像美化和操作等各種應(yīng)用。展望未來(lái)，邊緣CV技術(shù)正在實(shí)現(xiàn)更高級(jí)別的人機(jī)界面（HMI）。

HMI在過(guò)去十年中發(fā)生了重大變化。除了鍵盤(pán)和鼠標(biāo)等傳統(tǒng)界面之外，我們現(xiàn)在還擁有觸摸顯示屏、指紋識(shí)別器、面部識(shí)別系統(tǒng)和語(yǔ)音命令功能。在明顯改善用戶(hù)體驗(yàn)的同時(shí)，這些方法還有一個(gè)共同點(diǎn)它們都對(duì)用戶(hù)操作做出反應(yīng)。HMI的下一個(gè)層次將是通過(guò)上下文感知來(lái)理解用戶(hù)及其環(huán)境的設(shè)備。

情境感知設(shè)備不僅能感知用戶(hù)，還能感知它們所處的環(huán)境，所有這些都是為了做出更好的決策，實(shí)現(xiàn)更有用的自動(dòng)化交互。例如，筆記本電腦可以在視覺(jué)上感知用戶(hù)何時(shí)注意，并相應(yīng)地調(diào)整其行為和電源策略。Synaptics的Emza Visual Sense技術(shù)已經(jīng)實(shí)現(xiàn)了這一點(diǎn)，OEM可以使用該技術(shù)在用戶(hù)不觀看顯示器時(shí)自適應(yīng)調(diào)暗顯示器以?xún)?yōu)化功耗，從而降低顯示器的能耗。通過(guò)跟蹤旁觀者的眼球（旁觀者檢測(cè)），該技術(shù)還可以通過(guò)提醒用戶(hù)并隱藏屏幕內(nèi)容來(lái)增強(qiáng)安全性，直到海岸清晰。

另一個(gè)例子：智能電視機(jī)感知是否有人在觀看以及從哪里觀看，然后相應(yīng)地調(diào)整圖像質(zhì)量和聲音。它可以自動(dòng)關(guān)閉，以保存電力時(shí)，沒(méi)有人在那里。或者，空調(diào)系統(tǒng)根據(jù)房間占用情況優(yōu)化電力和氣流，以保存能源成本。這些和其他建筑物中智能能源利用的例子在家庭-辦公室混合工作模式下變得更加重要。

在工業(yè)領(lǐng)域中，視覺(jué)感測(cè)也有無(wú)窮無(wú)盡的用例，從用于安全監(jiān)管的物體檢測(cè)（即，限制區(qū)、安全通道、防護(hù)裝備執(zhí)行）直到用于制造過(guò)程控制的異常檢測(cè)。在農(nóng)業(yè)技術(shù)中，作物檢查以及CV技術(shù)實(shí)現(xiàn)的狀態(tài)和質(zhì)量監(jiān)控都至關(guān)重要。

無(wú)論是在筆記本電腦、消費(fèi)電子產(chǎn)品、智能建筑傳感器還是工業(yè)環(huán)境中，當(dāng)微型和負(fù)擔(dān)得起的微處理器、微型神經(jīng)網(wǎng)絡(luò)和優(yōu)化的人工智能框架使設(shè)備更加智能和節(jié)能時(shí)，這種環(huán)境計(jì)算能力就可以實(shí)現(xiàn)。nbsp；

神經(jīng)網(wǎng)絡(luò)視覺(jué)處理的發(fā)展

2012年是CV開(kāi)始從啟發(fā)式CV方法轉(zhuǎn)向深度卷積神經(jīng)網(wǎng)絡(luò)（DCNN）的轉(zhuǎn)折點(diǎn)，Alex Krizhevsky和他的同事發(fā)表了AlexNet。DCNN在那年贏得ImageNet大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽（ILSVRC）后就再也沒(méi)有回頭路了。

從那時(shí)起，地球儀的團(tuán)隊(duì)一直在尋求更高的檢測(cè)性能，但對(duì)底層硬件的效率沒(méi)有太多的關(guān)注。所以CNN仍然是數(shù)據(jù)和計(jì)算饑渴的。這種對(duì)性能的關(guān)注對(duì)于在云基礎(chǔ)設(shè)施中運(yùn)行的應(yīng)用程序來(lái)說(shuō)是很好的。

2015年，ResNet152被引入。它有6000萬(wàn)個(gè)參數(shù)，單次推理操作需要超過(guò)11gigaflops，并且在ImageNet數(shù)據(jù)集上表現(xiàn)出94%的前5名準(zhǔn)確率。這繼續(xù)推動(dòng)CNN的性能和準(zhǔn)確性。但直到2017年，隨著谷歌的一組研究人員發(fā)表了MobileNets，我們才看到了效率的提升。

MobileNets-針對(duì)智能手機(jī)-比當(dāng)時(shí)現(xiàn)有的神經(jīng)網(wǎng)絡(luò)（NN）架構(gòu)輕得多。例如，MobileNetV 2有350萬(wàn)個(gè)參數(shù)，需要336 Mflops。這種大幅減少最初是通過(guò)艱苦的勞動(dòng)實(shí)現(xiàn)的-手動(dòng)識(shí)別深度學(xué)習(xí)網(wǎng)絡(luò)中的層，這并沒(méi)有增加太多的準(zhǔn)確性。后來(lái)，自動(dòng)化的架構(gòu)搜索工具允許進(jìn)一步改進(jìn)層的數(shù)量和組織。在內(nèi)存和計(jì)算負(fù)載方面，MobileNetV 2比ResNet 192大約“輕”20倍，表現(xiàn)出90%的前5名準(zhǔn)確率。一組新的移動(dòng)友好應(yīng)用程序現(xiàn)在可以使用AI。

硬件也在不斷發(fā)展

通過(guò)更小的NN和對(duì)所涉及的工作負(fù)載的清晰理解，開(kāi)發(fā)人員現(xiàn)在可以為微型AI設(shè)計(jì)優(yōu)化的硅。這導(dǎo)致了微神經(jīng)處理單元（微NPU）。通過(guò)嚴(yán)格管理內(nèi)存組織和數(shù)據(jù)流，同時(shí)利用大規(guī)模并行性，這些小型專(zhuān)用核心可以比典型MCU中的獨(dú)立CPU快10倍或100倍地執(zhí)行NN推理。一個(gè)例子是Arm Ethos U55微型NPU。

讓我們來(lái)看看microNPU（μ NPU）影響的一個(gè)具體示例。CV的基本任務(wù)之一是對(duì)象檢測(cè)。物體檢測(cè)本質(zhì)上需要兩個(gè)任務(wù)：定位，確定物體在圖像中的位置，以及分類(lèi)，識(shí)別檢測(cè)到的物體（圖2）。

Emza在Ethos U55 μN(yùn)PU上實(shí)現(xiàn)了一個(gè)人臉檢測(cè)模型，訓(xùn)練了一個(gè)對(duì)象檢測(cè)和分類(lèi)模型，該模型是單鏡頭檢測(cè)器的輕量級(jí)版本，由Synaptics優(yōu)化，僅用于檢測(cè)人臉類(lèi)別。結(jié)果令我們驚訝，模型執(zhí)行時(shí)間不到5毫秒：這與強(qiáng)大的智能手機(jī)應(yīng)用處理器（如Snapdragon 845）的執(zhí)行速度相當(dāng)。當(dāng)在使用四個(gè)Cortex A53內(nèi)核的Raspberry Pi 3B上執(zhí)行相同的模型時(shí)，執(zhí)行時(shí)間要長(zhǎng)六倍。

AI框架和民主化

廣泛采用任何像ML這樣復(fù)雜的技術(shù)都需要良好的開(kāi)發(fā)工具。TensorFlow Lite for Microcontrollers（TFLM）是一個(gè)框架，旨在更輕松地為tinyML訓(xùn)練和部署AI。對(duì)于完整TensorFlow所涵蓋的運(yùn)算符子集，TFLM會(huì)發(fā)出微處理器C代碼，用于在μN(yùn)PU上運(yùn)行解釋器和模型。來(lái)自Meta的PyTorch移動(dòng)的框架和Glow編譯器也針對(duì)這一領(lǐng)域。此外，現(xiàn)在有很多AI自動(dòng)化平臺(tái)（稱(chēng)為AutoML）可以自動(dòng)化針對(duì)微小目標(biāo)的AI部署的某些方面。例如Edge Impulse、Deeplite、Qeexo和SensiML。

但要在特定硬件和μ NPU上執(zhí)行，必須修改編譯器和工具鏈。Arm開(kāi)發(fā)了Vela編譯器，可以?xún)?yōu)化U55 μ NPU的CNN模型執(zhí)行。Vela編譯器通過(guò)自動(dòng)在CPU和μ NPU之間分割模型執(zhí)行任務(wù)，消除了包含CPU和μ NPU的系統(tǒng)的復(fù)雜性。

更廣泛地說(shuō)，Apache TVM是一個(gè)開(kāi)源的，端到端的ML編譯器框架，用于CPU，GPU，NPU和加速器。TVM micro的目標(biāo)是微控制器，其愿景是在任何硬件上運(yùn)行任何AI模型。AI框架、AutoML平臺(tái)和編譯器的這種演變使開(kāi)發(fā)人員更容易利用新的μ NPU來(lái)滿(mǎn)足他們的特定需求。

無(wú)處不在的邊緣AI

在邊緣無(wú)處不在的基于ML的視覺(jué)處理的趨勢(shì)是明確的。硬件成本正在下降，計(jì)算能力正在顯著提高，新的方法使訓(xùn)練和部署模型變得更加容易。所有這些都減少了采用的障礙，并增加了CV AI在邊緣的使用。

但是，即使我們看到越來(lái)越普遍的微小邊緣AI，仍然有工作要做。為了使環(huán)境計(jì)算成為現(xiàn)實(shí)，我們需要服務(wù)于許多細(xì)分領(lǐng)域的長(zhǎng)尾用例，這些用例可能會(huì)帶來(lái)可擴(kuò)展性挑戰(zhàn)。在消費(fèi)品、工廠(chǎng)、農(nóng)業(yè)、零售和其他領(lǐng)域，每個(gè)新任務(wù)都需要不同的算法和獨(dú)特的數(shù)據(jù)集進(jìn)行訓(xùn)練。解決每個(gè)用例所需的研發(fā)投資和技能組合仍然是當(dāng)今的主要障礙。

這一差距最好由人工智能公司通過(guò)開(kāi)發(fā)豐富的模型示例集（"模型動(dòng)物園"）和應(yīng)用程序參考代碼來(lái)圍繞其N(xiāo)PU產(chǎn)品升級(jí)軟件來(lái)填補(bǔ)。通過(guò)這樣做，他們可以為長(zhǎng)尾提供更廣泛的應(yīng)用，同時(shí)通過(guò)針對(duì)目標(biāo)硬件優(yōu)化正確的算法來(lái)確保設(shè)計(jì)成功，以在定義的成本、大小和功耗限制范圍內(nèi)解決特定的業(yè)務(wù)需求。

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

人工智能

人工智能

+關(guān)注

關(guān)注
1791

文章
47183

瀏覽量
238213
計(jì)算機(jī)視覺(jué)

計(jì)算機(jī)視覺(jué)

+關(guān)注

關(guān)注
8

文章
1698

瀏覽量
45970
NPU

NPU

+關(guān)注

關(guān)注
2

文章
279

瀏覽量
18582
邊緣AI

邊緣AI

+關(guān)注

關(guān)注
0

文章
93

瀏覽量
4990
TinyML

TinyML

+關(guān)注

關(guān)注
0

文章
42

瀏覽量
1225

評(píng)論

相關(guān)推薦

什么是計(jì)算機(jī)視覺(jué)？計(jì)算機(jī)視覺(jué)的三種方法

計(jì)算機(jī)視覺(jué)是指通過(guò)為計(jì)算機(jī)賦予人類(lèi)視覺(jué)這一技術(shù)目標(biāo)，從而賦能裝配線(xiàn)檢查到駕駛輔助和機(jī)器人等應(yīng)用。計(jì)算機(jī)

發(fā)表于 11-16 16:38 ?4579次閱讀

機(jī)器視覺(jué)與計(jì)算機(jī)視覺(jué)的關(guān)系簡(jiǎn)述

初涉機(jī)器視覺(jué)領(lǐng)域，總是容易將其與計(jì)算機(jī)視覺(jué)這一概念混淆。實(shí)際上兩者確實(shí)存在一定的相同之處，但也不能因此而將這兩者視為同一概念，因?yàn)檫@兩者還存在著顯著的差別。而與此同時(shí)，兩者也還有著密不可分的關(guān)系

發(fā)表于 05-13 14:57

深度學(xué)習(xí)與傳統(tǒng)計(jì)算機(jī)視覺(jué)簡(jiǎn)介

文章目錄1 簡(jiǎn)介1.1 深度學(xué)習(xí)與傳統(tǒng)計(jì)算機(jī)視覺(jué)1.2 性能考量1.3 社區(qū)支持2 結(jié)論3 參考在計(jì)算機(jī)視覺(jué)領(lǐng)域中，不同的場(chǎng)景不同的應(yīng)用程序需要不同的解決方案。在本文中，我們將快速回顧

發(fā)表于 12-23 06:17

基于OpenCV的計(jì)算機(jī)視覺(jué)技術(shù)實(shí)現(xiàn)

基于OpenCV的計(jì)算機(jī)視覺(jué)技術(shù)實(shí)現(xiàn)OpencV是用來(lái)實(shí)現(xiàn)計(jì)算機(jī)視覺(jué)相關(guān)技術(shù)的開(kāi)放源碼工作庫(kù)，是計(jì)算機(jī)視

發(fā)表于 11-23 21:06 ?0次下載

計(jì)算機(jī)視覺(jué)講義

計(jì)算機(jī)視覺(jué)講義:機(jī)器視覺(jué)是研究用計(jì)算機(jī)來(lái)模擬生物外顯或宏觀視覺(jué)功能的科學(xué)和技術(shù)．機(jī)器視覺(jué)系統(tǒng)的首

發(fā)表于 03-19 08:08 ?0次下載

Tractica的最新數(shù)據(jù)_預(yù)計(jì)2025年全球計(jì)算機(jī)視覺(jué)市場(chǎng)達(dá)到262億美元

根據(jù)Tractica的最新數(shù)據(jù)，計(jì)算機(jī)視覺(jué)市場(chǎng)正在快速發(fā)展。深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)（CNN）利用大量的視覺(jué)推動(dòng)基于人工智能（AI）的計(jì)算機(jī)

發(fā)表于 06-26 15:45 ?4369次閱讀

計(jì)算機(jī)視覺(jué)與機(jī)器視覺(jué)區(qū)別

　“計(jì)算機(jī)視覺(jué)”，是指用計(jì)算機(jī)實(shí)現(xiàn)人的視覺(jué)功能，對(duì)客觀世界的三維場(chǎng)景的感知、識(shí)別和理解。計(jì)算機(jī)視覺(jué)

發(fā)表于 12-08 09:27 ?1.3w次閱讀

計(jì)算機(jī)視覺(jué)的興起與發(fā)展趨勢(shì)

近年來(lái)，為了使計(jì)算機(jī)更像人類(lèi)，識(shí)別物體、深度學(xué)習(xí)等計(jì)算機(jī)視覺(jué)技術(shù)方法和應(yīng)用迅速發(fā)展，全球計(jì)算機(jī)視覺(jué)市場(chǎng)正

發(fā)表于 01-24 16:11 ?1.3w次閱讀

計(jì)算機(jī)視覺(jué)常用算法_計(jì)算機(jī)視覺(jué)有哪些分類(lèi)

本文主要介紹了計(jì)算機(jī)視覺(jué)常用算法及計(jì)算機(jī)視覺(jué)的分類(lèi)。

發(fā)表于 07-30 17:34 ?1.4w次閱讀

計(jì)算機(jī)視覺(jué)入門(mén)指南

這是一篇計(jì)算機(jī)視覺(jué)入門(mén)指南，從概念、原理、用例等角度介紹了計(jì)算機(jī)視覺(jué)。「機(jī)器能夠模擬人類(lèi)視覺(jué)系統(tǒng)」的幻想已經(jīng)過(guò)時(shí)了。自 1960 年代第一

發(fā)表于 11-27 09:52 ?2844次閱讀

計(jì)算機(jī)視覺(jué)的工作流程與主要應(yīng)用

計(jì)算機(jī)視覺(jué)的主要目的是讓計(jì)算機(jī)能像人類(lèi)一樣甚至比人類(lèi)更好地看見(jiàn)和識(shí)別世界。計(jì)算機(jī)視覺(jué)通常使用C++、Python和MATLAB等編程語(yǔ)言，是

發(fā)表于 01-08 14:06 ?5437次閱讀

計(jì)算機(jī)視覺(jué)的基礎(chǔ)概念和現(xiàn)實(shí)應(yīng)用

本文將介紹計(jì)算機(jī)視覺(jué)的基礎(chǔ)概念和現(xiàn)實(shí)應(yīng)用，對(duì)任何聽(tīng)說(shuō)過(guò)計(jì)算機(jī)視覺(jué)但不確定它是什么以及如何應(yīng)用的人，本文是了解

發(fā)表于 11-08 10:10 ?1530次閱讀

淺析4個(gè)計(jì)算機(jī)視覺(jué)領(lǐng)域常用遷移學(xué)習(xí)模型

使用SOTA的預(yù)訓(xùn)練模型來(lái)通過(guò)遷移學(xué)習(xí)解決現(xiàn)實(shí)的計(jì)算機(jī)視覺(jué)問(wèn)題。

發(fā)表于 04-23 18:08 ?1830次閱讀

人工智能計(jì)算機(jī)視覺(jué)方向是什么

人工智能計(jì)算機(jī)視覺(jué)方向是什么人工智能計(jì)算機(jī)視覺(jué)方向是指利用人工智能技術(shù)對(duì)圖像和視頻進(jìn)行各種分析、解釋和操作的過(guò)程。計(jì)算機(jī)

發(fā)表于 08-15 16:06 ?1645次閱讀

計(jì)算機(jī)視覺(jué)屬于人工智能嗎

和解釋視覺(jué)信息，從而實(shí)現(xiàn)對(duì)圖像和視頻的自動(dòng)分析和處理。 計(jì)算機(jī)視覺(jué)的基本概念 2.1 計(jì)算機(jī)視覺(jué)的定義

發(fā)表于 07-09 09:11 ?1283次閱讀

RM新时代网站-首页

搜索歷史

TinyML計(jì)算機(jī)視覺(jué)正在通過(guò)microNPU（μ NPU）變?yōu)楝F(xiàn)實(shí)

評(píng)論

什么是計(jì)算機(jī)視覺(jué)？計(jì)算機(jī)視覺(jué)的三種方法

機(jī)器視覺(jué)與計(jì)算機(jī)視覺(jué)的關(guān)系簡(jiǎn)述

深度學(xué)習(xí)與傳統(tǒng)計(jì)算機(jī)視覺(jué)簡(jiǎn)介

基于OpenCV的計(jì)算機(jī)視覺(jué)技術(shù)實(shí)現(xiàn)

計(jì)算機(jī)視覺(jué)講義

Tractica的最新數(shù)據(jù)_預(yù)計(jì)2025年全球計(jì)算機(jī)視覺(jué)市場(chǎng)達(dá)到262億美元

計(jì)算機(jī)視覺(jué)與機(jī)器視覺(jué)區(qū)別

計(jì)算機(jī)視覺(jué)的興起與發(fā)展趨勢(shì)

計(jì)算機(jī)視覺(jué)常用算法_計(jì)算機(jī)視覺(jué)有哪些分類(lèi)

計(jì)算機(jī)視覺(jué)入門(mén)指南

計(jì)算機(jī)視覺(jué)的工作流程與主要應(yīng)用

計(jì)算機(jī)視覺(jué)的基礎(chǔ)概念和現(xiàn)實(shí)應(yīng)用

淺析4個(gè)計(jì)算機(jī)視覺(jué)領(lǐng)域常用遷移學(xué)習(xí)模型

人工智能計(jì)算機(jī)視覺(jué)方向是什么

計(jì)算機(jī)視覺(jué)屬于人工智能嗎