RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

什么是計(jì)算機(jī)視覺?計(jì)算機(jī)視覺的三種方法

德州儀器 ? 來源:德州儀器 ? 2023-11-16 16:38 ? 次閱讀

計(jì)算機(jī)視覺是指通過為計(jì)算機(jī)賦予人類視覺這一技術(shù)目標(biāo),從而賦能裝配線檢查到駕駛輔助和機(jī)器人等應(yīng)用。計(jì)算機(jī)缺乏像人類一樣憑直覺產(chǎn)生視覺和畫面的能力,所以我們必須給予計(jì)算機(jī)一些算法,以便處理特殊任務(wù)。

本文著眼于使計(jì)算機(jī)能夠像人類一樣通過“看”來感知世界,從這一視角對人工智能 (AI) 進(jìn)行探討。本文將簡要比較每一類計(jì)算機(jī)視覺,特別是嵌入式系統(tǒng),它們能夠在本地收集和處理數(shù)據(jù),并根據(jù)數(shù)據(jù)采取行動(dòng),而不是依賴基于云的資源。

什么是計(jì)算機(jī)視覺?

20 世紀(jì) 60 年代,計(jì)算機(jī)視覺已經(jīng)能夠執(zhí)行從頁面上讀取文本(光學(xué)字符識別)和識別圓形或矩形等形狀這類任務(wù)。從那時(shí)起,計(jì)算機(jī)視覺便成為 AI 的核心領(lǐng)域之一,它包括了任何從數(shù)據(jù)中感知、綜合或推斷含義的計(jì)算機(jī)系統(tǒng)。

計(jì)算機(jī)視覺有三種方法:

傳統(tǒng)計(jì)算機(jī)視覺

傳統(tǒng)計(jì)算機(jī)視覺是指用來處理諸如運(yùn)動(dòng)估計(jì)、全景圖像拼接或直線檢測等任務(wù)的編程算法。傳統(tǒng)計(jì)算機(jī)視覺使用標(biāo)準(zhǔn)信號處理和邏輯來處理任務(wù)。工程師需要手動(dòng)選擇用于從圖像中提取含義的函數(shù),然后在處理任務(wù)的算法中使用所生成的特征。Canny 邊緣檢測算法可以找出運(yùn)動(dòng)的輪廓,光流算法可以找出運(yùn)動(dòng)的矢量,這有助于在圖像或運(yùn)動(dòng)跟蹤后續(xù)圖像中分離出物體。對于需要根據(jù)此任務(wù)或環(huán)境進(jìn)行校準(zhǔn)的參數(shù),需要手動(dòng)或通過輔助算法做出調(diào)整。

經(jīng)典機(jī)器學(xué)習(xí)計(jì)算機(jī)視覺

經(jīng)典機(jī)器學(xué)習(xí)計(jì)算機(jī)視覺需要由專家來“打造”特征集,供機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練。其中許多特征是與傳統(tǒng)計(jì)算機(jī)視覺應(yīng)用所共有的。但并非所有特征都有用,因此需要進(jìn)行分析以去除無信息特征,機(jī)器學(xué)習(xí)算法將使用這些特征進(jìn)行訓(xùn)練,以便找出可能難以手動(dòng)分離的模式。若要有效地實(shí)現(xiàn)這些算法,需要具備圖像處理和機(jī)器學(xué)習(xí)方面的專業(yè)知識。

深度學(xué)習(xí)計(jì)算機(jī)視覺

深度學(xué)習(xí)計(jì)算機(jī)視覺屬于機(jī)器學(xué)習(xí),但使用的是非常龐大的神經(jīng)網(wǎng)絡(luò)模型,對大量未經(jīng)處理的“原始”數(shù)據(jù)進(jìn)行運(yùn)算。深度學(xué)習(xí)對計(jì)算機(jī)視覺產(chǎn)生了重大影響,它將特征提取操作拉入模型之中,使得算法可以學(xué)習(xí)信息最豐富的特征,而無需專業(yè)知識來手動(dòng)打造特征集。深度學(xué)習(xí)甚至能夠更好地分離出微妙的模式,但對計(jì)算和內(nèi)存的要求更高。

那么,哪一類計(jì)算機(jī)視覺最好呢?

這最終取決于表 1 中概述的幾個(gè)因素。此表只是籠統(tǒng)地進(jìn)行概括,其中的準(zhǔn)確性和任務(wù)復(fù)雜性等指標(biāo)依賴于具體用例。

d03c467e-845a-11ee-939d-92fbcf53809c.png

表 1:計(jì)算機(jī)視覺技術(shù)比較

經(jīng)典機(jī)器學(xué)習(xí)計(jì)算機(jī)視覺介于傳統(tǒng)方法和深度學(xué)習(xí)方法之間;與其他兩種方法相比,能夠從中受益的應(yīng)用集合規(guī)模較小。在簡單直接、高通量或安全攸關(guān)的應(yīng)用中,傳統(tǒng)計(jì)算機(jī)視覺可能準(zhǔn)確而高效。深度學(xué)習(xí)通用性強(qiáng)、開發(fā)難度低,并且在復(fù)雜應(yīng)用中的準(zhǔn)確性高,如在高密度設(shè)計(jì)的印刷電路板 (PCB) 裝配驗(yàn)證期間用于發(fā)現(xiàn)微小的缺失元件。

一些應(yīng)用可以通過同時(shí)采用多種類型的計(jì)算機(jī)視覺算法而受益,相互取長補(bǔ)短。這種方法常用于環(huán)境非常多變的安全攸關(guān)型應(yīng)用中,如駕駛輔助系統(tǒng)。例如,您可以并行采用基于傳統(tǒng)計(jì)算機(jī)視覺方法的光流和深度學(xué)習(xí)模型來跟蹤附近的車輛,并且使用一種算法對結(jié)果進(jìn)行融合,從而確定兩種方法是否一致。如果不一致,系統(tǒng)可能會(huì)警告駕駛員或啟動(dòng)安全操控。

點(diǎn)擊查看 TI 計(jì)算機(jī)視覺在駕駛輔助的應(yīng)用

替代方法是依次使用多種類型的計(jì)算機(jī)視覺。條形碼讀取器可以使用深度學(xué)習(xí)來定位感興趣區(qū)域,對這些區(qū)域進(jìn)行裁剪,然后使用傳統(tǒng)計(jì)算機(jī)視覺算法進(jìn)行解碼。

深度學(xué)習(xí)在計(jì)算機(jī)視覺應(yīng)用中的益處

與傳統(tǒng)計(jì)算機(jī)視覺和經(jīng)典機(jī)器學(xué)習(xí)相比,深度學(xué)習(xí)由于在研究、開源和商業(yè)社區(qū)中非常受歡迎,因此始終具有較高的準(zhǔn)確性,并且在迅速改進(jìn)。圖 1 從開發(fā)者的角度總結(jié)了這三種技術(shù)在數(shù)據(jù)流方面的差異。

d0582772-845a-11ee-939d-92fbcf53809c.jpg

圖 1:各種計(jì)算機(jī)視覺方法的數(shù)據(jù)流

深度學(xué)習(xí)是一種計(jì)算密集型方法。然而,由于處理能力、速度、加速器(如神經(jīng)處理單元和圖形處理單元)的改進(jìn),以及對矩陣和向量運(yùn)算的軟件支持的提升,計(jì)算要求增加的問題得以緩解,即使在嵌入式系統(tǒng)上也是如此。諸如 AM62A7 等微處理器可以利用硬件加速器,以很高的幀率運(yùn)行深度學(xué)習(xí)算法。

計(jì)算機(jī)視覺實(shí)踐

TI AM6xA 產(chǎn)品組合(如 AM62A7)中的處理器包含深度學(xué)習(xí)加速硬件和輔助軟件,有利于傳統(tǒng)及深度學(xué)習(xí)計(jì)算機(jī)視覺任務(wù)。在 TDA4VM 和 AM68PA 等處理器上,數(shù)字信號處理器內(nèi)核(如 C66x)以及用于光流和立體聲深度估計(jì)的硬件加速器還能為高性能傳統(tǒng)計(jì)算機(jī)視覺任務(wù)賦能。

借助能夠同時(shí)支持傳統(tǒng)計(jì)算機(jī)視覺和深度學(xué)習(xí)計(jì)算機(jī)視覺的處理器,將有可能打造出與科幻夢想相媲美的工具。自動(dòng)購物車將會(huì)簡化購物過程;手術(shù)和醫(yī)療機(jī)器人將指導(dǎo)醫(yī)生發(fā)現(xiàn)早期疾病征兆;移動(dòng)機(jī)器人將會(huì)修剪草坪和遞送包裹。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7488

    瀏覽量

    87848
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30728

    瀏覽量

    268882
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1698

    瀏覽量

    45972
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8406

    瀏覽量

    132558

原文標(biāo)題:適合 AI 應(yīng)用的計(jì)算機(jī)視覺類型是什么?

文章出處:【微信號:tisemi,微信公眾號:德州儀器】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    機(jī)器視覺計(jì)算機(jī)視覺的關(guān)系簡述

    應(yīng)用提高產(chǎn)品質(zhì)量、生產(chǎn)效率以及操作安全性。計(jì)算機(jī)視覺主要有兩工作模式,一是參照仿生學(xué)的方法,以人類
    發(fā)表于 05-13 14:57

    什么是計(jì)算機(jī)視覺看了就知道

    什么是計(jì)算機(jī)視覺
    發(fā)表于 01-11 07:47

    深度學(xué)習(xí)與傳統(tǒng)計(jì)算機(jī)視覺簡介

    單板計(jì)算機(jī)(指所有的邏輯線路、定時(shí)線路、內(nèi)部存儲(chǔ)器和外部界面都包含在一塊單獨(dú)的印制板上的一算機(jī))上提供嵌入式視覺的各種選項(xiàng)。近年來,隨著計(jì)算機(jī)
    發(fā)表于 12-23 06:17

    基于OpenCV的計(jì)算機(jī)視覺技術(shù)實(shí)現(xiàn)

    基于OpenCV的計(jì)算機(jī)視覺技術(shù)實(shí)現(xiàn)OpencV是用來實(shí)現(xiàn)計(jì)算機(jī)視覺相關(guān)技術(shù)的開放源碼工作庫,是計(jì)算機(jī)
    發(fā)表于 11-23 21:06 ?0次下載
    基于OpenCV的<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>技術(shù)實(shí)現(xiàn)

    計(jì)算機(jī)視覺講義

    計(jì)算機(jī)視覺講義:機(jī)器視覺是研究用計(jì)算機(jī)來模擬生物外顯或宏觀視覺功能的科學(xué)和技術(shù).機(jī)器視覺系統(tǒng)的首
    發(fā)表于 03-19 08:08 ?0次下載

    計(jì)算機(jī)視覺與機(jī)器視覺區(qū)別

     “計(jì)算機(jī)視覺”,是指用計(jì)算機(jī)實(shí)現(xiàn)人的視覺功能,對客觀世界的維場景的感知、識別和理解。計(jì)算機(jī)
    的頭像 發(fā)表于 12-08 09:27 ?1.3w次閱讀

    你真的了解什么是計(jì)算機(jī)視覺嗎?

    計(jì)算機(jī)視覺和機(jī)器視覺有何區(qū)別?
    的頭像 發(fā)表于 07-10 14:35 ?1.1w次閱讀
    你真的了解什么是<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>嗎?

    計(jì)算機(jī)視覺技術(shù)簡介

    由于“計(jì)算機(jī)視覺”反映了對視覺環(huán)境及其上下文的相對理解,因此,一些科學(xué)家認(rèn)為,該領(lǐng)域?yàn)槿斯ぶ悄茴I(lǐng)域鋪平了道路。那么什么是計(jì)算機(jī)視覺呢?
    發(fā)表于 07-11 11:24 ?4458次閱讀

    計(jì)算機(jī)視覺的發(fā)展歷史_計(jì)算機(jī)視覺的應(yīng)用方向

    計(jì)算機(jī)視覺40多年的發(fā)展中,盡管人們提出了大量的理論和方法,但總體上說,計(jì)算機(jī)視覺經(jīng)歷了4個(gè)主要?dú)v程。即: 馬爾
    的頭像 發(fā)表于 07-30 17:21 ?7275次閱讀

    計(jì)算機(jī)視覺常用算法_計(jì)算機(jī)視覺有哪些分類

    本文主要介紹了計(jì)算機(jī)視覺常用算法及計(jì)算機(jī)視覺的分類。
    的頭像 發(fā)表于 07-30 17:34 ?1.4w次閱讀

    計(jì)算機(jī)視覺入門指南

    這是一篇計(jì)算機(jī)視覺入門指南,從概念、原理、用例等角度介紹了計(jì)算機(jī)視覺。 「機(jī)器能夠模擬人類視覺系統(tǒng)」的幻想已經(jīng)過時(shí)了。自 1960 年代第一
    的頭像 發(fā)表于 11-27 09:52 ?2844次閱讀

    基于計(jì)算機(jī)視覺的客機(jī)艙門識別與定位方法

    基于計(jì)算機(jī)視覺的客機(jī)艙門識別與定位方法
    發(fā)表于 06-22 16:37 ?42次下載

    計(jì)算機(jī)視覺的基礎(chǔ)概念和現(xiàn)實(shí)應(yīng)用

    本文將介紹計(jì)算機(jī)視覺的基礎(chǔ)概念和現(xiàn)實(shí)應(yīng)用,對任何聽說過計(jì)算機(jī)視覺但不確定它是什么以及如何應(yīng)用的人,本文是了解計(jì)算機(jī)
    的頭像 發(fā)表于 11-08 10:10 ?1531次閱讀

    計(jì)算機(jī)視覺識別是如何工作的?

    計(jì)算機(jī)視覺識別是一人工智能技術(shù),旨在使計(jì)算機(jī)系統(tǒng)從數(shù)字圖像、視頻等視覺信息中識別和提取有意義信息的能力。
    的頭像 發(fā)表于 02-09 13:41 ?3765次閱讀

    機(jī)器視覺計(jì)算機(jī)視覺的區(qū)別

    機(jī)器視覺計(jì)算機(jī)視覺的區(qū)別 機(jī)器視覺計(jì)算機(jī)視覺是兩個(gè)相關(guān)但不同的概念。雖然許多人使用這兩個(gè)術(shù)語
    的頭像 發(fā)表于 08-09 16:51 ?2010次閱讀
    RM新时代网站-首页