RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

常見目標(biāo)檢測(cè)算法大匯總

新機(jī)器視覺 ? 來源:CSDN ? 作者:文火冰糖的硅基工 ? 2022-04-25 15:15 ? 次閱讀

第1章 目標(biāo)檢測(cè)概述

目標(biāo)檢測(cè)是對(duì)圖像分類任務(wù)的進(jìn)一步加深,他不僅要識(shí)別出圖片中各種類別的目標(biāo),還要把他們的位置找出來用矩形框框住。

在實(shí)際操作中,通常先找出目標(biāo)的位置(通過坐標(biāo)軸方框標(biāo)注出來),然后在對(duì)標(biāo)注的目標(biāo)進(jìn)行分類。

8961a31a-c445-11ec-bce3-dac502259ad0.jpg

目標(biāo)檢測(cè)是深度學(xué)習(xí)計(jì)算機(jī)視覺領(lǐng)域一個(gè)非常重要的應(yīng)用,從本節(jié)開始,我們將陸續(xù)開始目標(biāo)檢測(cè)的學(xué)習(xí)。

根據(jù)算法的流程可以將目標(biāo)檢測(cè)算法分為兩種流派:

(1)以Faster R-CNN為代表的Two-Stage算法:

它檢測(cè)目標(biāo)主要分為兩個(gè)部分

通過專門模塊去生成候選框

尋找前景以及調(diào)整邊界框

89818bda-c445-11ec-bce3-dac502259ad0.jpg

(2)以SSD、YOLO為代表的One-Stage算法

它是直接基于anchor直接進(jìn)行分類以及調(diào)整邊界框。

這兩種方式各有各的特別,Two-Stage很明顯檢測(cè)的精度要高一點(diǎn),但是檢測(cè)速度慢;

8999821c-c445-11ec-bce3-dac502259ad0.png

One-Stage放棄了高精度,但是換來了速度,速度比Two-Stage算法快很多。

接下來簡(jiǎn)單介紹幾種常用的目標(biāo)檢測(cè)算法

第2章 常見的Two-Stage算法

2.1 R-CNN

在過去的十多年時(shí)間里,傳統(tǒng)的機(jī)器視覺領(lǐng)域,通常采用特征描述子來應(yīng)對(duì)目標(biāo)識(shí)別任務(wù),這些特征描述子最常見的就是 SIFT 和 HOG.而 OpenCV 有現(xiàn)成的 API 可供大家實(shí)現(xiàn)相關(guān)的操作。

R-CNN(Region with CNN Feature)2014年提出,在此之前都是傳統(tǒng)的目標(biāo)檢測(cè)算法,人為定義特征進(jìn)行檢測(cè),進(jìn)入了瓶頸期,進(jìn)步緩慢,但是R-CNN出來之后將目標(biāo)檢測(cè)領(lǐng)域的準(zhǔn)確率至少提高了30%。

89bd7ec4-c445-11ec-bce3-dac502259ad0.jpg

2012 年 Krizhevsky 等人在 ImageNet 舉辦的 ILSVRC 目標(biāo)識(shí)別挑戰(zhàn)大賽中一戰(zhàn)成名,豪奪當(dāng)年的第一名,Top5 錯(cuò)誤率 15%,而他們團(tuán)隊(duì)提出來的網(wǎng)絡(luò)結(jié)構(gòu)以第一作者 Alex Krizhevsky 名字命名,它就是 AlexNet

89dae158-c445-11ec-bce3-dac502259ad0.png

因?yàn)?AlexNet 的出現(xiàn),世人的目標(biāo)識(shí)別的目光重回神經(jīng)網(wǎng)絡(luò)領(lǐng)域,以此為契機(jī),不斷涌出各種各樣的網(wǎng)絡(luò)比如 VGG、GoogleNet、ResNet 等等。

受 AlexNet 啟發(fā),R-CNN論文作者嘗試將 AlexNet 在 ImageNet 目標(biāo)識(shí)別的能力泛化到 PASCAL VOC 目標(biāo)檢測(cè)上面來。

R-CNN 借鑒了滑動(dòng)窗口思想,采用對(duì)區(qū)域進(jìn)行識(shí)別的方案

89f205ae-c445-11ec-bce3-dac502259ad0.jpg

8a0c373a-c445-11ec-bce3-dac502259ad0.jpg

8a2060ca-c445-11ec-bce3-dac502259ad0.jpg

8a316bf4-c445-11ec-bce3-dac502259ad0.jpg

8a496434-c445-11ec-bce3-dac502259ad0.jpg

8a5beafa-c445-11ec-bce3-dac502259ad0.jpg

第3章 常見的One-Stage算法

3.1 SSD

8a85802c-c445-11ec-bce3-dac502259ad0.jpg

SSD是一種經(jīng)典的One-Stage算法,它解決當(dāng)時(shí)Faster R-CNN對(duì)小目標(biāo)檢測(cè)效果差和檢測(cè)速度慢的問題。

SSD可以預(yù)測(cè)不用尺度的目標(biāo),它的網(wǎng)絡(luò)有6個(gè)輸出特征層。

8ab4f8e8-c445-11ec-bce3-dac502259ad0.jpg

使用Faster R-CNN在單GPU上大概每秒6、7張圖片;

而使用SSD算法,同樣在單GPU上它每秒能檢測(cè)50 、60 張圖片;

但相比之前使用了FPN的Faster R-CNN而言呢,SSD算法的檢測(cè)精度要差很多。

3.2 YOLO

YOLO系列算法是目前使用最多的目標(biāo)檢測(cè)算法,它最大的特點(diǎn)就是檢測(cè)速度快,而且現(xiàn)在檢測(cè)精度也就是mAP也變高了,所以稱為時(shí)下最熱門的目標(biāo)檢測(cè)算法。

YOLO是在CVPR2016提出的一種目標(biāo)檢測(cè)算法,它一共有5個(gè)版本,YOLO v1到v3是同一個(gè)作者Joseph設(shè)計(jì)的,包括論文到算法結(jié)構(gòu),YOLO v4到v5是其他作者設(shè)計(jì)的,目前檢測(cè)效果最好和使用最多的就是YOLO v5。

其核心思想是將目標(biāo)檢測(cè)轉(zhuǎn)化為回歸問題求解,并基于一個(gè)單獨(dú)的end-to-end網(wǎng)絡(luò):完成從原始圖像的輸入到物體位置和類別的輸出。

8ac757fe-c445-11ec-bce3-dac502259ad0.jpg

8ae26166-c445-11ec-bce3-dac502259ad0.jpg

YOLO在進(jìn)行預(yù)測(cè)時(shí),會(huì)對(duì)圖像進(jìn)行全面地推理。

它一種統(tǒng)一的目標(biāo)檢測(cè)模型。我們的模型構(gòu)建簡(jiǎn)單,可以直接在整張圖像上進(jìn)行訓(xùn)練。

第4章 匯總比較

4.1 匯總比較

8af5f30c-c445-11ec-bce3-dac502259ad0.jpg

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4607

    瀏覽量

    92828
  • 圖像分類
    +關(guān)注

    關(guān)注

    0

    文章

    90

    瀏覽量

    11914
  • 目標(biāo)檢測(cè)
    +關(guān)注

    關(guān)注

    0

    文章

    209

    瀏覽量

    15605

原文標(biāo)題:目標(biāo)檢測(cè) - 常見目標(biāo)檢測(cè)算法大匯總

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    常見的lvs負(fù)載均衡算法

    常見的lvs負(fù)載均衡算法包括輪詢(RR)、加權(quán)輪詢(WRR)、最小連接(LC)、加權(quán)最小連接(WLC)、基于局部性的最少鏈接(LBLC)、帶復(fù)制的LBLC(LBLCR)、目標(biāo)地址散列(DH)、源地址
    的頭像 發(fā)表于 12-12 13:50 ?54次閱讀

    在樹莓派上部署YOLOv5進(jìn)行動(dòng)物目標(biāo)檢測(cè)的完整流程

    目標(biāo)檢測(cè)在計(jì)算機(jī)視覺領(lǐng)域中具有重要意義。YOLOv5(You Only Look One-level)是目標(biāo)檢測(cè)算法中的一種代表性方法,以其高效性和準(zhǔn)確性備受關(guān)注,并且在各種
    的頭像 發(fā)表于 11-11 10:38 ?910次閱讀
    在樹莓派上部署YOLOv5進(jìn)行動(dòng)物<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>的完整流程

    旗晟機(jī)器人環(huán)境檢測(cè)算法有哪些?

    硬件支撐,更離不開強(qiáng)大的算法庫作為軟件核心,二者相輔相成,缺一不可。今天就來了解旗晟機(jī)器人環(huán)境檢測(cè)算法。 1、設(shè)施異常監(jiān)測(cè) 通過集成高精度傳感器與智能圖像識(shí)別技術(shù)。它不僅能檢測(cè)A字梯是否存在變形,還能精確評(píng)估梯腳
    的頭像 發(fā)表于 07-19 17:54 ?523次閱讀
    旗晟機(jī)器人環(huán)境<b class='flag-5'>檢測(cè)算法</b>有哪些?

    目標(biāo)檢測(cè)與識(shí)別技術(shù)有哪些

    目標(biāo)檢測(cè)與識(shí)別技術(shù)是計(jì)算機(jī)視覺領(lǐng)域的重要研究方向,廣泛應(yīng)用于安全監(jiān)控、自動(dòng)駕駛、醫(yī)療診斷、工業(yè)自動(dòng)化等領(lǐng)域。 目標(biāo)檢測(cè)與識(shí)別技術(shù)的基本概念 目標(biāo)
    的頭像 發(fā)表于 07-17 09:40 ?588次閱讀

    目標(biāo)檢測(cè)與識(shí)別技術(shù)的關(guān)系是什么

    目標(biāo)檢測(cè)與識(shí)別技術(shù)是計(jì)算機(jī)視覺領(lǐng)域的兩個(gè)重要研究方向,它們之間存在著密切的聯(lián)系和相互依賴的關(guān)系。 一、目標(biāo)檢測(cè)與識(shí)別技術(shù)的概念 目標(biāo)
    的頭像 發(fā)表于 07-17 09:38 ?579次閱讀

    慧視小目標(biāo)識(shí)別算法 解決目標(biāo)檢測(cè)中的老大難問題

    隨著深度學(xué)習(xí)和人工智能技術(shù)的興起與技術(shù)成熟,一大批如FasterR-CNN、RetinaNet、YOLO等可以在工業(yè)界使用的目標(biāo)檢測(cè)算法已逐步成熟并進(jìn)入實(shí)際應(yīng)用,大多數(shù)場(chǎng)景下的目標(biāo)檢測(cè)
    的頭像 發(fā)表于 07-17 08:29 ?477次閱讀
    慧視小<b class='flag-5'>目標(biāo)</b>識(shí)別<b class='flag-5'>算法</b>   解決<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>中的老大難問題

    opencv圖像識(shí)別有什么算法

    圖像識(shí)別算法: 邊緣檢測(cè) :邊緣檢測(cè)是圖像識(shí)別中的基本步驟之一,用于識(shí)別圖像中的邊緣。常見的邊緣檢測(cè)算法有Canny邊緣
    的頭像 發(fā)表于 07-16 10:40 ?1003次閱讀

    基于深度學(xué)習(xí)的小目標(biāo)檢測(cè)

    在計(jì)算機(jī)視覺領(lǐng)域,目標(biāo)檢測(cè)一直是研究的熱點(diǎn)和難點(diǎn)之一。特別是在小目標(biāo)檢測(cè)方面,由于小目標(biāo)在圖像中所占比例小、特征不明顯,使得
    的頭像 發(fā)表于 07-04 17:25 ?856次閱讀

    口罩佩戴檢測(cè)算法

    口罩佩戴檢測(cè)算法基于YOLOv5在圖像識(shí)別檢測(cè)領(lǐng)域的優(yōu)異性能,本文研究基于基于YOLOv5的口罩佩自動(dòng)戴檢測(cè)方法。首先從網(wǎng)絡(luò)和真實(shí)生活中中尋找并采集不同場(chǎng)景人群口罩佩戴的圖片約500張并自建數(shù)據(jù)集
    的頭像 發(fā)表于 07-01 20:20 ?316次閱讀
    口罩佩戴<b class='flag-5'>檢測(cè)算法</b>

    人員跌倒識(shí)別檢測(cè)算法

    人員跌倒識(shí)別檢測(cè)算法是基于視頻的檢測(cè)方法,通過對(duì)目標(biāo)人體監(jiān)測(cè),當(dāng)目標(biāo)人體出現(xiàn)突然倒地行為時(shí),自動(dòng)監(jiān)測(cè)并觸發(fā)報(bào)警。人員跌倒識(shí)別檢測(cè)算法基于計(jì)算
    的頭像 發(fā)表于 06-30 11:47 ?448次閱讀
    人員跌倒識(shí)別<b class='flag-5'>檢測(cè)算法</b>

    安全帽佩戴檢測(cè)算法

    安全帽佩戴監(jiān)控是鐵路工程施工人員安全管理中的重點(diǎn)和難點(diǎn),它對(duì)檢測(cè)算法的準(zhǔn)確 率與檢測(cè)速度都有較高的要求。本文提出一種基于神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索的安全帽佩戴檢測(cè)算法 NAS-YOLO。該神經(jīng)網(wǎng)絡(luò)架構(gòu)由上
    的頭像 發(fā)表于 06-26 22:22 ?396次閱讀
    安全帽佩戴<b class='flag-5'>檢測(cè)算法</b>

    基于FPGA的實(shí)時(shí)邊緣檢測(cè)系統(tǒng)設(shè)計(jì),Sobel圖像邊緣檢測(cè),F(xiàn)PGA圖像處理

    ,所以先擴(kuò)大系數(shù)近似為整數(shù)再運(yùn)算。此處擴(kuò)大256 倍后取整,將運(yùn)算結(jié)果右移 8 位,提取 Y 分量即可得到灰度圖像,即 3 邊緣檢測(cè)算法設(shè)計(jì) 如圖4所示為待處理的3×3 像素點(diǎn),使用 Sobel
    發(fā)表于 05-24 07:45

    OpenVINO? C# API部署YOLOv9目標(biāo)檢測(cè)和實(shí)例分割模型

    YOLOv9模型是YOLO系列實(shí)時(shí)目標(biāo)檢測(cè)算法中的最新版本,代表著該系列在準(zhǔn)確性、速度和效率方面的又一次重大飛躍。
    的頭像 發(fā)表于 04-03 17:35 ?855次閱讀
    OpenVINO? C# API部署YOLOv9<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>和實(shí)例分割模型

    AI驅(qū)動(dòng)的雷達(dá)目標(biāo)檢測(cè):前沿技術(shù)與實(shí)現(xiàn)策略

    傳統(tǒng)的雷達(dá)目標(biāo)檢測(cè)方法,主要圍繞雷達(dá)回波信號(hào)的統(tǒng)計(jì)特性進(jìn)行建模,進(jìn)而在噪聲和雜波的背景下對(duì)目標(biāo)存在與否進(jìn)行判決,常用的典型算法如似然比檢測(cè)
    發(fā)表于 03-01 12:26 ?2774次閱讀
    AI驅(qū)動(dòng)的雷達(dá)<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>:前沿技術(shù)與實(shí)現(xiàn)策略

    基于深度學(xué)習(xí)的芯片缺陷檢測(cè)梳理分析

    雖然表面缺陷檢測(cè)技術(shù)已經(jīng)不斷從學(xué)術(shù)研究走向成熟的工業(yè)應(yīng)用,但是依然有一些需要解決的問題?;谝陨戏治隹梢园l(fā)現(xiàn),由于芯片表面缺陷的獨(dú)特性質(zhì),通用目標(biāo)檢測(cè)算法不適合直接應(yīng)用于芯片表面缺陷檢測(cè)
    發(fā)表于 02-25 14:30 ?1484次閱讀
    基于深度學(xué)習(xí)的芯片缺陷<b class='flag-5'>檢測(cè)</b>梳理分析
    RM新时代网站-首页