第1章 目標(biāo)檢測(cè)概述
目標(biāo)檢測(cè)是對(duì)圖像分類任務(wù)的進(jìn)一步加深,他不僅要識(shí)別出圖片中各種類別的目標(biāo),還要把他們的位置找出來用矩形框框住。
在實(shí)際操作中,通常先找出目標(biāo)的位置(通過坐標(biāo)軸方框標(biāo)注出來),然后在對(duì)標(biāo)注的目標(biāo)進(jìn)行分類。
目標(biāo)檢測(cè)是深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域一個(gè)非常重要的應(yīng)用,從本節(jié)開始,我們將陸續(xù)開始目標(biāo)檢測(cè)的學(xué)習(xí)。
根據(jù)算法的流程可以將目標(biāo)檢測(cè)算法分為兩種流派:
(1)以Faster R-CNN為代表的Two-Stage算法:
它檢測(cè)目標(biāo)主要分為兩個(gè)部分
通過專門模塊去生成候選框
尋找前景以及調(diào)整邊界框
(2)以SSD、YOLO為代表的One-Stage算法
它是直接基于anchor直接進(jìn)行分類以及調(diào)整邊界框。
這兩種方式各有各的特別,Two-Stage很明顯檢測(cè)的精度要高一點(diǎn),但是檢測(cè)速度慢;
One-Stage放棄了高精度,但是換來了速度,速度比Two-Stage算法快很多。
接下來簡(jiǎn)單介紹幾種常用的目標(biāo)檢測(cè)算法
第2章 常見的Two-Stage算法
2.1 R-CNN
在過去的十多年時(shí)間里,傳統(tǒng)的機(jī)器視覺領(lǐng)域,通常采用特征描述子來應(yīng)對(duì)目標(biāo)識(shí)別任務(wù),這些特征描述子最常見的就是 SIFT 和 HOG.而 OpenCV 有現(xiàn)成的 API 可供大家實(shí)現(xiàn)相關(guān)的操作。
R-CNN(Region with CNN Feature)2014年提出,在此之前都是傳統(tǒng)的目標(biāo)檢測(cè)算法,人為定義特征進(jìn)行檢測(cè),進(jìn)入了瓶頸期,進(jìn)步緩慢,但是R-CNN出來之后將目標(biāo)檢測(cè)領(lǐng)域的準(zhǔn)確率至少提高了30%。
2012 年 Krizhevsky 等人在 ImageNet 舉辦的 ILSVRC 目標(biāo)識(shí)別挑戰(zhàn)大賽中一戰(zhàn)成名,豪奪當(dāng)年的第一名,Top5 錯(cuò)誤率 15%,而他們團(tuán)隊(duì)提出來的網(wǎng)絡(luò)結(jié)構(gòu)以第一作者 Alex Krizhevsky 名字命名,它就是 AlexNet
因?yàn)?AlexNet 的出現(xiàn),世人的目標(biāo)識(shí)別的目光重回神經(jīng)網(wǎng)絡(luò)領(lǐng)域,以此為契機(jī),不斷涌出各種各樣的網(wǎng)絡(luò)比如 VGG、GoogleNet、ResNet 等等。
受 AlexNet 啟發(fā),R-CNN論文作者嘗試將 AlexNet 在 ImageNet 目標(biāo)識(shí)別的能力泛化到 PASCAL VOC 目標(biāo)檢測(cè)上面來。
R-CNN 借鑒了滑動(dòng)窗口思想,采用對(duì)區(qū)域進(jìn)行識(shí)別的方案
第3章 常見的One-Stage算法
3.1 SSD
SSD是一種經(jīng)典的One-Stage算法,它解決當(dāng)時(shí)Faster R-CNN對(duì)小目標(biāo)檢測(cè)效果差和檢測(cè)速度慢的問題。
SSD可以預(yù)測(cè)不用尺度的目標(biāo),它的網(wǎng)絡(luò)有6個(gè)輸出特征層。
使用Faster R-CNN在單GPU上大概每秒6、7張圖片;
而使用SSD算法,同樣在單GPU上它每秒能檢測(cè)50 、60 張圖片;
但相比之前使用了FPN的Faster R-CNN而言呢,SSD算法的檢測(cè)精度要差很多。
3.2 YOLO
YOLO系列算法是目前使用最多的目標(biāo)檢測(cè)算法,它最大的特點(diǎn)就是檢測(cè)速度快,而且現(xiàn)在檢測(cè)精度也就是mAP也變高了,所以稱為時(shí)下最熱門的目標(biāo)檢測(cè)算法。
YOLO是在CVPR2016提出的一種目標(biāo)檢測(cè)算法,它一共有5個(gè)版本,YOLO v1到v3是同一個(gè)作者Joseph設(shè)計(jì)的,包括論文到算法結(jié)構(gòu),YOLO v4到v5是其他作者設(shè)計(jì)的,目前檢測(cè)效果最好和使用最多的就是YOLO v5。
其核心思想是將目標(biāo)檢測(cè)轉(zhuǎn)化為回歸問題求解,并基于一個(gè)單獨(dú)的end-to-end網(wǎng)絡(luò):完成從原始圖像的輸入到物體位置和類別的輸出。
YOLO在進(jìn)行預(yù)測(cè)時(shí),會(huì)對(duì)圖像進(jìn)行全面地推理。
它一種統(tǒng)一的目標(biāo)檢測(cè)模型。我們的模型構(gòu)建簡(jiǎn)單,可以直接在整張圖像上進(jìn)行訓(xùn)練。
第4章 匯總比較
4.1 匯總比較
審核編輯 :李倩
-
算法
+關(guān)注
關(guān)注
23文章
4607瀏覽量
92828 -
圖像分類
+關(guān)注
關(guān)注
0文章
90瀏覽量
11914 -
目標(biāo)檢測(cè)
+關(guān)注
關(guān)注
0文章
209瀏覽量
15605
原文標(biāo)題:目標(biāo)檢測(cè) - 常見目標(biāo)檢測(cè)算法大匯總
文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論