RM新时代专业团队|首入球时间 ,RM是什么平台

導(dǎo)言

行人檢測是計算機(jī)視覺中的經(jīng)典問題，也是長期以來難以解決的問題。和人臉檢測問題相比，由于人體的姿態(tài)復(fù)雜，變形更大，附著物和遮擋等問題更嚴(yán)重，因此準(zhǔn)確的檢測處于各種場景下的行人具有很大的難度。在本文中，SIGAI將為大家回顧行人檢測算法的發(fā)展歷程。

問題描述

行人檢測( Pedestrian Detection)一直是計算機(jī)視覺研究中的熱點和難點。行人檢測要解決的問題是：找出圖像或視頻幀中所有的行人，包括位置和大小，一般用矩形框表示，和人臉檢測類似，這也是典型的目標(biāo)檢測問題。

行人檢測技術(shù)有很強(qiáng)的使用價值，它可以與行人跟蹤，行人重識別等技術(shù)結(jié)合，應(yīng)用于汽車無人駕駛系統(tǒng)(ADAS)，智能機(jī)器人，智能視頻監(jiān)控，人體行為分析，客流統(tǒng)計系統(tǒng)，智能交通等領(lǐng)域。

由于人體具有相當(dāng)?shù)娜嵝?，因此會有各種姿態(tài)和形狀，其外觀受穿著，姿態(tài)，視角等影響非常大，另外還面臨著遮擋、光照等因素的影響，這使得行人檢測成為計算機(jī)視覺領(lǐng)域中一個極具挑戰(zhàn)性的課題。行人檢測要解決的主要難題是:

外觀差異大。包括視角，姿態(tài)，服飾和附著物，光照，成像距離等。從不同的角度看過去，行人的外觀是很不一樣的。處于不同姿態(tài)的行人，外觀差異也很大。由于人穿的衣服不同，以及打傘、戴帽子、戴圍巾、提行李等附著物的影響，外觀差異也非常大。光照的差異也導(dǎo)致了一些困難。遠(yuǎn)距離的人體和近距離的人體，在外觀上差別也非常大。

遮擋問題。在很多應(yīng)用場景中，行人非常密集，存在嚴(yán)重的遮擋，我們只能看到人體的一部分，這對檢測算法帶來了嚴(yán)重的挑戰(zhàn)。

背景復(fù)雜。無論是室內(nèi)還是室外，行人檢測一般面臨的背景都非常復(fù)雜，有些物體的外觀和形狀、顏色、紋理很像人體，導(dǎo)致算法無法準(zhǔn)確的區(qū)分。

檢測速度。行人檢測一般采用了復(fù)雜的模型，運(yùn)算量相當(dāng)大，要達(dá)到實時非常困難，一般需要大量的優(yōu)化。

從下面這張圖就可以看出行人檢測算法所面臨的挑戰(zhàn)：

早期的算法使用了圖像處理，模式識別中的一些簡單方法，準(zhǔn)確率低。隨著訓(xùn)練樣本規(guī)模的增大，如INRIA數(shù)據(jù)庫、Caltech數(shù)據(jù)庫和TUD行人數(shù)據(jù)庫等的出現(xiàn)，出現(xiàn)了精度越來越高的算法，另一方面，算法的運(yùn)行速度也被不斷提升。按照實現(xiàn)原理，我們可以將這些算法可以分為基于運(yùn)動檢測的算法和基于機(jī)器學(xué)習(xí)的算法兩大類，接下來分別進(jìn)行介紹。

基于運(yùn)動檢測的算法

如果攝像機(jī)靜止不動，則可以利用背景建模算法提取出運(yùn)動的前景目標(biāo)，然后利用分類器對運(yùn)動目標(biāo)進(jìn)行分類，判斷是否包含行人。常用的背景建模算法有：

高斯混合模型，Mixture of Gaussian model[1]

ViBe算法[2]

幀差分算法

SACON，樣本一致性建模算法[3]

PBAS算法[4]

這些背景建模算法的思路是通過前面的幀學(xué)習(xí)得到一個背景模型，然后用當(dāng)前幀與背景幀進(jìn)行比較，得到運(yùn)動的目標(biāo)，即圖像中變化的區(qū)域。

限于篇幅，我們不在這里介紹每一種背景建模算法的原理，如果有機(jī)會，SIGAI會在后續(xù)的文章中專門介紹這一問題。

背景建模算法實現(xiàn)簡單，速度快，但存在下列問題：

1.只能檢測運(yùn)動的目標(biāo)，對于靜止的目標(biāo)無法處理

2.受光照變化、陰影的影響很大

3.如果目標(biāo)的顏色和背景很接近，會造成漏檢和斷裂

4.容易受到惡劣天氣如雨雪，以及樹葉晃動等干擾物的影響

5.如果多個目標(biāo)粘連，重疊，則無法處理

究其原因，是因為這些背景建模算法只利用了像素級的信息，沒有利用圖像中更高層的語義信息。

基于機(jī)器學(xué)習(xí)的方法

基于機(jī)器學(xué)習(xí)的方法是現(xiàn)階段行人檢測算法的主流，在這里我們先介紹人工特征+分類器的方案，基于深度學(xué)習(xí)的算法在下一節(jié)中單獨給出。

人體有自身的外觀特征，我們可以手工設(shè)計出特征，然后用這種特征來訓(xùn)練分類器用于區(qū)分行人和背景。這些特征包括顏色，邊緣，紋理等機(jī)器學(xué)習(xí)中常用的特征，采用的分類器有神經(jīng)網(wǎng)絡(luò)，SVM，AdaBoost，隨機(jī)森林等計算機(jī)視覺領(lǐng)域常用的算法。由于是檢測問題，因此一般采用滑動窗口的技術(shù)，這在SIGAI之前的公眾號文章“人臉檢測算法綜述”，“基于深度學(xué)習(xí)的目標(biāo)檢測算法綜述”中已經(jīng)介紹過了。

HOG+SVM

行人檢測第一個有里程碑意義的成果是Navneet Dalal在2005的CVPR中提出的基于HOG + SVM的行人檢測算法[5]。Navneet Dalal是行人檢測中之前經(jīng)常使用的INRIA數(shù)據(jù)集的締造者。

梯度方向直方圖(HOG)是一種邊緣特征，它利用了邊緣的朝向和強(qiáng)度信息，后來被廣泛應(yīng)用于車輛檢測，車牌檢測等視覺目標(biāo)檢測問題。HOG的做法是固定大小的圖像先計算梯度，然后進(jìn)行網(wǎng)格劃分，計算每個點處的梯度朝向和強(qiáng)度，然后形成網(wǎng)格內(nèi)的所有像素的梯度方向分分布直方圖，最后匯總起來，形成整個直方圖特征。

這一特征很好的描述了行人的形狀、外觀信息，比Haar特征更為強(qiáng)大，另外，該特征對光照變化和小量的空間平移不敏感。下圖為用HOG特征進(jìn)行行人檢測的流程：

得到候選區(qū)域的HOG特征后，需要利用分類器對該區(qū)域進(jìn)行分類，確定是行人還是背景區(qū)域。在實現(xiàn)時，使用了線性支持向量機(jī)，這是因為采用非線性核的支持向量機(jī)在預(yù)測時的計算量太大，與支持向量的個數(shù)成正比。如果讀者對這一問題感興趣，可以閱讀SIGAI之前關(guān)于SVM的文章。

目前OpenCV中的行人檢測算法支持HOG+SVM以及HOG+Cascade兩種，二者都采用了滑動窗口技術(shù)，用固定大小的窗口掃描整個圖像，然后對每一個窗口進(jìn)行前景和背景的二分類。為了檢測不同大小的行人，還需要對圖像進(jìn)行縮放。

下面是提取出的行人的HOG特征：

HOG+AdaBoost

由于HOG + SVM的方案計算量太大，為了提高速度，后面有研究者參考了VJ[6]在人臉檢測中的分類器設(shè)計思路，將AdaBoost分類器級聯(lián)的策略應(yīng)用到了人體檢測中，只是將Haar特征替換成HOG特征，因為Haar特征過于簡單，無法描述人體這種復(fù)雜形狀的目標(biāo)。下圖為基于級聯(lián)Cascade分類器的檢測流程：

圖中每一級中的分類器都是利用AdaBoost算法學(xué)習(xí)到的一個強(qiáng)分類器，處于前面的幾個強(qiáng)分類器由于在分類器訓(xùn)練的時候會優(yōu)先選擇弱分類器，可以把最好的幾個弱分類器進(jìn)行集成，所有只需要很少的幾個就可以達(dá)到預(yù)期效果，計算會非常簡單，速度很快，大部分背景窗口很快會被排除掉，剩下很少一部分候選區(qū)域或通過后續(xù)的幾級分類器進(jìn)行判別，最終整體的檢測速度有了很大的提升，相同條件下的預(yù)測時間只有基于SVM方法的十分之一。

ICF+AdaBoost

HOG特征只關(guān)注了物體的邊緣和形狀信息，對目標(biāo)的表觀信息并沒有有效利用，所以很難處理遮擋問題，而且由于梯度的性質(zhì)，該特征對噪點敏感。針對這些問題后面有人提出了積分通道特征（ICF）[7]，積分通道特征包括10個通道：

6 個方向的梯度直方圖，3 個LUV 顏色通道和1 梯度幅值，見下圖，這些通道可以高效計算并且捕獲輸入圖像不同的信息。

在這篇文章里，AdaBoost分類器采用了soft cascade的級聯(lián)方式。為了檢測不同大小的行人，作者并沒有進(jìn)行圖像縮放然后用固定大小的分類器掃描，而是訓(xùn)練了幾個典型尺度大小的分類器，對于其他尺度大小的行人，采用這些典型尺度分類器的預(yù)測結(jié)果進(jìn)行插值來逼近，這樣就不用對圖像進(jìn)行縮放。因為近處的行人和遠(yuǎn)處的行人在外觀上有很大的差異，因此這樣做比直接對圖像進(jìn)行縮放精度更高。這一思想在后面的文章中還得到了借鑒。通過用GPU加速，這一算法達(dá)到了實時，并且有很高的精度，是當(dāng)時的巔峰之作。

DPM+ latent SVM

行人檢測中的一大難題是遮擋問題，為了解決這一問題，出現(xiàn)了采用部件檢測的方法，把人體分為頭肩，軀干，四肢等部分，對這些部分分別進(jìn)行檢測，然后將結(jié)果組合起來，使用的典型特征依然是HOG，采用的分類器有SVM和AdaBoost。針對密集和遮擋場景下的行人檢測算法可以閱讀文獻(xiàn)[15]。

DPM（Deformable Parts Models）算法在SIGAI在之前的文章“基于深度學(xué)習(xí)的目標(biāo)檢測算法綜述”已經(jīng)提到過。這是是一種基于組件的檢測算法，DPM檢測中使用的特征是HOG，針對目標(biāo)物不同部位的組建進(jìn)行獨立建模。DPM中根模型和部分模型的作用，根模型（Root-Filter）主要是對物體潛在區(qū)域進(jìn)行定位，獲取可能存在物體的位置，但是是否真的存在我們期望的物體，還需要結(jié)合組件模型（Part-Filter）進(jìn)行計算后進(jìn)一步確認(rèn)，DPM的算法流程如下：

DPM算法在人體檢測中取得取得了很好的效果，主要得益于以下幾個原因：

1.基于方向梯度直方圖（HOG）的低級特征（具有較強(qiáng)的描述能力）

2.基于可變形組件模型的高效匹配算法

3.采用了鑒別能力很強(qiáng)的latent-SVM分類器

DPM算法同時存在明顯的局限性，首先，DPM特征計算復(fù)雜，計算速度慢(論文[8]中針對DPM提出了多個加速的策略，有興趣的讀者可以參考)；其次，人工特征對于旋轉(zhuǎn)、拉伸、視角變化的物體檢測效果差。這些弊端很大程度上限制了算法的應(yīng)用場景，這一點也是基于人工特征+分類器的通病。

采用經(jīng)典機(jī)器學(xué)習(xí)的算法雖然取得了不錯的成績，但依然存在下面的問題：

1.對于外觀，視角，姿態(tài)各異的行人檢測精度還是不高

2.提取的特征在特征空間中的分布不夠緊湊

3.分類器的性能受訓(xùn)練樣本的影響較大

4.離線訓(xùn)練時的負(fù)樣本無法涵蓋所有真實應(yīng)用場景的情況

基于機(jī)器學(xué)習(xí)的更多方法以參考綜述文章[10][18][19]。文獻(xiàn)[10]對常見的16種行人檢測算法進(jìn)行了簡單描述，并在6個公開測試庫上進(jìn)行測試，給出了各種方法的優(yōu)缺點及適用情況。

文獻(xiàn)[18]提出了Caltech數(shù)據(jù)集，相比之前的數(shù)據(jù)集，它的規(guī)模大了2個數(shù)量級。作者在這個數(shù)據(jù)集上比較了當(dāng)時的主要算法，分析了一些失敗的的原因，為后續(xù)的研究指出了方向。

文獻(xiàn)[19]也比較了10年以來的行人檢測算法，總結(jié)了各種改進(jìn)措施，并支持了以后的研究方向。

基于深度學(xué)習(xí)的算法

基于背景建模和機(jī)器學(xué)習(xí)的方法在特定條件下可能取得較好的行人檢測效率或精確度，但還不能滿足實際應(yīng)用中的要求。自從2012年深度學(xué)習(xí)技術(shù)被應(yīng)用到大規(guī)模圖像分類以來[9]，研究人員發(fā)現(xiàn)基于深度學(xué)習(xí)學(xué)到的特征具有很強(qiáng)層次表達(dá)能力和很好的魯棒性，可以更好的解決一些視覺問題。因此，深度卷積神經(jīng)網(wǎng)絡(luò)被用于行人檢測問題是順理成章的事情。

SIGAI之前的文章“基于深度學(xué)習(xí)的目標(biāo)檢測算法綜述”全面介紹了基于深度學(xué)習(xí)的通用目標(biāo)檢測框架,如Faster-RCNN、SSD、FPN、YOLO等，這些方法都可以直接應(yīng)用到行人檢測的任務(wù)中，以作者實際經(jīng)驗，相比之前的SVM和AdaBoost分類器，精度有顯著的提升。小編根據(jù)Caltech行人數(shù)據(jù)集的測評指標(biāo)[11]，選取了幾種專門針對行人問題的深度學(xué)習(xí)解決方案進(jìn)行介紹。

從上圖可以看出，行人檢測主要的方法是使用人工特征+分類器的方案，以及深度學(xué)習(xí)方案兩種類型。使用的分類器有線性支持向量機(jī)，AdaBoost，隨機(jī)森林。接下來我們重點介紹基于卷積網(wǎng)絡(luò)的方案。

Cascade CNN

如果直接用卷積網(wǎng)絡(luò)進(jìn)行滑動窗口檢測，將面臨計算量太大的問題，因此必須采用優(yōu)化策略。文獻(xiàn)[22]提出了一種用級聯(lián)的卷積網(wǎng)絡(luò)進(jìn)行行人檢測的方案，這借鑒了AdaBoost分類器級聯(lián)的思想。前面的卷積網(wǎng)絡(luò)簡單，可以快速排除掉大部分背景區(qū)域：

后面的卷積網(wǎng)絡(luò)更復(fù)雜，用于精確的判斷一個候選窗口是否為行人，網(wǎng)絡(luò)結(jié)構(gòu)如下圖所示：

通過這種組合，在保證檢測精度的同時極大的提高了檢測速度。這種做法和人臉檢測中的Cascade CNN類似。

JointDeep

在文獻(xiàn)[12]中，作者使用了一種混合的策略，以Caltech行人數(shù)據(jù)庫訓(xùn)練一個卷積神經(jīng)網(wǎng)絡(luò)的行人分類器。該分類器是作用在行人檢測的最后的一級，即對最終的候選區(qū)域做最后一關(guān)的篩選，因為這個過程的效率不足以支撐滑動窗口這樣的窮舉遍歷檢測。

作者用HOG+CSS+SVM作為第一級檢測器，進(jìn)行預(yù)過濾，把它的檢測結(jié)果再使用卷積神經(jīng)網(wǎng)絡(luò)來進(jìn)一步判斷，這是一種由粗到精的策略，下圖將基于JointDeep的方法和DPM方法做了一一對應(yīng)比較。

JonitDeep 網(wǎng)絡(luò)結(jié)構(gòu)

卷積網(wǎng)絡(luò)的輸入并不是RGB通道的圖像，而是作者實驗給出的三個通道，第一個通道是原圖的YUV中的Y通道，第二個通道被均分為四個block，行優(yōu)先時分別是U通道，V通道，Y通道和全0；第三個通道是利用Sobel算子計算的第二個通道的邊緣。

另外還采用了部件檢測的策略，由于人體的每個部件大小不一，所以作者針對不同的部件設(shè)計了大小不一的卷積核尺寸，如下圖a所示，Level1針對比較小的部件，Level2針對中等大小的部件，Level3針對大部件。由于遮擋的存在，作者同時設(shè)計了幾種遮擋的模式。

(a)

(b)

SA-FastRCNN

文獻(xiàn)[13]提出了一種稱為SA-FastRCNN的方法，作者分析了Caltech行人檢測數(shù)據(jù)庫中的數(shù)據(jù)分布，提出了以下兩個問題：

1.行人尺度問題是待解決的一個問題

2.行人檢測中有許多的小尺度物體, 與大尺度物體實例在外觀特點上非常不同

作者針對行人檢測的特點對Fast R-CNN進(jìn)行了改進(jìn)，由于大尺寸和小尺寸行人提取的特征顯示出顯著差異，作者分別針對大尺寸和小尺寸行人設(shè)計了2個子網(wǎng)絡(luò)分別進(jìn)行檢測。利用訓(xùn)練階段得到的scale-aware權(quán)值將一個大尺度子網(wǎng)絡(luò)和小尺度子網(wǎng)絡(luò)合并到統(tǒng)一的框架中，利用候選區(qū)域高度估計這兩個子網(wǎng)絡(luò)的scale-aware權(quán)值，論文中使用的候選區(qū)域生成方法是利用ACF檢測器提取的候選區(qū)域，總體設(shè)計思路如下圖所示：

SA-FastRCNN的架構(gòu)如下圖所示：

這種scale-aware加權(quán)機(jī)制可以被認(rèn)為是兩個子網(wǎng)絡(luò)的soft-activation，并且最終結(jié)果總是可以通過適合當(dāng)前輸入尺寸的子網(wǎng)絡(luò)提升。

Faster R-CNN

文獻(xiàn)[16]分析了Faster R-CNN在行人檢測問題上的表現(xiàn)，結(jié)果表明，直接使用這種算法進(jìn)行行人檢測效果并不滿意。作者發(fā)現(xiàn)，F(xiàn)aster R-CNN中的RPN網(wǎng)絡(luò)對提取行人候選區(qū)域是相當(dāng)有效的，而下游的檢測網(wǎng)絡(luò)表現(xiàn)的不好。作者指出了其中的兩個原因：對于小目標(biāo)，卷積層給出的特征圖像太小了，無法有效的描述目標(biāo)；另外，也缺乏難分的負(fù)樣本挖掘機(jī)制。作者在這里采用了一種混合的策略，用RPN提取出候選區(qū)域，然后用隨機(jī)森林對候選區(qū)域進(jìn)行分類。這一結(jié)構(gòu)如下圖所示：

DeepParts

文獻(xiàn)[21]提出了一種基于部件的檢測方案，稱為DeepParts，致力于解決遮擋問題。這種方案將人體劃分成多個部位，分別進(jìn)行檢測，然后將結(jié)果組合起來。部位劃分方案如下圖所示：

整個系統(tǒng)的結(jié)構(gòu)如下圖所示：

RepLoss

RepLoss[14]由face++提出，主要目標(biāo)是解決遮擋問題。行人檢測中，密集人群的人體檢測一直是一個難題。物體遮擋問題可以分為類內(nèi)遮擋和類間遮擋兩類。類內(nèi)遮擋指同類物體間相互遮擋，在行人檢測中，這種遮擋在所占比例更大，嚴(yán)重影響著行人檢測器的性能。

針對這個問題，作者設(shè)計也一種稱為RepLoss的損失函數(shù)，這是一種具有排斥力的損失函數(shù)，下圖為RepLoss示意圖：

RepLoss 的組成包括 3 部分，表示為：

其中L_Attr 是吸引項，需要預(yù)測框靠近其指定目標(biāo)；L_RepGT 和 L_RepBox 是排斥項，分別需要當(dāng)前預(yù)測框遠(yuǎn)離周圍其它的真實物體和該目標(biāo)其它的預(yù)測框。系數(shù)充當(dāng)權(quán)重以平衡輔助損失。

HyperLearner

文獻(xiàn)[25]提出了一種稱為HyperLearner的行人檢測算法，改進(jìn)自Faster R-CNN。在文中，作者分析了行人檢測的困難之處：行人與背景的區(qū)分度低，在擁擠的場景中，準(zhǔn)確的定義一個行人非常困難。

作者使用了一些額外的特征來解決這些問題。這些特征包括：

apparent-to-semantic channels

temporal channels

depth channels

為了將這些額外的特征也送入卷積網(wǎng)絡(luò)進(jìn)行處理，作者在VGG網(wǎng)絡(luò)的基礎(chǔ)上增加了一個分支網(wǎng)絡(luò)，與主體網(wǎng)絡(luò)的特征一起送入RPN進(jìn)行處理：

其他的基本上遵循了Faster R-CNN框架的處理流程，只是將anchor參數(shù)做了改動。在實驗中，這種算法相比Faster R-CNN有了精度上的提升。

從上面的回顧也可以看出，與人臉檢測相比，行人檢測難度要大很多，目前還遠(yuǎn)稱不上已經(jīng)解決，遮擋、復(fù)雜背景下的檢測問題還沒有解決，要因此還需要學(xué)術(shù)界和工業(yè)界的持續(xù)努力。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

算法

算法

+關(guān)注

關(guān)注
23

文章
4607

瀏覽量
92826
計算機(jī)視覺

計算機(jī)視覺

+關(guān)注

關(guān)注
8

文章
1698

瀏覽量
45972

原文標(biāo)題：行人檢測算法

文章出處：【微信號：gh_ecbcc3b6eabf，微信公眾號：人工智能和機(jī)器人研究院】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

基于深度學(xué)習(xí)的目標(biāo)檢測算法解析

本節(jié)主要將近年來基于候選區(qū)域的目標(biāo)檢測算法分為五個部分進(jìn)行綜述，首先介紹了Faster R-CNN[14]框架的發(fā)展歷程，然后綜述了對Faster R-CNN算法的四個重要組成部分(特

發(fā)表于 01-09 10:52 ?1160次閱讀

人臉檢測算法及新的快速算法

人臉檢測算法及新的快速算法人臉識別設(shè)備憑借著便捷的應(yīng)用，以及更加新潮的技術(shù)，俘獲了不少人的好感。于是，它的應(yīng)用也在日益的變得更加的廣泛。由中國電子學(xué)會主辦的全國圖形圖像技術(shù)應(yīng)用大會，行業(yè)專家將介紹

發(fā)表于 09-26 15:13

如何去實現(xiàn)相位模糊估計的幀同步檢測算法？

什么是同步檢測算法？如何去實現(xiàn)相位模糊估計的幀同步檢測算法？

發(fā)表于 05-06 07:23

分享一款高速人臉檢測算法

目前優(yōu)化了一款高速人臉檢測算法，在 ARM設(shè)備的A73單核CPU(圖像大小:860*540最小人臉大小：60*60)速度可以高達(dá)10-15ms每幀，真正的實時人臉檢測算法，算法準(zhǔn)確率在 FDDB數(shù)據(jù)

發(fā)表于 12-15 07:01

基于YOLOX目標(biāo)檢測算法的改進(jìn)

基礎(chǔ)的 AlexNet 算法框架，極大的提升了算法的速度和準(zhǔn)確度。相比于傳統(tǒng)目標(biāo)檢測算法，以CNN 為核心的目標(biāo)檢測算法具有準(zhǔn)確率高、檢測速

發(fā)表于 03-06 13:55

行人慣性導(dǎo)航零速檢測算法_費(fèi)程羽

行人慣性導(dǎo)航零速檢測算法_費(fèi)程羽

發(fā)表于 03-19 19:07 ?4次下載

基于多特征的紅外行人檢測算法

基于提高紅外圖像行人檢測準(zhǔn)確率的目的，提出了一種基于多特征的紅外行人檢測算法。首先提取訓(xùn)練樣本的梯度方向直方圖特征和強(qiáng)度自相似性特征，利用二者相結(jié)合得到聯(lián)合特征訓(xùn)練支持向量機(jī)（SVM）

發(fā)表于 11-08 15:05 ?14次下載

基于多特征的紅外<b class='flag-5'>行人</b><b class='flag-5'>檢測算法</b>

基于分層稀疏編碼的行人檢測算法

針對復(fù)雜環(huán)境中的行人檢測問題，提出了一種有效的基于分層稀疏編碼的圖像表示方法。首先通過兩層稀疏編碼模型結(jié)合基于KSVD的深度學(xué)習(xí)算法來獲得圖像的稀疏表示，對圖像塊及同一區(qū)域的高階依賴關(guān)系進(jìn)行了建模

發(fā)表于 11-24 10:24 ?0次下載

基于分層稀疏編碼的<b class='flag-5'>行人</b><b class='flag-5'>檢測算法</b>

紋理與輪廓結(jié)合的行人檢測

針對在復(fù)雜場景下，聚合通道特征（ACF）的行人檢測算法存在檢測精度較低、誤檢率較高的問題，提出一種結(jié)合紋理和輪廓特征的多通道行人檢測算法。

發(fā)表于 11-27 10:25 ?0次下載

SIGAI將為大家回顧行人檢測算法的發(fā)展歷程

目前OpenCV中的行人檢測算法支持HOG+SVM以及HOG+Cascade兩種，二者都采用了滑動窗口技術(shù)，用固定大小的窗口掃描整個圖像，然后對每一個窗口進(jìn)行前景和背景的二分類。為了檢測不同大小的

發(fā)表于 08-03 11:27 ?4630次閱讀

使用結(jié)合改進(jìn)聚合通道特征和灰度共生矩陣設(shè)計的俯視行人檢測算法介紹

針對傳統(tǒng)俯視行人檢測方法提取的頭部特征單一、檢測錯誤率高的問題，提出了結(jié)合改進(jìn)聚合通道特征（ACF）和灰度共生矩陣（GLCM）的俯視行人檢測算法

發(fā)表于 12-24 16:59 ?6次下載

基于深度學(xué)習(xí)的目標(biāo)檢測算法

整體框架目標(biāo)檢測算法主要包括：【兩階段】目標(biāo)檢測算法、【多階段】目標(biāo)檢測算法、【單階段】目標(biāo)檢測算法 什么是兩階段目標(biāo)檢測算法，與單階段目

發(fā)表于 04-30 10:22 ?1.1w次閱讀

基于多級梯度特征的紅外圖像行人檢測算法

由于可見光圖像和紅外圖像的成像原理不同，可見光圖像的行人檢測算法難以直接應(yīng)用于紅外圖像中為此，提出一種基于多級梯度特征的紅外圖像行人檢測算法。使用改進(jìn)的圖像顯著性

發(fā)表于 05-27 16:27 ?6次下載

解開車輛檢測算法之謎

解開車輛檢測算法之謎

發(fā)表于 01-05 09:43 ?1171次閱讀

一種基于HOG+SVM的行人檢測算法

在先進(jìn)駕駛輔助系統(tǒng)中，基于視覺的行人檢測只能對攝像頭視野范圍內(nèi)的無遮擋行人進(jìn)行檢測，并且易受天氣的影響，在極端天氣下無法工作。

發(fā)表于 02-22 10:17 ?2880次閱讀

RM新时代网站-首页

搜索歷史

行人檢測算法的發(fā)展歷程

評論