rm新时代靠谱吗,rm新时代爆单

作者：Ching (Chingis)編譯：ronghuaiyang來源：AI公園

導(dǎo)讀

對(duì)目標(biāo)檢測(cè)后處理中的NMS和WBF的解釋和對(duì)比。目前，計(jì)算機(jī)視覺在許多地方都有重要的應(yīng)用，例如自動(dòng)駕駛汽車、監(jiān)控系統(tǒng)和圖像識(shí)別。計(jì)算機(jī)視覺的主要挑戰(zhàn)之一是目標(biāo)檢測(cè)，它涉及識(shí)別和定位圖像和視頻中的目標(biāo)。為了提高目標(biāo)檢測(cè)系統(tǒng)的性能，研究人員和從業(yè)者開發(fā)了各種技術(shù)，例如模型集成和測(cè)試時(shí)增強(qiáng)（TTA）。

模型集成是組合多個(gè)模型的預(yù)測(cè)以提高系統(tǒng)整體性能的過程。這可以通過對(duì)多個(gè)模型的預(yù)測(cè)求平均值，或使用更復(fù)雜的方法（如加權(quán)框融合（WBF））來組合預(yù)測(cè)來完成。集成方法可以通過減少過擬合的影響并提高系統(tǒng)的魯棒性來顯著提高目標(biāo)檢測(cè)系統(tǒng)的性能。

測(cè)試時(shí)增強(qiáng) （TTA）是另一種用于提高目標(biāo)檢測(cè)系統(tǒng)性能的技術(shù)。它在測(cè)試期間將各種數(shù)據(jù)增強(qiáng)技術(shù)（例如旋轉(zhuǎn)、縮放和翻轉(zhuǎn)）應(yīng)用于輸入圖像。這可以通過使系統(tǒng)對(duì)輸入數(shù)據(jù)的微小變化更加不變來幫助提高系統(tǒng)的魯棒性。TTA還可以通過提供額外的數(shù)據(jù)供檢測(cè)器學(xué)習(xí)來幫助提高系統(tǒng)的性能。

在本文中，我們將探索和比較非最大抑制（NMS）和加權(quán)框融合（WBF）以提高目標(biāo)檢測(cè)系統(tǒng)的性能。

非最大值抑制

非極大值抑制 (NMS) 是一種后處理技術(shù)，用于去除目標(biāo)檢測(cè)器生成的重疊框。它常用于計(jì)算機(jī)視覺中的目標(biāo)檢測(cè)任務(wù)，例如人臉檢測(cè)、目標(biāo)跟蹤以及圖像和視頻中的目標(biāo)檢測(cè)。

NMS 背后的基本思想是選擇置信度得分最高的框，然后刪除與其顯著重疊的其他框。重復(fù)此過程，直到考慮了所有框。這有助于減少目標(biāo)檢測(cè)中的誤報(bào)數(shù)量，因?yàn)槟繕?biāo)檢測(cè)器通常會(huì)生成對(duì)同一目標(biāo)的多次檢測(cè)。

計(jì)算兩個(gè)邊界框之間重疊的最常見方法是使用交并比 (IoU) 指標(biāo)。

IoU(A,B) = (A ∩ B) / (A ∪ B)

其中 A 和 B 是邊界框的面積，A ∩ B 是它們相交的面積。通常，為 IoU 度量設(shè)置一個(gè)閾值，任何 IoU 大于該閾值的邊界框都被認(rèn)為是重復(fù)檢測(cè)并被刪除。

加權(quán)框融合

加權(quán)框融合（WBF）是一種提高目標(biāo)檢測(cè)系統(tǒng)性能的強(qiáng)大技術(shù)。它是一種將多個(gè)邊界框或感興趣區(qū)域 (ROI) 的結(jié)果組合成一個(gè)更準(zhǔn)確、更穩(wěn)定的結(jié)果的方法。當(dāng)使用多個(gè)模型或算法來檢測(cè)圖像或視頻中的目標(biāo)并且需要組合結(jié)果以提高整體性能時(shí)，該技術(shù)特別有用。

從本質(zhì)上講，WBF 是一種通過根據(jù)各種標(biāo)準(zhǔn)為每個(gè)邊界框分配權(quán)重來組合多個(gè)目標(biāo)檢測(cè)器結(jié)果的方法。然后使用這些權(quán)重將邊界框組合成一個(gè)更穩(wěn)健的結(jié)果。

WBF算法的工作步驟如下：

每個(gè)模型的每個(gè)預(yù)測(cè)框（或通過 TTA 獲得的預(yù)測(cè)）都會(huì)添加到單個(gè)列表 B 中，然后按置信度分?jǐn)?shù) C 的降序排序。
分別為框組和融合框?qū)嵗碌目樟斜?L 和 F。因此，列表L中的每個(gè)元素都是由于重疊而形成的一組框，而F中的每個(gè)位置僅包含一個(gè)框，即融合框。
在一個(gè)循環(huán)中迭代 B 中的預(yù)測(cè)框，并檢查列表 F 中的匹配框（IoU > THR）。
如果未找到匹配項(xiàng)，則將 B 中的框添加到列表 L 和 F 的末尾作為新條目；繼續(xù)進(jìn)行 B 中的下一個(gè)框。
如果找到匹配，則將此框添加到列表L中與F中的匹配框?qū)?yīng)的位置處。
使用框組 L[pos]中的所有內(nèi)容重新計(jì)算 F[pos]中的框坐標(biāo)和置信度得分。將置信度得分設(shè)置為 L[pos]中所有框的平均置信度。融合框的坐標(biāo)是形成它的框的坐標(biāo)的加權(quán)和，其中權(quán)重是對(duì)應(yīng)框的置信度分?jǐn)?shù)。最終 ROI = Σ (權(quán)重 i * ROIi) / Σ 權(quán)重 i。其中 ROIi 是第 i 個(gè)邊界框，weighti 是分配給該邊界框的權(quán)重，并且對(duì)正在考慮進(jìn)行融合的所有邊界框進(jìn)行求和。最終的 ROI 是計(jì)算得出的組合邊界框。
最后，重新調(diào)整 F 列表中的置信度分?jǐn)?shù)：將其乘以組中的框數(shù)（定義為下面的 T），然后除以模型數(shù) N。如果組中的框數(shù)量較少，則可能意味著只有少數(shù)模型可以預(yù)測(cè)它。因此，我們需要降低此類情況的置信度分?jǐn)?shù)。

WBF 可以成為提高目標(biāo)檢測(cè)系統(tǒng)性能的強(qiáng)大工具，并且越來越多地被廣泛應(yīng)用于自動(dòng)駕駛汽車、監(jiān)控系統(tǒng)和計(jì)算機(jī)視覺的許多其他領(lǐng)域。通過集成WBF技術(shù)，目標(biāo)檢測(cè)系統(tǒng)可以變得更加魯棒和準(zhǔn)確，并且即使在存在噪聲和遮擋的情況下也可以表現(xiàn)得更好。

NMS vs WBF加權(quán)框融合（WBF）和非極大值抑制（NMS）都是用于提高目標(biāo)檢測(cè)系統(tǒng)性能的技術(shù)。然而，它們的使用方式不同，并且具有不同的權(quán)衡。NMS 是一種后處理技術(shù)，用于刪除目標(biāo)檢測(cè)器生成的重疊邊界框。它的工作原理是選擇置信度得分最高的邊界框，然后刪除與其顯著重疊的任何其他邊界框。重復(fù)此過程，直到考慮了所有邊界框。NMS 是一種簡(jiǎn)單、快速且有效的方法，可減少目標(biāo)檢測(cè)中的誤報(bào)數(shù)量。

另一方面，WBF 是一種用于組合多個(gè)邊界框（或感興趣區(qū)域）的技術(shù)，以產(chǎn)生更準(zhǔn)確和穩(wěn)定的結(jié)果。它通常用于使用多個(gè)模型或算法來檢測(cè)圖像或視頻中的對(duì)象，并且需要組合結(jié)果以提高整體性能的情況。WBF 的工作原理是根據(jù)檢測(cè)置信度、與其他邊界框的重疊或其他標(biāo)準(zhǔn)等因素為每個(gè)邊界框分配權(quán)重。然后使用這些權(quán)重將邊界框組合成一個(gè)更穩(wěn)健的結(jié)果。

實(shí)驗(yàn)評(píng)估2個(gè)不同模型的集成表 1 顯示了兩個(gè)模型的 MS COCO 驗(yàn)證集的結(jié)果。使用四種不同的技術(shù)組合預(yù)測(cè)：NMS、Soft NMS、NMW 和 WBF。我們看到，在不同的設(shè)置下，WBF 方法明顯優(yōu)于其他方法，帶來了更大的改進(jìn)。測(cè)試時(shí)增強(qiáng)集成

在上表中我們看到作者還提供了通過 TTA 組合預(yù)測(cè)的實(shí)驗(yàn)。他們使用在 COCO 數(shù)據(jù)集上訓(xùn)練的 EfficientNetB7 模型。對(duì)于 TTA，他們只采用水平翻轉(zhuǎn)。同樣，我們看到 WBF 的性能明顯優(yōu)于 NMS、Soft-NMS 和 NMW 等其他方法。

最后使用加權(quán)框融合 (WBF) 的動(dòng)機(jī)是通過將多個(gè)邊界框或感興趣區(qū)域 (ROI) 的結(jié)果組合成一個(gè)更準(zhǔn)確和穩(wěn)定的結(jié)果來提高目標(biāo)檢測(cè)系統(tǒng)的性能。這在使用多個(gè)模型或算法來檢測(cè)圖像或視頻中的目標(biāo)并且需要組合結(jié)果以提高整體性能的情況下特別有用。使用 WBF 有益的原因有以下幾個(gè)：

魯棒性：物體檢測(cè)器可能會(huì)受到雜波、遮擋和背景噪聲等因素的影響。WBF可以通過結(jié)合多個(gè)檢測(cè)器的結(jié)果來幫助提高物體檢測(cè)系統(tǒng)的魯棒性，從而可以減少這些因素的影響。
準(zhǔn)確性：WBF 可以通過組合同一物體的多次檢測(cè)來幫助提高物體檢測(cè)系統(tǒng)的準(zhǔn)確性。這在圖像或視頻中目標(biāo)部分被遮擋或僅部分可見的情況下特別有用。
穩(wěn)定性：WBF 可以通過減少誤報(bào)和漏報(bào)的影響來幫助提高目標(biāo)檢測(cè)系統(tǒng)的穩(wěn)定性。這在感興趣的物體很小或難以檢測(cè)的情況下特別有用。

靈活性：WBF可以與非極大值抑制（NMS）等其他技術(shù)結(jié)合使用，以進(jìn)一步提高目標(biāo)檢測(cè)系統(tǒng)的性能。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

測(cè)試

測(cè)試

+關(guān)注

關(guān)注
8

文章
5269

瀏覽量
126598
檢測(cè)

檢測(cè)

+關(guān)注

關(guān)注
5

文章
4480

瀏覽量
91442
AI

AI

+關(guān)注

關(guān)注
87

文章
30728

瀏覽量
268880

評(píng)論

相關(guān)推薦

YOLOv10自定義目標(biāo)檢測(cè)之理論+實(shí)踐

概述 YOLOv10 是由清華大學(xué)研究人員利用 Ultralytics Python 軟件包開發(fā)的，它通過改進(jìn)模型架構(gòu)并消除非極大值抑制（NMS）提供了一種新穎的實(shí)時(shí)目標(biāo)檢測(cè)方法。這些優(yōu)化使得模型在

發(fā)表于 11-16 10:23 ?416次閱讀

YOLOv10自定義<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>之理論+實(shí)踐

YOLOv10:引領(lǐng)無NMS實(shí)時(shí)目標(biāo)檢測(cè)的新紀(jì)元

。 YOLO（You Only Look Once）系列一直是實(shí)時(shí)目標(biāo)檢測(cè)的基準(zhǔn)，成功平衡了計(jì)算成本和檢測(cè)性能。盡管在架構(gòu)設(shè)計(jì)和優(yōu)化策略方面取得了進(jìn)展，但對(duì)非最大值抑制（NMS）

發(fā)表于 11-13 17:12 ?618次閱讀

YOLOv10:引領(lǐng)無<b class='flag-5'>NMS</b>實(shí)時(shí)<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>的新紀(jì)元

第2章 ANSYS分析基本過程--第7章通用后處理器

第2章 ?ANSYS分析基本過程--第7章通用后處理器

發(fā)表于 08-31 09:31 ?0次下載

第8章時(shí)間歷程后處理器--第13章 ANSYS新界面Workbench環(huán)境

第8章 ?時(shí)間歷程后處理器--第13章 ?ANSYS新界面Workbench環(huán)境

發(fā)表于 08-30 11:21 ?0次下載

不同J-Link版本對(duì)于i.MXRT1170連接復(fù)位后處理行為

大家好，我是痞子衡，是正經(jīng)搞技術(shù)的痞子。今天痞子衡給大家介紹的是不同J-Link版本對(duì)于i.MXRT1170連接復(fù)位后處理行為。

發(fā)表于 08-08 15:29 ?421次閱讀

不同J-Link版本對(duì)于i.MXRT1170連接復(fù)位<b class='flag-5'>后處理</b>行為

圖像分割與目標(biāo)檢測(cè)的區(qū)別是什么

的區(qū)別。定義圖像分割是將圖像劃分為若干個(gè)區(qū)域或?qū)ο蟮倪^程，這些區(qū)域或?qū)ο缶哂邢嗨频膶傩裕珙伾?、紋理或形狀。圖像分割的目的是將圖像中的不同對(duì)象或區(qū)域分離出來，以便進(jìn)行進(jìn)一步的分析和處理。 目標(biāo)檢測(cè)則是在圖像中

發(fā)表于 07-17 09:53 ?1271次閱讀

目標(biāo)檢測(cè)與識(shí)別技術(shù)有哪些

目標(biāo)檢測(cè)與識(shí)別技術(shù)是計(jì)算機(jī)視覺領(lǐng)域的重要研究方向，廣泛應(yīng)用于安全監(jiān)控、自動(dòng)駕駛、醫(yī)療診斷、工業(yè)自動(dòng)化等領(lǐng)域。 目標(biāo)檢測(cè)與識(shí)別技術(shù)的基本概念 目標(biāo)

發(fā)表于 07-17 09:40 ?588次閱讀

目標(biāo)檢測(cè)與識(shí)別技術(shù)的關(guān)系是什么

目標(biāo)檢測(cè)與識(shí)別技術(shù)是計(jì)算機(jī)視覺領(lǐng)域的兩個(gè)重要研究方向，它們之間存在著密切的聯(lián)系和相互依賴的關(guān)系。一、目標(biāo)檢測(cè)與識(shí)別技術(shù)的概念 目標(biāo)

發(fā)表于 07-17 09:38 ?573次閱讀

目標(biāo)檢測(cè)識(shí)別主要應(yīng)用于哪些方面

目標(biāo)檢測(cè)識(shí)別是計(jì)算機(jī)視覺領(lǐng)域的一個(gè)重要研究方向，它主要關(guān)注于從圖像或視頻中識(shí)別和定位目標(biāo)物體。隨著計(jì)算機(jī)視覺技術(shù)的不斷發(fā)展，目標(biāo)檢測(cè)識(shí)別已經(jīng)

發(fā)表于 07-17 09:34 ?1038次閱讀

慧視小目標(biāo)識(shí)別算法解決目標(biāo)檢測(cè)中的老大難問題

隨著深度學(xué)習(xí)和人工智能技術(shù)的興起與技術(shù)成熟，一大批如FasterR-CNN、RetinaNet、YOLO等可以在工業(yè)界使用的目標(biāo)檢測(cè)算法已逐步成熟并進(jìn)入實(shí)際應(yīng)用，大多數(shù)場(chǎng)景下的目標(biāo)檢測(cè)

發(fā)表于 07-17 08:29 ?477次閱讀

基于深度學(xué)習(xí)的小目標(biāo)檢測(cè)

在計(jì)算機(jī)視覺領(lǐng)域，目標(biāo)檢測(cè)一直是研究的熱點(diǎn)和難點(diǎn)之一。特別是在小目標(biāo)檢測(cè)方面，由于小目標(biāo)在圖像中所占比例小、特征不明顯，使得

發(fā)表于 07-04 17:25 ?855次閱讀

圖像檢測(cè)與識(shí)別技術(shù)的關(guān)系

檢測(cè)技術(shù)是指利用計(jì)算機(jī)視覺技術(shù)，對(duì)圖像中的特定目標(biāo)進(jìn)行定位和識(shí)別的過程。它通常包括圖像預(yù)處理、特征提取、目標(biāo)檢測(cè)和

發(fā)表于 07-03 14:43 ?630次閱讀

用OpenVINO C# API在intel平臺(tái)部署YOLOv10目標(biāo)檢測(cè)模型

的模型設(shè)計(jì)策略,從效率和精度兩個(gè)角度對(duì)YOLOs的各個(gè)組成部分進(jìn)行了全面優(yōu)化，大大降低了計(jì)算開銷，增強(qiáng)了性能。在本文中，我們將結(jié)合OpenVINO C# API使用最新發(fā)布的OpenVINO 2024.1部署YOLOv10目標(biāo)檢測(cè)模型。

發(fā)表于 06-21 09:23 ?1019次閱讀

開發(fā)者手機(jī) AI - 目標(biāo)識(shí)別 demo

%。 Init、DeInit 為Native的初始化和去初始化實(shí)現(xiàn)，主要對(duì)模型進(jìn)行創(chuàng)建、編譯以及銷毀。 Process為異步NAPI接口，主要完成目標(biāo)識(shí)別的功能。實(shí)現(xiàn)包括前處理、推理和后處理3個(gè)部分。前

發(fā)表于 04-11 16:14

TLE9850x控制器能否通過設(shè)置閾值將ADC1后處理通道0用于ADC1-CH13？

我目前使用的是 TLE9850x 控制器，能否通過設(shè)置閾值將 ADC1 后處理通道 0 用于 ADC1-CH13？

發(fā)表于 03-05 08:04

RM新时代网站-首页

搜索歷史

目標(biāo)檢測(cè)的后處理：NMS vs WBF

評(píng)論

YOLOv10自定義目標(biāo)檢測(cè)之理論+實(shí)踐

YOLOv10:引領(lǐng)無NMS實(shí)時(shí)目標(biāo)檢測(cè)的新紀(jì)元

第2章 ANSYS分析基本過程--第7章通用后處理器

第8章時(shí)間歷程后處理器--第13章 ANSYS新界面Workbench環(huán)境

不同J-Link版本對(duì)于i.MXRT1170連接復(fù)位后處理行為

圖像分割與目標(biāo)檢測(cè)的區(qū)別是什么

目標(biāo)檢測(cè)與識(shí)別技術(shù)有哪些

目標(biāo)檢測(cè)與識(shí)別技術(shù)的關(guān)系是什么

目標(biāo)檢測(cè)識(shí)別主要應(yīng)用于哪些方面

慧視小目標(biāo)識(shí)別算法解決目標(biāo)檢測(cè)中的老大難問題

基于深度學(xué)習(xí)的小目標(biāo)檢測(cè)

圖像檢測(cè)與識(shí)別技術(shù)的關(guān)系

用OpenVINO C# API在intel平臺(tái)部署YOLOv10目標(biāo)檢測(cè)模型

開發(fā)者手機(jī) AI - 目標(biāo)識(shí)別 demo

TLE9850x控制器能否通過設(shè)置閾值將ADC1后處理通道0用于ADC1-CH13？