RM新时代|首入球时间,RM是什么平台

近日，南開大學(xué)、牛津大學(xué)和加州大學(xué)默塞德分校的研究人員共同提出了一種面向目標(biāo)檢測(cè)任務(wù)的新模塊Res2Net，新模塊可以和現(xiàn)有其他優(yōu)秀模塊輕松整合，在不增加計(jì)算負(fù)載量的情況下，在ImageNet、CIFAR-100等數(shù)據(jù)集上的測(cè)試性能超過了ResNet。

2015年，由何愷明等四位華人所提出的ResNet一戰(zhàn)成名，可極快的加速神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。

而近日，由南開大學(xué)、牛津大學(xué)和加州大學(xué)默塞德分校的研究人員共同提出的Res2Net，可以和現(xiàn)有其他優(yōu)秀模塊輕松整合：在不增加計(jì)算負(fù)載量的情況下，在ImageNet、CIFAR-100等數(shù)據(jù)集上的測(cè)試性能超過了ResNet。

論文地址：

https://arxiv.org/pdf/1904.01169.pdf

關(guān)于代表性計(jì)算機(jī)視覺任務(wù)的進(jìn)一步消融研究和實(shí)驗(yàn)結(jié)果，即目標(biāo)檢測(cè)，類激活 mapping和顯著目標(biāo)檢測(cè)，進(jìn)一步驗(yàn)證了Res2Net相對(duì)于現(xiàn)有技術(shù)的基線方法的優(yōu)越性。

面向視覺任務(wù)的多尺度表示對(duì)于目標(biāo)檢測(cè)、語義分割和顯著目標(biāo)檢測(cè)任務(wù)具有重大意義。通過CNN新模塊Res2Net，能夠?qū)崿F(xiàn)與比以往優(yōu)秀的基于CNNbackbone的模型（如ResNet，ResNeXt和DLA）更好的性能表現(xiàn)。

Res2Net：計(jì)算負(fù)載不增加，特征提取能力更強(qiáng)大

在多個(gè)尺度上表示特征對(duì)于許多視覺任務(wù)非常重要。卷積神經(jīng)網(wǎng)絡(luò)（CNN） backbone 的最新進(jìn)展不斷展示出更強(qiáng)的多尺度表示能力，從而在廣泛的應(yīng)用中實(shí)現(xiàn)一致的性能提升。然而，大多數(shù)現(xiàn)有方法以分層方式（layer-wise）表示多尺度特征。

在本文中，研究人員在一個(gè)單個(gè)殘差塊內(nèi)構(gòu)造分層的殘差類連接，為CNN提出了一種新的構(gòu)建模塊，即Res2Net——以更細(xì)粒度（granular level）表示多尺度特征，并增加每個(gè)網(wǎng)絡(luò)層的感受野（receptive fields）范圍。

上圖中，左側(cè)為CNN網(wǎng)絡(luò)架構(gòu)的基本構(gòu)成，右側(cè)為本文新提出的Res2Net模塊。新模塊具備更強(qiáng)的多規(guī)模特征提取能力，但計(jì)算負(fù)載量與左側(cè)架構(gòu)類似。具體而言，新模塊用一個(gè)較小的3×3過濾器取代了過濾器組，同時(shí)可以將不同的過濾器組以層級(jí)殘差式風(fēng)格連接。模塊內(nèi)部的連接形式與殘差網(wǎng)絡(luò)（ResNet）類似，故命名為Res2Net。

與其他現(xiàn)有模塊的整合

本文所提出的Res2Net模塊可以融合到最先進(jìn)的backbone CNN模型中，例如ResNet，ResNeXt和DLA。研究人員在所有這些模型上評(píng)估 Res2Net 模塊，并在廣泛使用的數(shù)據(jù)集（例如CIFAR-100和ImageNet）上展示相對(duì)于基線模型的一致性能提升。

由于單獨(dú)的Res2Net模塊對(duì)于整體網(wǎng)絡(luò)結(jié)構(gòu)沒有特定的要求，Res2Net模塊的多尺度表示能力也和CNN的分層特征聚合模型彼此獨(dú)立，所以可以很容易地將Res2Net模塊集成到現(xiàn)有的其他優(yōu)秀CNN模型中。比如ResNet，ResNeXt 和DLA 等。集成后的模型可稱為Res2Net，Res2NeXt，和Res2Net-DLA。

Res2Net模塊性能及測(cè)試結(jié)果

ImageNet數(shù)據(jù)集測(cè)試結(jié)果

ImageNet數(shù)據(jù)集Top1和Top5測(cè)試結(jié)果

Res2Net-50在ImageNet數(shù)據(jù)集不同規(guī)模測(cè)試錯(cuò)誤率結(jié)果。其中參數(shù)w為過濾器寬度，s為scale

CIFAR-100數(shù)據(jù)集測(cè)試結(jié)果

CIFAR-100數(shù)據(jù)集Top1錯(cuò)誤率，以及模型大小

CIFAR-100數(shù)據(jù)集不同模型大小下的檢測(cè)準(zhǔn)確率

ResNet-50和Res2Net-50的類激活映射可視化對(duì)比

ResNet-101 和Res2Net-101的語義分割結(jié)果的可視化對(duì)比

ResNet-50 和Res2Net-50的顯著目標(biāo)檢測(cè)結(jié)果對(duì)比（圖7）

結(jié)論及未來方向

Res2Net結(jié)構(gòu)簡(jiǎn)單，性能優(yōu)秀，可以進(jìn)一步探索CNN在更細(xì)粒度級(jí)別的多尺度表示能力。 Res2Net揭示了一個(gè)新的維度，即“尺度”（Scale），除了深度，寬度和基數(shù)的現(xiàn)有維度之外，“規(guī)?！笔且粋€(gè)必不可少的更有效的因素。

Res2Net模塊可以很容易地與現(xiàn)有的最新模塊整合。對(duì)CIFAR100和ImageNet基準(zhǔn)測(cè)試的圖像分類結(jié)果表明，使用Res2Net模塊的網(wǎng)絡(luò)始終在與對(duì)手的競(jìng)爭(zhēng)中表現(xiàn)出更優(yōu)秀的性能，這些對(duì)手包括ResNet，ResNeXt，DLA等。

Res2Net性能上的優(yōu)越性已經(jīng)在幾個(gè)具有代表性的計(jì)算機(jī)視覺任務(wù)體現(xiàn)出來，包括類激活映射，對(duì)象檢測(cè)和顯著對(duì)象檢測(cè)等。多尺度表示對(duì)于未來開拓更廣泛的應(yīng)用領(lǐng)域至關(guān)重要。

本文相關(guān)源代碼將在論文被收稿后公開發(fā)布。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4771

瀏覽量
100712
計(jì)算機(jī)視覺

計(jì)算機(jī)視覺

+關(guān)注

關(guān)注
8

文章
1698

瀏覽量
45972
數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1208

瀏覽量
24689

原文標(biāo)題：超越ResNet：南開提出Res2Net，不增計(jì)算負(fù)載，性能全面升級(jí)！

文章出處：【微信號(hào)：AI_era，微信公眾號(hào)：新智元】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

美國(guó)普渡大學(xué)和哈佛大學(xué)的研究人員推出了一項(xiàng)新發(fā)明新...

據(jù)物理學(xué)家組織網(wǎng)報(bào)道，美國(guó)普渡大學(xué)和哈佛大學(xué)的研究人員推出了一項(xiàng)極為應(yīng)景的新發(fā)明：一種外形如同一顆圣誕樹

發(fā)表于 02-03 20:30

一種基于圖像平移的目標(biāo)檢測(cè)框架

集。本文提出了一種基于圖像平移的目標(biāo)檢測(cè)框架，以解決在不利條件下目標(biāo)檢測(cè)精度下降的問題。我們

發(fā)表于 08-31 07:43

一種專門用于檢測(cè)小目標(biāo)的框架Dilated Module

1. 介紹本文提出一種專門用于檢測(cè)小目標(biāo)的框架，框架結(jié)構(gòu)如下圖：我們探索了可以提高小目標(biāo)檢測(cè)能力

發(fā)表于 11-04 11:14

一種改進(jìn)運(yùn)動(dòng)目標(biāo)檢測(cè)算法的研究與應(yīng)用

針對(duì)運(yùn)動(dòng)目標(biāo)檢測(cè)中場(chǎng)景的混亂多變和干擾的復(fù)雜多樣的問題,提出了一種魯棒而有效的運(yùn)動(dòng)目標(biāo)檢測(cè)方法。

發(fā)表于 02-22 15:01 ?3次下載

研究人員提出了一種柔性可拉伸擴(kuò)展的多功能集成傳感器陣列

研究人員提出了一種柔性可拉伸擴(kuò)展的多功能集成傳感器陣列，成功將電子皮膚的探測(cè)能力擴(kuò)展到7種，實(shí)現(xiàn)溫度、濕度、紫外光、磁、應(yīng)變、壓力和接近等多種外界刺激的實(shí)時(shí)同步監(jiān)測(cè)。

發(fā)表于 01-24 15:15 ?7237次閱讀

<b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b><b class='flag-5'>一種</b>柔性可拉伸擴(kuò)展的多功能集成傳感器陣列

實(shí)驗(yàn)室的最新工作——Res2Net，一種在目標(biāo)檢測(cè)任務(wù)中新的Backbone網(wǎng)絡(luò)模塊

因此，多尺度的特征在傳統(tǒng)方法和深度學(xué)習(xí)里面都得到了廣泛應(yīng)用。通常我們需要采用一個(gè)大感受野的特征提取器來獲得不同尺度的特征描述，而卷積神經(jīng)網(wǎng)絡(luò)通過一堆卷積層可以很自然的由粗到細(xì)多尺度的提取特征。如何設(shè)計(jì)更高效的網(wǎng)絡(luò)結(jié)構(gòu)是提升卷積神經(jīng)網(wǎng)絡(luò)性能的關(guān)鍵。

發(fā)表于 04-08 14:33 ?8483次閱讀

實(shí)驗(yàn)室的最新工作——<b class='flag-5'>Res2Net</b>，<b class='flag-5'>一種</b>在<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b><b class='flag-5'>任務(wù)</b>中新的Backbone網(wǎng)絡(luò)<b class='flag-5'>模塊</b>

以色列研究人員開發(fā)出了一種能夠識(shí)別不同刺激的新型傳感系統(tǒng)

據(jù)麥姆斯咨詢報(bào)道，海法以色列理工學(xué)院的研究人員開發(fā)出了一種能夠識(shí)別并區(qū)分不同刺激的創(chuàng)新型傳感系統(tǒng)。該系統(tǒng)基于折紙藝術(shù)，結(jié)合了以色列理工學(xué)院開發(fā)的智能墨水材料。

發(fā)表于 05-21 08:45 ?903次閱讀

研究人員們提出了一系列新的點(diǎn)云處理模塊

為了探索這些問題的解決辦法、來自倫敦大學(xué)學(xué)院的研究人員們提出了一系列新的點(diǎn)云處理模塊，從效率、信息共享和點(diǎn)云卷積操作等方面進(jìn)行了研究，得到了

發(fā)表于 08-02 14:44 ?3056次閱讀

<b class='flag-5'>研究人員</b>們<b class='flag-5'>提出了</b><b class='flag-5'>一</b>系列新的點(diǎn)云處理<b class='flag-5'>模塊</b>

JD和OPPO的研究人員們提出了一種姿勢(shì)引導(dǎo)的時(shí)尚圖像生成模型

研究人員的主要目的在于訓(xùn)練一個(gè)生成模型，將模特在當(dāng)前姿勢(shì)上的圖像遷移到其他的目標(biāo)姿勢(shì)上去，實(shí)現(xiàn)對(duì)于衣著等商品的全面展示。

發(fā)表于 08-02 14:50 ?2543次閱讀

Facebook的研究人員提出了Mesh R-CNN模型

這一研究的目標(biāo)是通過單張圖像輸入，對(duì)圖像中的物體進(jìn)行檢測(cè)、獲取不同物體的類別、掩膜和對(duì)應(yīng)的三維網(wǎng)格，并對(duì)真實(shí)世界中的復(fù)雜模型進(jìn)行有效處理。在2

發(fā)表于 08-02 15:51 ?3879次閱讀

普渡大學(xué)的研究人員正在開發(fā)一種綜合醫(yī)療傳感平臺(tái)

普渡大學(xué)的研究人員正在開發(fā)一種綜合生物傳感平臺(tái)，旨在比現(xiàn)有方法更快，更便宜地檢測(cè)和監(jiān)測(cè)蚊媒疾病，以幫助預(yù)防病毒爆發(fā)及其破壞性影響。

發(fā)表于 10-25 09:19 ?889次閱讀

研究人員推出了一種新的基于深度學(xué)習(xí)的策略

蘇黎世聯(lián)邦理工學(xué)院的研究人員最近推出了一種新的基于深度學(xué)習(xí)的策略，該策略可以在不需要大量真實(shí)數(shù)據(jù)的情況下在機(jī)器人中實(shí)現(xiàn)觸覺傳感。在arXiv上預(yù)先發(fā)表的一篇論文中概述了他們的方法，該方

發(fā)表于 03-26 15:47 ?2602次閱讀

研究人員提出了一個(gè)名為CommPlan的框架

使用CommPlan，開發(fā)人員首先使用數(shù)據(jù)，領(lǐng)域?qū)I(yè)知識(shí)和學(xué)習(xí)算法指定五個(gè)模塊-任務(wù)模型，通信功能，通信成本模型，人員響應(yīng)模型和人員可選動(dòng)作

發(fā)表于 04-09 14:30 ?2166次閱讀

馬來西亞研究人員提出一種評(píng)估光伏模塊不同冷卻系統(tǒng)有效性的新方法

馬來西亞多媒體大學(xué)研究人員發(fā)表的一篇新論文提供了一種評(píng)估光伏模塊不同冷卻系統(tǒng)有效性的新方法。所提出的技術(shù)依賴于在附加冷卻的情況下測(cè)量

發(fā)表于 04-17 15:47 ?712次閱讀

MIT研究人員提出了一種制造軟氣動(dòng)執(zhí)行器的新方法

麻省理工學(xué)院（MIT）的研究人員創(chuàng)造了一種新的制造技術(shù)，可以制造出更具成本效益的軟氣動(dòng)執(zhí)行器。

發(fā)表于 05-06 16:38 ?1629次閱讀

RM新时代网站-首页

搜索歷史

研究人員共同提出了一種面向目標(biāo)檢測(cè)任務(wù)的新模塊Res2Net

評(píng)論

美國(guó)普渡大學(xué)和哈佛大學(xué)的研究人員推出了一項(xiàng)新發(fā)明新...

一種基于圖像平移的目標(biāo)檢測(cè)框架

一種專門用于檢測(cè)小目標(biāo)的框架Dilated Module

一種改進(jìn)運(yùn)動(dòng)目標(biāo)檢測(cè)算法的研究與應(yīng)用

研究人員提出了一種柔性可拉伸擴(kuò)展的多功能集成傳感器陣列

實(shí)驗(yàn)室的最新工作——Res2Net，一種在目標(biāo)檢測(cè)任務(wù)中新的Backbone網(wǎng)絡(luò)模塊

以色列研究人員開發(fā)出了一種能夠識(shí)別不同刺激的新型傳感系統(tǒng)

研究人員們提出了一系列新的點(diǎn)云處理模塊

JD和OPPO的研究人員們提出了一種姿勢(shì)引導(dǎo)的時(shí)尚圖像生成模型

Facebook的研究人員提出了Mesh R-CNN模型

普渡大學(xué)的研究人員正在開發(fā)一種綜合醫(yī)療傳感平臺(tái)

研究人員推出了一種新的基于深度學(xué)習(xí)的策略

研究人員提出了一個(gè)名為CommPlan的框架

馬來西亞研究人員提出一種評(píng)估光伏模塊不同冷卻系統(tǒng)有效性的新方法

MIT研究人員提出了一種制造軟氣動(dòng)執(zhí)行器的新方法