RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

國際計(jì)算機(jī)視覺競賽PASCAL VOC,中星微以89.0分的總成績位列第一

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-07-09 08:55 ? 次閱讀

近日,在國際計(jì)算機(jī)視覺競賽PASCAL VOC,中星微以89.0分的總成績位列第一,獲得目標(biāo)檢測單模型第一名。獲勝的模型是一步法的目標(biāo)檢測模型,本文帶來技術(shù)詳解。

近日,在PASCAL VOC comp4目標(biāo)檢測競賽中,中星微再創(chuàng)佳績,獲得了目標(biāo)檢測單模型第一名。

Pascal VOC是世界計(jì)算機(jī)視覺領(lǐng)域知名的競賽,比賽中,參賽者要對人、貓、鳥、飛機(jī)、汽車、船、盆栽等20類物體進(jìn)行檢測。由于訓(xùn)練樣本較少,場景變化多端,非常具有挑戰(zhàn)性。中星微人工智能參賽團(tuán)隊(duì)VIM_SSD以89.0分的總成績位列第一。

中星微人工智能芯片技術(shù)公司董事長兼總經(jīng)理張韻東表示:“本次參賽的模型適合終端設(shè)備部署的簡單模型一步法算法,能夠取得與云端服務(wù)器復(fù)雜多模型算法相媲美的結(jié)果,實(shí)屬不易。作為人工智能芯片公司,我們不僅要在芯片設(shè)計(jì)方面精益求精,同時(shí)更要在算法的精簡優(yōu)化方面取得突破,為客戶提供前端智能設(shè)備的整體解決方案。”

一步法目標(biāo)檢測模型

中星微本次提交的深度學(xué)習(xí)模型和上次參加比賽的深度學(xué)習(xí)模型基本一致,仍然沿用了一步法的目標(biāo)檢測模型,基礎(chǔ)網(wǎng)絡(luò)采用VGG16,并未使用ResNet-101, ResNet-152等更復(fù)雜的網(wǎng)絡(luò),保證精度的情況下速度更快。第一次參加比賽的成績是87.6,這次是89.0,精度提高很多。該結(jié)果不僅領(lǐng)先于所有的一步法算法,同時(shí)擊敗了所有的二步法算法。

中星微人工智能芯片技術(shù)公司研發(fā)副總裁艾國表示:“本次我們深度學(xué)習(xí)模型是上次模型的全面升級,仍然沿用了一步法的網(wǎng)絡(luò)架構(gòu),重點(diǎn)改進(jìn)和優(yōu)化了訓(xùn)練相關(guān)的方法和技術(shù),在不增加算法復(fù)雜度的情況下,使得網(wǎng)絡(luò)的精度越來越高,這是我們公司要打造的核心技術(shù)。在前端嵌入式設(shè)備計(jì)算資源受限的情況下,我們通過調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練的方法提高精度,而不是不斷增加網(wǎng)絡(luò)復(fù)雜度?!?/p>

VOC 2012數(shù)據(jù)集圖片測試結(jié)果

不僅是單模型,而且是一步法,尤其適用于嵌入式NPU

多模型融合是深度學(xué)習(xí)比賽中經(jīng)常使用到的一個(gè)利器,它通??梢栽诟鞣N不同的機(jī)器學(xué)習(xí)任務(wù)中使結(jié)果獲得提升。顧名思義,多模型融合就是綜合考慮多個(gè)不同模型的情況,并將它們的結(jié)果融合到一起。

雖然通過模型進(jìn)行融合往往效果較好,但是其實(shí)現(xiàn)代價(jià)和計(jì)算開銷也比較大。目前,中星微主要是從實(shí)際項(xiàng)目應(yīng)用的角度來考慮,特別是前端應(yīng)用,一般都是單模型。當(dāng)然,后期也會考慮使用模型融合,來提升比賽結(jié)果的精度。

下表是目前PASCAL VOC競賽前十名,可以看出,下面算法中大部分應(yīng)用了更復(fù)雜的基礎(chǔ)網(wǎng)絡(luò)ResNet-101和ResNet-152,并且是兩步法,也有多模型融合(ensemble)。而中星微的模型不僅是單模型,而且是一步法,在嵌入式NPU可以達(dá)到很高的幀率。

Method Backbone mAP (%)
Ali_DCN_SSD_ENSEMBLE ResNet-101 89.2 ensemble
VIM_SSD(COCO+07++12, single model, one-stage) VGG16 89.0 one-stage single
FOCAL_DRFCN(VOC+COCO, single model) ResNet-152 88.8 two-stage single
R4D_faster_rcnn - 88.6 - -
FF_CSSD(VOC+COCO, one-stage, single model) [?] ResNet101 88.4 one-stage single
R-FCN, ResNet Ensemble(VOC+COCO) ResNet 88.4 two-stage ensemble
HIK_FRCN ResNet-101 87.9 two-stage single
VIM_SSD VGG16 87.6 one-stage single
Deformable R-FCN, ResNet-101 (VOC+COCO) ResNet-101 87.1 two-stage single
RefineDet(VOC+COCO,singlemodel,VGG16,one-stage) VGG16 86.8 one-stage single

阿里巴巴達(dá)摩院多模型融合網(wǎng)絡(luò)Ali_DCN_SSD_ENSEMBLE的得分是89.2,只比中星微單模型網(wǎng)絡(luò)高了0.2點(diǎn),而阿里巴巴達(dá)摩院FF_CSSD(VOC+COCO, one-stage, single model)一步法單模型的精度是88.4,基礎(chǔ)網(wǎng)絡(luò)是ResNet101,和中星微差了0.6個(gè)點(diǎn)。

從安防監(jiān)控到保護(hù)瀕危野生動物,應(yīng)用場景廣泛

目標(biāo)檢測技術(shù)應(yīng)用廣泛,是AI場景落地的關(guān)鍵性技術(shù)之一。中星微的深度學(xué)習(xí)模型運(yùn)行在前端智能設(shè)備(如智能攝像頭上),廣泛用于安防監(jiān)控、安全生產(chǎn)、環(huán)境保護(hù)、個(gè)人健康監(jiān)測等領(lǐng)域。

下面是一個(gè)環(huán)境保護(hù)的例子,在我國西部及藏區(qū)應(yīng)用,其采用人工智能、深度學(xué)習(xí)對野生保護(hù)動物進(jìn)行檢測、識別、統(tǒng)計(jì)。從而達(dá)到對野生動物保護(hù),生態(tài)環(huán)境平衡的目標(biāo)。根據(jù)國家要求,增強(qiáng)保護(hù)野生動物、保護(hù)環(huán)境的意識,特別是對瀕臨滅絕的野生動物的研究和保護(hù),更要加大力度;要從科研、技術(shù)角度解決野生動物保護(hù)和數(shù)量的實(shí)時(shí)狀態(tài)。

如下圖,是對藏羚羊的檢測、識別、統(tǒng)計(jì):

如下圖,是對藏野驢的監(jiān)測、識別、統(tǒng)計(jì):

概念說明

精度:目標(biāo)檢測中衡量識別精度的指標(biāo)是mAP(mean average precision)。在多個(gè)類別物體檢測中,每一個(gè)類別都可以根據(jù)recall和precision繪制一條曲線,AP就是該曲線下的面積,mAP是多個(gè)類別AP的平均值,理論上最高mAP為1.0,也就是我們說的100分,89分其實(shí)就是0.89 mAP,下面是示例說明。

前端智能和云端智能:前端智能是將智能分析算法嵌入到前端設(shè)備,拿安防攝像機(jī)舉例,就是攝像機(jī)采集的視頻內(nèi)容立即進(jìn)行分析,提取出畫面中關(guān)鍵的、感興趣的、有效的信息,形成結(jié)構(gòu)化的數(shù)據(jù)。前端智能因受各種資源限制,需要對算法復(fù)雜度、網(wǎng)絡(luò)模型大小等有限制。

云端智能是將前端傳感器采集的數(shù)據(jù)通過云端來完成智能分析,一般通過大型的GPU服務(wù)器來完成。因此相對于前端智能,計(jì)算資源、內(nèi)存資源、存儲資源、網(wǎng)絡(luò)資源等都較大,因此對算法模型的限制比較小,可以部署很大的很復(fù)雜網(wǎng)絡(luò)模型。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 中星微
    +關(guān)注

    關(guān)注

    0

    文章

    27

    瀏覽量

    11236
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47183

    瀏覽量

    238243
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1698

    瀏覽量

    45972

原文標(biāo)題:目標(biāo)檢測競賽利器:中星微一步法模型獲國際算法競賽第一名!

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    計(jì)算機(jī)視覺有哪些優(yōu)缺點(diǎn)

    計(jì)算機(jī)視覺作為人工智能領(lǐng)域的個(gè)重要分支,旨在使計(jì)算機(jī)能夠像人類樣理解和解釋圖像和視頻中的信息。這
    的頭像 發(fā)表于 08-14 09:49 ?916次閱讀

    地平線科研論文入選國際計(jì)算機(jī)視覺頂會ECCV 2024

    近日,地平線兩篇論文入選國際計(jì)算機(jī)視覺頂會ECCV 2024,自動駕駛算法技術(shù)再有新突破。
    的頭像 發(fā)表于 07-27 11:10 ?910次閱讀
    地平線科研論文入選<b class='flag-5'>國際</b><b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>頂會ECCV 2024

    機(jī)器視覺計(jì)算機(jī)視覺有什么區(qū)別

    機(jī)器視覺計(jì)算機(jī)視覺是兩個(gè)密切相關(guān)但又有所區(qū)別的概念。 、定義 機(jī)器視覺 機(jī)器視覺,又稱為
    的頭像 發(fā)表于 07-16 10:23 ?517次閱讀

    計(jì)算機(jī)視覺的五大技術(shù)

    計(jì)算機(jī)視覺作為深度學(xué)習(xí)領(lǐng)域最熱門的研究方向之,其技術(shù)涵蓋了多個(gè)方面,為人工智能的發(fā)展開拓了廣闊的道路。以下是對計(jì)算機(jī)視覺五大技術(shù)的詳細(xì)解析
    的頭像 發(fā)表于 07-10 18:26 ?1330次閱讀

    計(jì)算機(jī)視覺的工作原理和應(yīng)用

    圖像和視頻中提取有用信息,進(jìn)而進(jìn)行決策和行動。自1960年代第一批學(xué)術(shù)論文問世以來,計(jì)算機(jī)視覺技術(shù)已經(jīng)取得了長足的發(fā)展,并在多個(gè)領(lǐng)域展現(xiàn)出巨大的應(yīng)用潛力和價(jià)值。
    的頭像 發(fā)表于 07-10 18:24 ?1903次閱讀

    計(jì)算機(jī)視覺與人工智能的關(guān)系是什么

    引言 計(jì)算機(jī)視覺門研究如何使計(jì)算機(jī)能夠理解和解釋視覺信息的學(xué)科。它涉及到圖像處理、模式識別、機(jī)器學(xué)習(xí)等多個(gè)領(lǐng)域的知識。人工智能則是研究如
    的頭像 發(fā)表于 07-09 09:25 ?618次閱讀

    計(jì)算機(jī)視覺與智能感知是干嘛的

    引言 計(jì)算機(jī)視覺(Computer Vision)是門研究如何使計(jì)算機(jī)能夠理解和解釋視覺信息的學(xué)科。它涉及到圖像處理、模式識別、機(jī)器學(xué)習(xí)等
    的頭像 發(fā)表于 07-09 09:23 ?914次閱讀

    計(jì)算機(jī)視覺和機(jī)器視覺區(qū)別在哪

    ,旨在實(shí)現(xiàn)對圖像和視頻的自動分析和理解。 機(jī)器視覺 機(jī)器視覺計(jì)算機(jī)視覺個(gè)分支,主要應(yīng)用于工業(yè)自動化領(lǐng)域。它利用
    的頭像 發(fā)表于 07-09 09:22 ?445次閱讀

    計(jì)算機(jī)視覺和圖像處理的區(qū)別和聯(lián)系

    計(jì)算機(jī)視覺和圖像處理是兩個(gè)密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。 1. 基本概念 1.1 計(jì)算機(jī)視覺 計(jì)算機(jī)視覺
    的頭像 發(fā)表于 07-09 09:16 ?1281次閱讀

    計(jì)算機(jī)視覺屬于人工智能嗎

    屬于,計(jì)算機(jī)視覺是人工智能領(lǐng)域的個(gè)重要分支。 引言 計(jì)算機(jī)視覺門研究如何使
    的頭像 發(fā)表于 07-09 09:11 ?1285次閱讀

    深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為其中的核心技術(shù)之,已經(jīng)在計(jì)算機(jī)視覺領(lǐng)域取得了顯著的成果。計(jì)算機(jī)視覺,作為
    的頭像 發(fā)表于 07-01 11:38 ?776次閱讀

    機(jī)器視覺計(jì)算機(jī)視覺的區(qū)別

    在人工智能和自動化技術(shù)的快速發(fā)展中,機(jī)器視覺(Machine Vision, MV)和計(jì)算機(jī)視覺(Computer Vision, CV)作為兩個(gè)重要的分支領(lǐng)域,都扮演著至關(guān)重要的角色。盡管它們在
    的頭像 發(fā)表于 06-06 17:24 ?1319次閱讀

    計(jì)算機(jī)視覺的主要研究方向

    計(jì)算機(jī)視覺(Computer Vision, CV)作為人工智能領(lǐng)域的個(gè)重要分支,致力于使計(jì)算機(jī)能夠像人眼樣理解和解釋圖像和視頻中的信息
    的頭像 發(fā)表于 06-06 17:17 ?947次閱讀

    【量子計(jì)算機(jī)重構(gòu)未來 | 閱讀體驗(yàn)】+ 初識量子計(jì)算機(jī)

    感覺量子技術(shù)神奇神秘,希望通過閱讀此書來認(rèn)識量子計(jì)算機(jī)。 先瀏覽下目錄: 通過目錄,基本可以確定這是本關(guān)于量子計(jì)算機(jī)的科普書籍,主要包括什么是量子
    發(fā)表于 03-05 17:37

    計(jì)算機(jī)視覺的十大算法

    視覺技術(shù)的發(fā)展起到了重要的推動作用。、圖像分割算法圖像分割算法是計(jì)算機(jī)視覺領(lǐng)域的基礎(chǔ)算法之,它的主要任務(wù)是將圖像分割成不同的區(qū)域或?qū)ο蟆?/div>
    的頭像 發(fā)表于 02-19 13:26 ?1235次閱讀
    <b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>的十大算法
    RM新时代网站-首页