RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

帶你揭開機(jī)器視覺和深度學(xué)習(xí)的神秘面紗

新機(jī)器視覺 ? 來源:新機(jī)器視覺 ? 作者:新機(jī)器視覺 ? 2020-10-31 11:03 ? 次閱讀

在很多人眼里,深度學(xué)習(xí)是一個(gè)非常神奇的技術(shù),是人工智能的未來,是機(jī)器學(xué)習(xí)的圣杯。今天致瑞圖像帶您一起揭開他神秘的面紗,了解什么才是深度學(xué)習(xí)。

當(dāng)我們在網(wǎng)絡(luò)上搜索“深度學(xué)習(xí)”的時(shí)候往往還能搜到“人工智能”以及“機(jī)器學(xué)習(xí)”這兩個(gè)關(guān)鍵詞。有很多人甚至認(rèn)為深度學(xué)習(xí)就是人工智能,其實(shí)這些概念之間還是有一些區(qū)別的。因此,在介紹它的工作原理之前,為了讓大家更好的了解深度學(xué)習(xí),我們先來介紹一下這幾個(gè)概念之間的區(qū)別和聯(lián)系。

人工智能到目前為止還只是一個(gè)概念。它是由麻省理工學(xué)院的約翰·麥卡錫于1956年在達(dá)特矛斯會(huì)議上提出的。在會(huì)上人們把人工智能定義為一門可以讓機(jī)器的行為看起來像人一樣智能的技術(shù),但是至今為止我們還沒能實(shí)現(xiàn)這個(gè)夢想。伴隨著隨著計(jì)算機(jī)技術(shù)的發(fā)展以及學(xué)者們不斷的探索,雖然我們目前無法實(shí)現(xiàn)理想中的人工智能,但已經(jīng)找到了一些實(shí)現(xiàn)它的途徑,那就是機(jī)器學(xué)習(xí)。機(jī)器學(xué)習(xí)不同于我們之前提到的理想中的人工智能。

它可以使機(jī)器具有一定的決策能力。它是一種對已知數(shù)據(jù)進(jìn)行學(xué)習(xí)和分類的分類器。有人認(rèn)為這并不是真正的智能,于是人們把理想中的人工智能稱為強(qiáng)人工智能,而相對的把機(jī)器學(xué)習(xí)稱為弱人工智能。我們現(xiàn)在耳熟能詳?shù)纳疃葘W(xué)習(xí)則是一種實(shí)現(xiàn)機(jī)器學(xué)習(xí)的算法。所以從算法的角度上來說深度學(xué)習(xí)只是一個(gè)分類器而已。

深度學(xué)習(xí)的核心算法是CNN神經(jīng)網(wǎng)絡(luò),即卷積神經(jīng)網(wǎng)絡(luò)。這個(gè)網(wǎng)絡(luò)早在1989年就已經(jīng)問世了,最初人們用它解決手寫字符的識(shí)別問題,但是受限于當(dāng)時(shí)計(jì)算機(jī)的硬件水平,其處理速度較慢,并沒有推廣到其他應(yīng)用領(lǐng)域。1999年gpu的問世為卷積神經(jīng)網(wǎng)絡(luò)重回歷史舞臺(tái)提供了良好的條件。借助gpu高效的處理能力,卷積神經(jīng)網(wǎng)絡(luò)算法開始走向應(yīng)用。它優(yōu)秀的分類能力逐漸被各個(gè)應(yīng)用領(lǐng)域所認(rèn)可。而當(dāng)Alpha Go戰(zhàn)勝了圍棋冠軍李世石以后,人們對深度學(xué)習(xí)技術(shù)的期望更是達(dá)到了頂峰。但是我相信,很快人們就會(huì)發(fā)現(xiàn)深度學(xué)習(xí)只是我們目前掌握的一種新的非線性分類器。它和其他分類器一樣都需要通過訓(xùn)練才能夠?qū)崿F(xiàn)分類的功能。

比如通過水果圖像的訓(xùn)練,它就可以幫助我們判斷圖像中水果的種類。 作為一個(gè)機(jī)器學(xué)習(xí)的分類器,深度學(xué)習(xí)在很多特征模糊的分類領(lǐng)域均有不錯(cuò)的表現(xiàn),比如在自動(dòng)駕駛和照片分類等應(yīng)用領(lǐng)域。相比于其他的分類器,深度學(xué)習(xí)不僅可以對圖像的特征進(jìn)行分類,還可以通過訓(xùn)練對圖像中的特征進(jìn)行學(xué)習(xí)。這種特性對于一些特征不易描述的圖像分類任務(wù)是大有裨益的。 是什么給了深度學(xué)習(xí)如此大的神通呢?這就要從它所特有的卷積神經(jīng)網(wǎng)絡(luò)說起了。

卷積是一種積分變換的數(shù)學(xué)方法,在圖像處理中應(yīng)用廣泛。很多我們常用的圖像濾波器都是通過卷積實(shí)現(xiàn)的。比如使用3x3所有元素全為1的卷積核對圖像進(jìn)行運(yùn)算后可以去除圖像噪聲,突顯圖像整體特征。又比如使用高斯核對圖像進(jìn)行運(yùn)算可以在保留邊緣的情況下對圖像噪聲進(jìn)行抑制。此外許多我們熟知的邊緣提取算法也是由特定卷積核實(shí)現(xiàn)的,如canny,sobel,Laplace等。由此我們不難看出,不同的卷積核可以幫我們強(qiáng)化圖像中不同的特征。但是如何選擇正確的卷積核卻是一件非常困難的事情,需要擁有豐富圖像處理經(jīng)驗(yàn)的程序員才能辦到。而深度學(xué)習(xí)最大優(yōu)勢就在于可通過權(quán)值訓(xùn)練的方式對卷積核進(jìn)行訓(xùn)練。CNN神經(jīng)網(wǎng)絡(luò)

上圖為一個(gè)卷積神經(jīng)網(wǎng)絡(luò)(CNN)的結(jié)構(gòu)圖。輸入圖像經(jīng)過卷積、池化,再卷積再池化的過程,最后將所有圖像數(shù)據(jù)轉(zhuǎn)化為特征向量并輸入到全連接層獲得最終的分類結(jié)果。 一個(gè)卷積神經(jīng)網(wǎng)絡(luò)可以擁有多個(gè)卷積層,不同的卷積層可以設(shè)置不同的卷積核尺寸和數(shù)目。通過卷積,我們可以生成一組特征圖像供后續(xù)算法使用。與圖像濾波處理不同的是,卷積核中的每一個(gè)元素并非人為指定,而是通過計(jì)算獲得。在這里我們將卷積核中的每個(gè)元素作為網(wǎng)絡(luò)的權(quán)值,并通過訓(xùn)練逐步修改它們。

理論上來說,我們可以把圖像上的每個(gè)像素都作為一個(gè)特征值直接輸入到全連接層中,但是,那樣會(huì)導(dǎo)致神經(jīng)網(wǎng)絡(luò)太過復(fù)雜。于是我們采用卷積層這種共享權(quán)值的方式簡化我們的網(wǎng)絡(luò)。我們所說的權(quán)值共享,并不是指同一個(gè)卷積核中所有權(quán)值都相同,而是說在對整張圖像進(jìn)行卷積的過程中卷積核是不變的,圖像中所有像素都享有相同卷積核權(quán)值。通過權(quán)值共享,可以降低網(wǎng)絡(luò)的訓(xùn)練負(fù)擔(dān),縮短分類時(shí)間,使網(wǎng)絡(luò)更加實(shí)用。

一般,在卷積層的后面都會(huì)緊跟著一個(gè)池化層。在池化層中,特征圖像會(huì)被降采樣。降采樣的方法也有很多,比如選取指定范圍內(nèi)數(shù)值最大的特征或者使用該范圍所有特征的平均值作為新特征圖的特征值。

池化層可以幫助我們減少后續(xù)特征圖像的運(yùn)算量。此外,采樣處理相當(dāng)于變相縮小圖像,這也使得在后續(xù)的卷積層中對圖像概況訓(xùn)練成為可能。例如,在較淺的網(wǎng)絡(luò)中我們可以訓(xùn)練出類似sobel的檢測指定邊緣方向的卷積核,而在較深層則能夠訓(xùn)練出凸顯折線或者其他形狀的卷積核。

在經(jīng)過一系列的卷積層和池化層后,特征數(shù)據(jù)會(huì)被送入全連接層進(jìn)行分類。全連接層是一種被稱為多層感知器(MLP)的非線性分類器。它具有很好的非線性分類能力。

拋開深度學(xué)習(xí)技術(shù)不談,這種分類器也可以單獨(dú)使用,只不過輸入的特征需要人為提取,而不像卷積神經(jīng)網(wǎng)絡(luò)中由前面的網(wǎng)絡(luò)計(jì)算獲得。通過全連接層的分類,我們最終可以獲得樣本被分為所有類別的概率,統(tǒng)計(jì)這些概率,我們就可以獲得最終的分類結(jié)果。

通過上文的介紹,相信大家對卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)已經(jīng)有了一定的了解。從網(wǎng)絡(luò)的結(jié)構(gòu)上我們不難看出,卷積神經(jīng)網(wǎng)絡(luò)非常適合進(jìn)行模糊特征的分類,而合理的網(wǎng)絡(luò)結(jié)構(gòu)以及合適的參數(shù)是網(wǎng)絡(luò)能否成功分類的關(guān)鍵。

如果你想自己搭建網(wǎng)絡(luò),就要了解網(wǎng)絡(luò)中各層的用途以及相互作用關(guān)系,這需要一定的數(shù)學(xué)功底。當(dāng)然從應(yīng)用角度上來講,我們可以直接使用別人搭建好的網(wǎng)絡(luò)或者算法庫,已縮短我們的研發(fā)周期。

原文標(biāo)題:這是一個(gè)機(jī)器視覺和深度學(xué)習(xí)縱橫的時(shí)代

文章出處:【微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器視覺
    +關(guān)注

    關(guān)注

    161

    文章

    4369

    瀏覽量

    120278
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47183

    瀏覽量

    238241
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8406

    瀏覽量

    132558

原文標(biāo)題:這是一個(gè)機(jī)器視覺和深度學(xué)習(xí)縱橫的時(shí)代

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    揭開觸控技術(shù)的神秘面紗

    點(diǎn)點(diǎn)點(diǎn)、滑滑滑!每天我們這些低頭族都在機(jī)械的刷屏微信,看來觸摸真的改變了人類的生活方式。然而你就不好奇為什么你在玻璃板上動(dòng)動(dòng)手指頭,機(jī)器就知道你要做什么嗎?好吧,我來為你揭秘觸控技術(shù)。 從手機(jī)功能
    的頭像 發(fā)表于 11-29 09:45 ?396次閱讀
    <b class='flag-5'>揭開</b>觸控技術(shù)的<b class='flag-5'>神秘</b><b class='flag-5'>面紗</b>

    解讀版|Air780E軟件中C語言內(nèi)存數(shù)組的神秘面紗!

    今天我們來揭開Air780E 軟件中 C 語言內(nèi)存數(shù)組的神秘面紗,希望有所收獲。
    的頭像 發(fā)表于 11-17 10:00 ?227次閱讀
    解讀版|Air780E軟件中C語言內(nèi)存數(shù)組的<b class='flag-5'>神秘</b><b class='flag-5'>面紗</b>!

    AI干貨補(bǔ)給站 | 深度學(xué)習(xí)機(jī)器視覺的融合探索

    ,幫助從業(yè)者積累行業(yè)知識(shí),推動(dòng)工業(yè)視覺應(yīng)用的快速落地。本期亮點(diǎn)預(yù)告本期將以“深度學(xué)習(xí)機(jī)器視覺的融合探索”為主題,通過講解
    的頭像 發(fā)表于 10-29 08:04 ?220次閱讀
    AI干貨補(bǔ)給站 | <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>與<b class='flag-5'>機(jī)器</b><b class='flag-5'>視覺</b>的融合探索

    用智能DAC揭開醫(yī)療報(bào)警設(shè)計(jì)的神秘面紗

    電子發(fā)燒友網(wǎng)站提供《用智能DAC揭開醫(yī)療報(bào)警設(shè)計(jì)的神秘面紗.pdf》資料免費(fèi)下載
    發(fā)表于 09-14 10:50 ?0次下載
    用智能DAC<b class='flag-5'>揭開</b>醫(yī)療報(bào)警設(shè)計(jì)的<b class='flag-5'>神秘</b><b class='flag-5'>面紗</b>

    北斗衛(wèi)星時(shí)鐘——揭開“授時(shí)”的神秘面紗

    ,這些時(shí)間信息又是從哪里來的呢?為什么我們可以隨時(shí)隨地都能獲取準(zhǔn)確的時(shí)間信息?這得益于高精度的 授時(shí)服務(wù) ,今天我們就來揭開“授時(shí)”的神秘面紗。 ? ? ?大家都知道我國的北斗導(dǎo)航衛(wèi)星,是用于定位導(dǎo)航的。那么北斗是怎么進(jìn)行定位導(dǎo)
    的頭像 發(fā)表于 07-25 16:21 ?405次閱讀
    北斗衛(wèi)星時(shí)鐘——<b class='flag-5'>揭開</b>“授時(shí)”的<b class='flag-5'>神秘</b><b class='flag-5'>面紗</b>

    深度學(xué)習(xí)在工業(yè)機(jī)器視覺檢測中的應(yīng)用

    隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,其在工業(yè)機(jī)器視覺檢測中的應(yīng)用日益廣泛,并展現(xiàn)出巨大的潛力。工業(yè)機(jī)器視覺
    的頭像 發(fā)表于 07-08 10:40 ?1042次閱讀

    深度學(xué)習(xí)視覺檢測中的應(yīng)用

    深度學(xué)習(xí)機(jī)器學(xué)習(xí)領(lǐng)域中的一個(gè)重要分支,其核心在于通過構(gòu)建具有多層次的神經(jīng)網(wǎng)絡(luò)模型,使計(jì)算機(jī)能夠從大量數(shù)據(jù)中自動(dòng)學(xué)習(xí)并提取特征,進(jìn)而實(shí)現(xiàn)對復(fù)
    的頭像 發(fā)表于 07-08 10:27 ?699次閱讀

    xAI公司將在八月揭開其新Grok-2大語言模型的神秘面紗

    在科技界的浩瀚星空中,埃隆·馬斯克的每一次發(fā)聲都如同璀璨的新星,瞬間照亮前行的道路。近日,這位科技巨擘在推特上的一則簡短宣告,再次將全球的目光聚焦于人工智能的前沿陣地——他的初創(chuàng)公司xAI即將在八月揭開其最新力作Grok-2大語言模型的神秘
    的頭像 發(fā)表于 07-02 11:38 ?487次閱讀

    深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對比

    在人工智能的浪潮中,機(jī)器學(xué)習(xí)深度學(xué)習(xí)無疑是兩大核心驅(qū)動(dòng)力。它們各自以其獨(dú)特的方式推動(dòng)著技術(shù)的進(jìn)步,為眾多領(lǐng)域帶來了革命性的變化。然而,盡管它們都屬于
    的頭像 發(fā)表于 07-01 11:40 ?1323次閱讀

    深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為其中的核心技術(shù)之一,已經(jīng)在計(jì)算機(jī)視覺領(lǐng)域取得了顯著的成果。計(jì)算機(jī)視覺,作為計(jì)算機(jī)科學(xué)的一個(gè)重要分支,旨在讓計(jì)算機(jī)能夠像人類一樣理解和解析圖像和視
    的頭像 發(fā)表于 07-01 11:38 ?776次閱讀

    揭開Pluto XZU20的神秘面紗—探尋未來緊湊而強(qiáng)大的FPGA解決方案

    創(chuàng)新成果具有挽救生命、改變生活和創(chuàng)造夢想的能力。現(xiàn)在讓我們一起緊隨Pluto產(chǎn)品發(fā)布會(huì)的步伐,揭開PlutoXZU20的神秘面紗,與我們一起探尋未來緊湊而強(qiáng)大的FP
    的頭像 發(fā)表于 06-21 08:09 ?365次閱讀
    <b class='flag-5'>揭開</b>Pluto XZU20的<b class='flag-5'>神秘</b><b class='flag-5'>面紗</b>—探尋未來緊湊而強(qiáng)大的FPGA解決方案

    揭開快充芯片的神秘面紗

    UFP芯片是一種用于USB快充技術(shù)的關(guān)鍵元件,它在移動(dòng)設(shè)備和充電器之間進(jìn)行通信和協(xié)調(diào),以實(shí)現(xiàn)高效、安全、快速的充電過程。下面我們將揭開快充芯片的神秘面紗,深入探討UFP快充芯片的工作原理和功能。
    的頭像 發(fā)表于 04-15 12:51 ?613次閱讀

    Vision Board/首款A(yù)RM Cortex-M85開發(fā)板價(jià)格大公開

    第一輪24小時(shí)限時(shí)盲購,機(jī)器視覺Vision Board獲得了超預(yù)期的支持,我們由衷感謝所有開發(fā)者的熱情參與。機(jī)器視覺Vision Board 即將開啟第二輪預(yù)售,而這一次我們將
    的頭像 發(fā)表于 02-22 14:13 ?1243次閱讀
    Vision Board/首款A(yù)RM Cortex-M85開發(fā)板價(jià)格大公開

    什么是FPGA?帶你初步揭開它的面紗

    計(jì)算密集型任務(wù),如矩陣運(yùn)算、圖像處理、機(jī)器學(xué)習(xí)等。與CPU相比,F(xiàn)PGA在這些任務(wù)上具有更高的性能和更低的延遲。 此外,F(xiàn)PGA在通信密集型任務(wù)中也具有顯著優(yōu)勢。由于FPGA上的收發(fā)器可以直接
    發(fā)表于 02-21 16:10

    基于機(jī)器視覺深度學(xué)習(xí)的焊接質(zhì)量檢測系統(tǒng)

    基于機(jī)器視覺深度學(xué)習(xí)的焊接質(zhì)量檢測系統(tǒng)是一種創(chuàng)新性的技術(shù)解決方案,它結(jié)合了先進(jìn)的計(jì)算機(jī)視覺深度
    的頭像 發(fā)表于 01-18 17:50 ?794次閱讀
    RM新时代网站-首页