在我們的日常生活中隨處都有計(jì)算機(jī)視覺(jué)技術(shù),手機(jī)、游戲機(jī)可以識(shí)別您的手勢(shì),相機(jī)可以自動(dòng)將焦點(diǎn)放在人身上等等。計(jì)算機(jī)視覺(jué)正在影響我們生活的許多領(lǐng)域。
事實(shí)上,計(jì)算機(jī)視覺(jué)在商業(yè)和國(guó)防使用方面有悠久的歷史:如制造中的質(zhì)量檢測(cè),環(huán)境管理的遙感或在戰(zhàn)場(chǎng)上收集智能的高分辨率相機(jī)。這些傳感器中的一些是靜止的,而其它傳感器連接到諸如衛(wèi)星,無(wú)人機(jī)和車(chē)輛等在移動(dòng)物體上。
在過(guò)去,許多計(jì)算機(jī)視覺(jué)應(yīng)用程序僅限于某些封閉平臺(tái)。當(dāng)與IP連接技術(shù)相結(jié)合時(shí),他們創(chuàng)建了一組新的應(yīng)用程序計(jì)算機(jī)視覺(jué),加上IP連接,高級(jí)數(shù)據(jù)分析和人工智能,將成為彼此的催化劑,從而在物聯(lián)網(wǎng)(IoT)創(chuàng)新和應(yīng)用方面帶來(lái)革命性的飛躍。
計(jì)算機(jī)視覺(jué)的多領(lǐng)域的進(jìn)步
視覺(jué)環(huán)境設(shè)計(jì)
視覺(jué)或視力是五種人類感覺(jué)中最發(fā)達(dá)的。我們每天都用它來(lái)識(shí)別我們的朋友,在我們的路上發(fā)現(xiàn)障礙,完成任務(wù)和學(xué)習(xí)新事物。我們通過(guò)我們的視覺(jué)來(lái)識(shí)別我們周?chē)沫h(huán)境。有路牌和信號(hào)燈幫助我們從一個(gè)地方到另一個(gè)地方。通過(guò)識(shí)別環(huán)境標(biāo)識(shí)找到我們所要到達(dá)的地方。鑒于視覺(jué)的重要性,將其擴(kuò)展到計(jì)算機(jī)和自動(dòng)化系統(tǒng),實(shí)現(xiàn)了視覺(jué)應(yīng)用大飛躍。
計(jì)算機(jī)視覺(jué)
計(jì)算機(jī)視覺(jué)從捕獲和存儲(chǔ)圖像或一組圖像的技術(shù)開(kāi)始,然后將這些圖像轉(zhuǎn)換成可以進(jìn)一步執(zhí)行的信息。它由多種技術(shù)組合組成。計(jì)算機(jī)視覺(jué)工程是一個(gè)跨學(xué)科領(lǐng)域,需要在許多這些技術(shù)中跨職能和系統(tǒng)專長(zhǎng)。
由多個(gè)領(lǐng)域的進(jìn)步驅(qū)動(dòng)的計(jì)算機(jī)視覺(jué)
例如,Microsoft Kinect使用3D計(jì)算機(jī)圖形算法來(lái)實(shí)現(xiàn)計(jì)算機(jī)視覺(jué)來(lái)分析和理解三維場(chǎng)景。它允許游戲開(kāi)發(fā)人員將實(shí)時(shí)全身運(yùn)動(dòng)捕捉與人造3D環(huán)境進(jìn)行合并。除了游戲,這在機(jī)器人,虛擬現(xiàn)實(shí)(VR)和增強(qiáng)現(xiàn)實(shí)(AR)應(yīng)用等領(lǐng)域開(kāi)辟了新的可能性。
傳感器技術(shù)的進(jìn)步也在傳統(tǒng)攝像機(jī)傳感器以外的許多層面迅速發(fā)展。 最近的一些例子包括:
? 紅外傳感器和激光器結(jié)合起來(lái)感測(cè)深度和距離,這是自駕車(chē)和3D地圖應(yīng)用的關(guān)鍵推動(dòng)因素之一
? 非侵入式傳感器,可跟蹤醫(yī)療患者的生命體征,無(wú)需身體接觸
? 高頻攝像機(jī)可以捕捉人眼不能察覺(jué)的微妙動(dòng)作,以幫助運(yùn)動(dòng)員分析其步態(tài)
? 超低功耗和低成本的視覺(jué)傳感器,可長(zhǎng)期部署在任何地方
計(jì)算機(jī)視覺(jué)獲得智能
早期應(yīng)用
監(jiān)控行業(yè)是圖像處理技術(shù)和視頻分析的早期采用者之一。視頻分析是計(jì)算機(jī)視覺(jué)的一個(gè)特殊用例,重點(diǎn)是從小時(shí)的視頻中找到模式。在現(xiàn)實(shí)情況下自動(dòng)檢測(cè)和識(shí)別預(yù)定義模式的能力代表了數(shù)百種用例的巨大市場(chǎng)機(jī)會(huì)。
第一個(gè)視頻分析工具使用手工算法來(lái)識(shí)別圖像和視頻中的特定功能。它們?cè)趯?shí)驗(yàn)室設(shè)置和模擬環(huán)境中都是準(zhǔn)確的。然而,當(dāng)輸入數(shù)據(jù)(如照明條件和攝像機(jī)視圖)偏離設(shè)計(jì)假設(shè)時(shí),性能迅速下降。
研究人員和工程師花費(fèi)了多年的開(kāi)發(fā)和調(diào)優(yōu)算法,或者用新的方法來(lái)處理不同的條件。然而,使用這些算法的相機(jī)或錄像機(jī)仍然不夠穩(wěn)健。盡管多年來(lái)取得了一些進(jìn)步,但現(xiàn)實(shí)世界的糟糕表現(xiàn)限制了技術(shù)的有用性和應(yīng)用。
近年來(lái),深度學(xué)習(xí)算法的出現(xiàn)激發(fā)了計(jì)算機(jī)視覺(jué)。深入學(xué)習(xí)使用人造神經(jīng)網(wǎng)絡(luò)(ANN)算法,模擬人腦神經(jīng)元。
從2010年初開(kāi)始,由圖形處理單元(GPU)加速的計(jì)算機(jī)性能已經(jīng)越來(lái)越強(qiáng)大,足以使研究人員實(shí)現(xiàn)復(fù)雜ANN的功能。此外,部分由視頻站點(diǎn)和普遍的IoT設(shè)備驅(qū)動(dòng),研究人員擁有大量不同的視頻和圖像數(shù)據(jù)庫(kù)來(lái)訓(xùn)練其神經(jīng)網(wǎng)絡(luò)。
在2012年,稱為卷積神經(jīng)網(wǎng)絡(luò)(CNN)的深層神經(jīng)網(wǎng)絡(luò)(DNN)的版本顯示了精確度的巨大飛躍。這一發(fā)展推動(dòng)了計(jì)算機(jī)視覺(jué)工程領(lǐng)域的興趣和興奮?,F(xiàn)在,在需要圖像分類和面部識(shí)別的應(yīng)用中,深度學(xué)習(xí)算法甚至超過(guò)了人類對(duì)應(yīng)物。更重要的是,就像人類一樣,這些算法具有學(xué)習(xí)和適應(yīng)不同條件的能力。
計(jì)算機(jī)視覺(jué)應(yīng)用案例:
?監(jiān)測(cè)作物健康的農(nóng)業(yè)無(wú)人機(jī)
?交通基礎(chǔ)設(shè)施管理
?無(wú)人機(jī)無(wú)人機(jī)檢查
?下一代家庭安全攝像機(jī)
?無(wú)人機(jī)收集圖像的植被指數(shù)
這些只是計(jì)算機(jī)視覺(jué)如何大大提高許多領(lǐng)域的生產(chǎn)力的一些小例子。我們正在進(jìn)入物聯(lián)網(wǎng)進(jìn)化的下一個(gè)階段。在第一階段,我們專注于連接設(shè)備,聚合數(shù)據(jù)和建立大型數(shù)據(jù)平臺(tái)。在第二階段,重點(diǎn)將轉(zhuǎn)移到通過(guò)計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)等技術(shù)使“事物”更加智能,從而產(chǎn)生更多可操作的數(shù)據(jù)。
計(jì)算機(jī)視覺(jué)即將迎來(lái)爆發(fā)式增長(zhǎng),我們將探索新的框架,最佳實(shí)踐和設(shè)計(jì)方法,以克服其在實(shí)際應(yīng)用中會(huì)遇到的一挑戰(zhàn)。
-
物聯(lián)網(wǎng)
+關(guān)注
關(guān)注
2909文章
44557瀏覽量
372768 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8882瀏覽量
137396
原文標(biāo)題:行業(yè)|智能物聯(lián)網(wǎng)環(huán)境中無(wú)處不在的計(jì)算機(jī)視覺(jué)技術(shù)
文章出處:【微信號(hào):THundersoft,微信公眾號(hào):ThunderSoft中科創(chuàng)達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論