如今科技發(fā)展日新月異,諸如機(jī)器人、AR/VR等前沿科技產(chǎn)品已走入了大眾生活當(dāng)中。但是想在這些領(lǐng)域讓用戶有更好的體驗(yàn),就需要很多底層技術(shù)的支持,SLAM就是其中之一。如果說(shuō)機(jī)器人離開(kāi)了SLAM,就相當(dāng)于人類失去了雙眼一樣。
一、什么是視覺(jué)SLAM?
SLAM的英文全稱是Simultaneous Localization and Mapping,中文稱作「即時(shí)定位與地圖創(chuàng)建」,而視覺(jué)SLAM就是用攝像頭來(lái)完成環(huán)境的感知工作。
舉個(gè)例子,當(dāng)你第一天去上大學(xué)的時(shí)候,為了迅速熟悉校園環(huán)境并且找到宿舍時(shí),你會(huì)做以下的事情:
1.用眼睛一直觀察周圍的教學(xué)樓、籃球場(chǎng)、噴泉等標(biāo)志性建筑物,并且記住它們的特征。(特征提?。?/p>
2.根據(jù)你剛才眼睛觀察到的信息,在腦海里把這些有特征的標(biāo)志性建筑物建立成一個(gè)地圖。(建圖)
3.在繼續(xù)行走時(shí),又看到了一些如咖啡店、健身房等新的標(biāo)志性建筑物,再把它們加到腦海中的地圖里面校對(duì)一下。(狀態(tài)更新)
4.根據(jù)你前一段時(shí)間行走獲得的標(biāo)志性建筑物,確定自己的位置。(路徑規(guī)劃)
5.當(dāng)無(wú)意中走了很長(zhǎng)一段路的時(shí)候,和腦海中的以往標(biāo)志性建筑物進(jìn)行匹配,看一看是否走回了原路。(回環(huán)檢測(cè))
其實(shí)上面你做的這些事情,就是視覺(jué)SLAM里面的幾個(gè)部分。
二、視覺(jué)SLAM的分類
視覺(jué)SLAM研究主要分為三大類:單目、雙目(或多目)、RGBD。
單目?jī)H用一支攝像頭就能完成SLAM。最大的優(yōu)點(diǎn)是傳感器簡(jiǎn)單且成本低廉,但同時(shí)也有個(gè)大問(wèn)題,就是不能確切的得到深度,存在尺寸不確定的現(xiàn)象,比如丟失深度信息的相片中,我們能見(jiàn)到“手捏太陽(yáng)”“借位拍照”這樣的現(xiàn)象。
一方面是由于絕對(duì)深度未知,單目SLAM不能得到機(jī)器人運(yùn)動(dòng)軌跡及地圖的真實(shí)大小,如果把軌跡和房間同時(shí)放大兩倍,單目看到的像是一樣的,因此,單目SLAM只能估計(jì)一個(gè)相對(duì)深度。另一方面,單目相機(jī)無(wú)法依靠一張圖像獲得圖像中物體離自己的相對(duì)距離。為了估計(jì)這個(gè)相對(duì)深度,單目SLAM要靠運(yùn)動(dòng)中的三角測(cè)量,來(lái)求解相機(jī)運(yùn)動(dòng)并估計(jì)像素的空間位置。即是說(shuō),它的軌跡和地圖,只有在相機(jī)運(yùn)動(dòng)之后才能收斂,如果相機(jī)不進(jìn)行運(yùn)動(dòng)時(shí),就無(wú)法得知像素的位置。同時(shí),相機(jī)運(yùn)動(dòng)還不能是純粹的旋轉(zhuǎn),這就給單目SLAM的應(yīng)用帶來(lái)了一些麻煩。
雙目(多目)顧名思義是由兩個(gè)或多個(gè)攝像頭來(lái)完成SLAM,其普遍為雙目視覺(jué)方案。雙目視覺(jué)既可以在運(yùn)動(dòng)時(shí)估計(jì)深度,亦可在靜止時(shí)估計(jì),雙目視覺(jué)融合兩個(gè)攝像頭獲得的圖像并觀察它們之間的差別,獲得明顯的深度感,建立特征間的對(duì)應(yīng)關(guān)系,將同一空間物理點(diǎn)在不同圖像中的映像點(diǎn)對(duì)應(yīng)起來(lái)。并且可以精準(zhǔn)感知周圍的物體和自身移動(dòng)的軌跡,從而對(duì)周圍環(huán)境形成三維立體的認(rèn)識(shí),解決了上面提到的問(wèn)題。不過(guò)通過(guò)雙目圖像計(jì)算像素距離,計(jì)算量大,而且在特征少的白墻或暗光環(huán)境易丟失目標(biāo)。
目前雙目的應(yīng)用程度明顯較高,針對(duì)雙目方案拓展應(yīng)用場(chǎng)景上,大多融和了IMU或者IR等傳感器,比如國(guó)內(nèi)立體視覺(jué)方案公司indemind推出的雙目視覺(jué)慣性模組,采用了“雙目攝像頭+IMU”多傳感器融合架構(gòu)與微秒級(jí)時(shí)間同步機(jī)制,可提供精準(zhǔn)穩(wěn)定數(shù)據(jù)源;并且內(nèi)置了自研高精度Vi-SLAM算法,以滿足SLAM研究、智能機(jī)器人、無(wú)人機(jī)避障、室內(nèi)外導(dǎo)航定位等使用需求。
RGBD相機(jī)是2010年左右開(kāi)始興起的一種相機(jī),它最大的特點(diǎn)是可以通過(guò)紅外結(jié)構(gòu)光或Time-of-Flight原理,直接測(cè)出圖像中各像素離相機(jī)的距離。因此,它比傳統(tǒng)相機(jī)能夠提供更豐富的信息,也不必像單目或雙目那樣費(fèi)時(shí)費(fèi)力地計(jì)算深度。
目前常用的RGBD相機(jī)有Kinect/Kinect V2等等。不過(guò),現(xiàn)在多數(shù)RGBD相機(jī)還存在測(cè)量范圍窄、噪聲大、視野小、受陽(yáng)光,墻面反光等諸多問(wèn)題。出于量程的限制,主要用于室內(nèi)SLAM。
目前,視覺(jué)SLAM主要被運(yùn)用于無(wú)人機(jī)、無(wú)人駕駛、機(jī)器人、AR、智能家居等領(lǐng)域,單目需要靠運(yùn)動(dòng)估計(jì)深度導(dǎo)致避障效率不高,RGBD存在量程的限制,主要用于室內(nèi)SLAM。因此,目前在視覺(jué)SLAM中,雙目的應(yīng)用程度和落地前景都是最高的。
不管是哪種視覺(jué)SLAM方案,都是作為人工智能的眼睛,獲取地圖數(shù)據(jù),并構(gòu)建地圖,規(guī)避路程中遇到的障礙物,實(shí)現(xiàn)路徑的規(guī)劃。
隨著城市物聯(lián)網(wǎng)和智能系統(tǒng)的完善,視覺(jué)SLAM必是大勢(shì)所趨。雖然目前視覺(jué)SLAM技術(shù)方面還存在著一些問(wèn)題,但這些都會(huì)隨著消費(fèi)刺激和產(chǎn)業(yè)鏈的發(fā)展逐步解決、趨于完善。
lw
-
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238245 -
SLAM
+關(guān)注
關(guān)注
23文章
423瀏覽量
31820 -
無(wú)人駕駛
+關(guān)注
關(guān)注
98文章
4054瀏覽量
120446
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論