RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

科普|視覺(jué)SLAM是什么——三種視覺(jué)SLAM方案

雙目立體視覺(jué) ? 來(lái)源:INDEMIND ? 2020-04-17 09:21 ? 次閱讀

如今科技發(fā)展日新月異,諸如機(jī)器人、AR/VR等前沿科技產(chǎn)品已走入了大眾生活當(dāng)中。但是想在這些領(lǐng)域讓用戶有更好的體驗(yàn),就需要很多底層技術(shù)的支持,SLAM就是其中之一。如果說(shuō)機(jī)器人離開(kāi)了SLAM,就相當(dāng)于人類失去了雙眼一樣。

一、什么是視覺(jué)SLAM?

SLAM的英文全稱是Simultaneous Localization and Mapping,中文稱作「即時(shí)定位與地圖創(chuàng)建」,而視覺(jué)SLAM就是用攝像頭來(lái)完成環(huán)境的感知工作。

舉個(gè)例子,當(dāng)你第一天去上大學(xué)的時(shí)候,為了迅速熟悉校園環(huán)境并且找到宿舍時(shí),你會(huì)做以下的事情:

1.用眼睛一直觀察周圍的教學(xué)樓、籃球場(chǎng)、噴泉等標(biāo)志性建筑物,并且記住它們的特征。(特征提?。?/p>

2.根據(jù)你剛才眼睛觀察到的信息,在腦海里把這些有特征的標(biāo)志性建筑物建立成一個(gè)地圖。(建圖)

3.在繼續(xù)行走時(shí),又看到了一些如咖啡店、健身房等新的標(biāo)志性建筑物,再把它們加到腦海中的地圖里面校對(duì)一下。(狀態(tài)更新)

4.根據(jù)你前一段時(shí)間行走獲得的標(biāo)志性建筑物,確定自己的位置。(路徑規(guī)劃)

5.當(dāng)無(wú)意中走了很長(zhǎng)一段路的時(shí)候,和腦海中的以往標(biāo)志性建筑物進(jìn)行匹配,看一看是否走回了原路。(回環(huán)檢測(cè)

其實(shí)上面你做的這些事情,就是視覺(jué)SLAM里面的幾個(gè)部分。

二、視覺(jué)SLAM的分類

視覺(jué)SLAM研究主要分為三大類:單目、雙目(或多目)、RGBD。

單目?jī)H用一支攝像頭就能完成SLAM。最大的優(yōu)點(diǎn)是傳感器簡(jiǎn)單且成本低廉,但同時(shí)也有個(gè)大問(wèn)題,就是不能確切的得到深度,存在尺寸不確定的現(xiàn)象,比如丟失深度信息的相片中,我們能見(jiàn)到“手捏太陽(yáng)”“借位拍照”這樣的現(xiàn)象。

一方面是由于絕對(duì)深度未知,單目SLAM不能得到機(jī)器人運(yùn)動(dòng)軌跡及地圖的真實(shí)大小,如果把軌跡和房間同時(shí)放大兩倍,單目看到的像是一樣的,因此,單目SLAM只能估計(jì)一個(gè)相對(duì)深度。另一方面,單目相機(jī)無(wú)法依靠一張圖像獲得圖像中物體離自己的相對(duì)距離。為了估計(jì)這個(gè)相對(duì)深度,單目SLAM要靠運(yùn)動(dòng)中的三角測(cè)量,來(lái)求解相機(jī)運(yùn)動(dòng)并估計(jì)像素的空間位置。即是說(shuō),它的軌跡和地圖,只有在相機(jī)運(yùn)動(dòng)之后才能收斂,如果相機(jī)不進(jìn)行運(yùn)動(dòng)時(shí),就無(wú)法得知像素的位置。同時(shí),相機(jī)運(yùn)動(dòng)還不能是純粹的旋轉(zhuǎn),這就給單目SLAM的應(yīng)用帶來(lái)了一些麻煩。

雙目(多目)顧名思義是由兩個(gè)或多個(gè)攝像頭來(lái)完成SLAM,其普遍為雙目視覺(jué)方案。雙目視覺(jué)既可以在運(yùn)動(dòng)時(shí)估計(jì)深度,亦可在靜止時(shí)估計(jì),雙目視覺(jué)融合兩個(gè)攝像頭獲得的圖像并觀察它們之間的差別,獲得明顯的深度感,建立特征間的對(duì)應(yīng)關(guān)系,將同一空間物理點(diǎn)在不同圖像中的映像點(diǎn)對(duì)應(yīng)起來(lái)。并且可以精準(zhǔn)感知周圍的物體和自身移動(dòng)的軌跡,從而對(duì)周圍環(huán)境形成三維立體的認(rèn)識(shí),解決了上面提到的問(wèn)題。不過(guò)通過(guò)雙目圖像計(jì)算像素距離,計(jì)算量大,而且在特征少的白墻或暗光環(huán)境易丟失目標(biāo)。

目前雙目的應(yīng)用程度明顯較高,針對(duì)雙目方案拓展應(yīng)用場(chǎng)景上,大多融和了IMU或者IR等傳感器,比如國(guó)內(nèi)立體視覺(jué)方案公司indemind推出的雙目視覺(jué)慣性模組,采用了“雙目攝像頭+IMU”多傳感器融合架構(gòu)與微秒級(jí)時(shí)間同步機(jī)制,可提供精準(zhǔn)穩(wěn)定數(shù)據(jù)源;并且內(nèi)置了自研高精度Vi-SLAM算法,以滿足SLAM研究、智能機(jī)器人、無(wú)人機(jī)避障、室內(nèi)外導(dǎo)航定位等使用需求。

RGBD相機(jī)是2010年左右開(kāi)始興起的一種相機(jī),它最大的特點(diǎn)是可以通過(guò)紅外結(jié)構(gòu)光或Time-of-Flight原理,直接測(cè)出圖像中各像素離相機(jī)的距離。因此,它比傳統(tǒng)相機(jī)能夠提供更豐富的信息,也不必像單目或雙目那樣費(fèi)時(shí)費(fèi)力地計(jì)算深度。

目前常用的RGBD相機(jī)有Kinect/Kinect V2等等。不過(guò),現(xiàn)在多數(shù)RGBD相機(jī)還存在測(cè)量范圍窄、噪聲大、視野小、受陽(yáng)光,墻面反光等諸多問(wèn)題。出于量程的限制,主要用于室內(nèi)SLAM。

目前,視覺(jué)SLAM主要被運(yùn)用于無(wú)人機(jī)、無(wú)人駕駛、機(jī)器人、AR、智能家居等領(lǐng)域,單目需要靠運(yùn)動(dòng)估計(jì)深度導(dǎo)致避障效率不高,RGBD存在量程的限制,主要用于室內(nèi)SLAM。因此,目前在視覺(jué)SLAM中,雙目的應(yīng)用程度和落地前景都是最高的。

不管是哪種視覺(jué)SLAM方案,都是作為人工智能的眼睛,獲取地圖數(shù)據(jù),并構(gòu)建地圖,規(guī)避路程中遇到的障礙物,實(shí)現(xiàn)路徑的規(guī)劃。

隨著城市物聯(lián)網(wǎng)和智能系統(tǒng)的完善,視覺(jué)SLAM必是大勢(shì)所趨。雖然目前視覺(jué)SLAM技術(shù)方面還存在著一些問(wèn)題,但這些都會(huì)隨著消費(fèi)刺激和產(chǎn)業(yè)鏈的發(fā)展逐步解決、趨于完善。
lw

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47183

    瀏覽量

    238245
  • SLAM
    +關(guān)注

    關(guān)注

    23

    文章

    423

    瀏覽量

    31820
  • 無(wú)人駕駛
    +關(guān)注

    關(guān)注

    98

    文章

    4054

    瀏覽量

    120446
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    用于任意排列多相機(jī)的通用視覺(jué)里程計(jì)系統(tǒng)

    如何讓多相機(jī)視覺(jué)SLAM系統(tǒng)更易于部署且對(duì)環(huán)境更具魯棒性?本文提出了一適用于任意排列多相機(jī)的通用視覺(jué)里程計(jì)系統(tǒng)。在KITTI-360和MultiCamData數(shù)據(jù)集上驗(yàn)證了該方法對(duì)于
    的頭像 發(fā)表于 12-13 11:22 ?179次閱讀
    用于任意排列多相機(jī)的通用<b class='flag-5'>視覺(jué)</b>里程計(jì)系統(tǒng)

    利用VLM和MLLMs實(shí)現(xiàn)SLAM語(yǔ)義增強(qiáng)

    語(yǔ)義同步定位與建圖(SLAM)系統(tǒng)在對(duì)鄰近的語(yǔ)義相似物體進(jìn)行建圖時(shí)面臨困境,特別是在復(fù)雜的室內(nèi)環(huán)境中。本文提出了一面向?qū)ο?b class='flag-5'>SLAM的語(yǔ)義增強(qiáng)(SEO-SLAM)的新型
    的頭像 發(fā)表于 12-05 10:00 ?119次閱讀
    利用VLM和MLLMs實(shí)現(xiàn)<b class='flag-5'>SLAM</b>語(yǔ)義增強(qiáng)

    最新圖優(yōu)化框架,全面提升SLAM定位精度

    的類別進(jìn)行分類,如視覺(jué)SLAM、激光SLAM、慣性SLAM等。 解決SLAM問(wèn)題的經(jīng)典方法可以分為基于濾波的方法和基于圖的方法。在19
    的頭像 發(fā)表于 11-12 11:26 ?334次閱讀
    最新圖優(yōu)化框架,全面提升<b class='flag-5'>SLAM</b>定位精度

    MG-SLAM:融合結(jié)構(gòu)化線特征優(yōu)化高斯SLAM算法

    同步定位與地圖構(gòu)建 (SLAM) 是計(jì)算機(jī)視覺(jué)中的一個(gè)基本問(wèn)題,旨在在同時(shí)跟蹤相機(jī)姿勢(shì)的同時(shí)對(duì)環(huán)境進(jìn)行地圖構(gòu)建。基于學(xué)習(xí)的密集 SLAM 方法,尤其是神經(jīng)輻射場(chǎng) (NeRF) 方法,在捕獲密集光度
    的頭像 發(fā)表于 11-11 16:17 ?263次閱讀
    MG-<b class='flag-5'>SLAM</b>:融合結(jié)構(gòu)化線特征優(yōu)化高斯<b class='flag-5'>SLAM</b>算法

    從算法角度看 SLAM(第 2 部分)

    作者: Aswin S Babu 正如我們?cè)赱第 1 部分]中所討論的,SLAM 是指在無(wú)地圖區(qū)域中估計(jì)機(jī)器人車輛的位置,同時(shí)逐步繪制該區(qū)域地圖的過(guò)程。根據(jù)使用的主要技術(shù),SLAM 算法可分為三種
    的頭像 發(fā)表于 10-02 16:39 ?309次閱讀
    從算法角度看 <b class='flag-5'>SLAM</b>(第 2 部分)

    適用于動(dòng)態(tài)環(huán)境的實(shí)時(shí)視覺(jué)SLAM系統(tǒng)

    既能保證效率和精度,又無(wú)需GPU,行業(yè)第一個(gè)達(dá)到此目標(biāo)的視覺(jué)動(dòng)態(tài)SLAM系統(tǒng)。
    的頭像 發(fā)表于 09-30 14:35 ?461次閱讀
    一<b class='flag-5'>種</b>適用于動(dòng)態(tài)環(huán)境的實(shí)時(shí)<b class='flag-5'>視覺(jué)</b><b class='flag-5'>SLAM</b>系統(tǒng)

    深度解析深度學(xué)習(xí)下的語(yǔ)義SLAM

    隨著深度學(xué)習(xí)技術(shù)的興起,計(jì)算機(jī)視覺(jué)的許多傳統(tǒng)領(lǐng)域都取得了突破性進(jìn)展,例如目標(biāo)的檢測(cè)、識(shí)別和分類等領(lǐng)域。近年來(lái),研究人員開(kāi)始在視覺(jué)SLAM算法中引入深度學(xué)習(xí)技術(shù),使得深度學(xué)習(xí)SLAM系統(tǒng)
    發(fā)表于 04-23 17:18 ?1284次閱讀
    深度解析深度學(xué)習(xí)下的語(yǔ)義<b class='flag-5'>SLAM</b>

    工程實(shí)踐中VINS與ORB-SLAM的優(yōu)劣分析

    ORB-SLAM是一基于特征的單目視覺(jué)SLAM系統(tǒng),廣泛用于實(shí)時(shí)維地圖構(gòu)建和機(jī)器人定位。該系統(tǒng)使用ORB特征進(jìn)行高效的
    的頭像 發(fā)表于 04-08 10:17 ?2816次閱讀
    工程實(shí)踐中VINS與ORB-<b class='flag-5'>SLAM</b>的優(yōu)劣分析

    什么是SLAM?SLAM算法涉及的4要素

    SLAM技術(shù)可以應(yīng)用在無(wú)人駕駛汽車、無(wú)人機(jī)、機(jī)器人、虛擬現(xiàn)實(shí)等領(lǐng)域中,為這些領(lǐng)域的發(fā)展提供了支持。SLAM技術(shù)的發(fā)展已經(jīng)逐漸從單純的定位和地圖構(gòu)建轉(zhuǎn)向了基于場(chǎng)景理解的功能。
    發(fā)表于 04-04 11:50 ?2339次閱讀

    什么是SLAM?基于3D高斯輻射場(chǎng)的SLAM優(yōu)勢(shì)分析

    基于NeRF的SLAM算法采用全局地圖和圖像重建損失函數(shù),通過(guò)可微分渲染捕獲稠密的光度信息,具有高保真度。
    的頭像 發(fā)表于 04-01 12:44 ?720次閱讀

    從基本原理到應(yīng)用的SLAM技術(shù)深度解析

    LSD-SLAM 即 Large-Scale Direct SLAM,兼容單目相機(jī)和雙目相機(jī)。LSD-SLAM是一基于光流跟蹤的直接法SLAM
    發(fā)表于 02-26 09:41 ?9187次閱讀
    從基本原理到應(yīng)用的<b class='flag-5'>SLAM</b>技術(shù)深度解析

    基于NeRF/Gaussian的全新SLAM算法

    基于NeRF的SLAM算法采用全局地圖和圖像重建損失函數(shù),通過(guò)可微分渲染捕獲稠密的光度信息,具有高保真度。
    的頭像 發(fā)表于 01-26 10:48 ?649次閱讀
    基于NeRF/Gaussian的全新<b class='flag-5'>SLAM</b>算法

    動(dòng)態(tài)環(huán)境中基于神經(jīng)隱式表示的RGB-D SLAM

    神經(jīng)隱式表示已經(jīng)被探索用于增強(qiáng)視覺(jué)SLAM掩碼算法,特別是在提供高保真的密集地圖方面。
    的頭像 發(fā)表于 01-17 10:39 ?897次閱讀
    動(dòng)態(tài)環(huán)境中基于神經(jīng)隱式表示的RGB-D <b class='flag-5'>SLAM</b>

    視覺(jué)測(cè)量技術(shù)知識(shí)科普

    視覺(jué)測(cè)量技術(shù)按照測(cè)量過(guò)程中是否投射光源,獲取被測(cè)物體維形貌信息的方法可以分為兩大類: 被動(dòng)視覺(jué)測(cè)量和主動(dòng)視覺(jué)測(cè)量。
    的頭像 發(fā)表于 01-03 11:47 ?833次閱讀
    <b class='flag-5'>三</b>維<b class='flag-5'>視覺(jué)</b>測(cè)量技術(shù)知識(shí)<b class='flag-5'>科普</b>
    RM新时代网站-首页