新时代app官方下载最新版,新时代RM|APP官网网址

本文介紹了一種可學(xué)習(xí)的變形假設(shè)采樣器（DeformSampler），用于解決精確PatchMatch多視圖立體（MVS）中嘈雜深度估計(jì)的挑戰(zhàn)性問題。我們觀察到PatchMatch MVS求解器所采用的啟發(fā)式深度假設(shè)采樣模式對以下兩個(gè)方面不敏感：（i）物體表面深度的分段平滑分布，（ii）沿著表面點(diǎn)射線方向的深度預(yù)測概率的隱式多模態(tài)分布。因此，作者開發(fā)了DeformSampler，以學(xué)習(xí)對分布敏感的樣本空間，以便（i）沿著物體表面?zhèn)鞑ヅc場景幾何一致的深度，（ii）擬合逼近實(shí)際深度沿射線方向的點(diǎn)級概率分布的拉普拉斯混合模型。作者將DeformSampler集成到可學(xué)習(xí)的PatchMatch MVS系統(tǒng)中，以提高在挑戰(zhàn)性區(qū)域（如分段不連續(xù)的表面邊界和紋理較弱的區(qū)域）的深度估計(jì)能力。在DTU和Tanks＆Temples數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明，與最先進(jìn)的競爭對手相比，其表現(xiàn)優(yōu)越且具有很好的泛化能力。

讀者理解：

該方法的主要貢獻(xiàn)是提出了一種可學(xué)習(xí)的變形假設(shè)采樣器（DeformSampler），用于解決多視圖立體匹配（PatchMatch MVS）中噪聲深度估計(jì)的挑戰(zhàn)問題。DeformSampler 通過學(xué)習(xí)分布敏感的樣本空間，能夠傳播與場景幾何一致的深度，并擬合逼近實(shí)際深度分布的拉普拉斯混合模型。

實(shí)驗(yàn)結(jié)果表明，該方法在 ETH3D 數(shù)據(jù)集上表現(xiàn)優(yōu)異，甚至超過了其他最新的基于學(xué)習(xí)的 MVS 模型。

具體來說，該方法的創(chuàng)新點(diǎn)包括：

提出了一種可學(xué)習(xí)的變形假設(shè)采樣器（DeformSampler），用于解決多視圖立體匹配（PatchMatch MVS）中噪聲深度估計(jì)的挑戰(zhàn)問題。通過學(xué)習(xí)分布敏感的樣本空間，DeformSampler 能夠傳播與場景幾何一致的深度，并擬合逼近實(shí)際深度分布的拉普拉斯混合模型。

實(shí)驗(yàn)結(jié)果表明，該方法在 ETH3D 數(shù)據(jù)集上表現(xiàn)優(yōu)異，甚至超過了其他最新的基于學(xué)習(xí)的 MVS 模型。

1 引言

這篇論文主要解決了多視圖立體（MVS）中深度估計(jì)的挑戰(zhàn)性問題。傳統(tǒng)方法在低紋理、鏡面和反射區(qū)域內(nèi)的匹配困難，學(xué)習(xí)型方法引入全局語義信息以提高魯棒性，但準(zhǔn)確性與效率之間存在差距。學(xué)習(xí)型方法通常構(gòu)建3D成本體，利用3D CNN進(jìn)行深度回歸。然而，資源有限限制了這些方法的成本體和CNN的3D形式。

為了解決這些限制，研究致力于減少成本體大小和修改正則化技術(shù)。近期出現(xiàn)的一種有前景的解決方案將傳統(tǒng)的PatchMatch MVS轉(zhuǎn)化為端到端框架，但這些方法未充分考慮場景內(nèi)隱含的深度分布，導(dǎo)致深度估計(jì)性能下降。

因此，論文提出了DeformSampler，一種可學(xué)習(xí)的變形假設(shè)采樣器，用于在學(xué)習(xí)型PatchMatch框架中學(xué)習(xí)隱含深度分布，指導(dǎo)可變形的假設(shè)采樣。DeformSampler在傳播和擾動(dòng)階段支持每個(gè)像素進(jìn)行最優(yōu)假設(shè)采樣。通過平面指示器捕捉分段平滑深度分布，以實(shí)現(xiàn)結(jié)構(gòu)感知的深度傳播，并利用概率匹配器對深度預(yù)測概率的多模態(tài)分布進(jìn)行建模，實(shí)現(xiàn)不確定性感知的擾動(dòng)。集成DeformSampler到學(xué)習(xí)型PatchMatch框架中，能在具有挑戰(zhàn)性的分段不連續(xù)表面邊界和紋理較弱區(qū)域獲得優(yōu)秀的深度估計(jì)性能，并展現(xiàn)出在室外和室內(nèi)場景中的強(qiáng)大泛化能力。

2 方法

本文提出了一種全新的學(xué)習(xí)型PatchMatch MVS框架，DS-PMNet，并嵌入了DeformSampler。這個(gè)框架能夠以端到端的方式學(xué)習(xí)隱含深度分布，指導(dǎo)可變形的深度采樣。論文總體框架在圖2中展示，主要包括四個(gè)階段的優(yōu)化：初始化、傳播、評估和擾動(dòng)。其中，傳播階段通過平面指示器Pθ捕捉物體表面的分段平滑深度分布，指導(dǎo)結(jié)構(gòu)感知的假設(shè)傳播；而擾動(dòng)階段則利用概率匹配器Mθ模擬深度預(yù)測概率的多模態(tài)分布，指導(dǎo)不確定性感知的擾動(dòng)。

具體實(shí)現(xiàn)中，DS-PMNet通過特征金字塔Ψ提取了不同尺度的特征，用于深度估計(jì)。在階段I中，隨機(jī)初始化參考圖像的深度圖。在階段II，平面指示器Pθ利用自相似性特征編碼，指導(dǎo)結(jié)構(gòu)感知的假設(shè)傳播，生成可靠的假設(shè)集合。在階段III，概率匹配器Mθ模擬了深度預(yù)測概率的分布，輸出不確定性，指導(dǎo)下一步的擾動(dòng)。階段IV則利用推斷出的混合分布來引導(dǎo)擾動(dòng)，進(jìn)一步優(yōu)化深度估計(jì)。這個(gè)框架能夠提高深度估計(jì)性能，在圖像特征和深度估計(jì)中起到關(guān)鍵作用。

此外，文中提到的平面指示器Pθ由兩部分組成：內(nèi)視圖相關(guān)金字塔和平面流解碼器。內(nèi)視圖相關(guān)金字塔利用卷積運(yùn)算計(jì)算特征之間的相關(guān)性，而平面流解碼器則逐漸推斷出平面流場。概率匹配器Mθ則基于多視圖成本金字塔，預(yù)測深度估計(jì)概率的分布參數(shù)，進(jìn)一步提高深度估計(jì)的準(zhǔn)確性。

最后，論文采用了負(fù)對數(shù)似然損失函數(shù)作為監(jiān)督，用于監(jiān)督深度估計(jì)的擬合混合拉普拉斯分布，進(jìn)一步優(yōu)化模型?？偟膩碚f，DS-PMNet框架通過DeformSampler的引導(dǎo)，能夠提升MVS中的深度估計(jì)性能，對于深度估計(jì)及場景特征提取有著重要的作用。

3 總結(jié)

本文提出了一種可學(xué)習(xí)的DeformSampler，嵌入到PatchMatch MVS框架中，有助于在復(fù)雜場景中實(shí)現(xiàn)準(zhǔn)確的深度估計(jì)。所提出的DeformSampler能夠在傳播和擾動(dòng)過程中，幫助采樣對分布敏感的假設(shè)空間。在多個(gè)具有挑戰(zhàn)性的MVS數(shù)據(jù)集上進(jìn)行了廣泛實(shí)驗(yàn)，結(jié)果顯示DeformSampler能夠有效學(xué)習(xí)物體表面的分段平滑深度分布，可靠地傳播深度，并成功捕捉深度預(yù)測概率的多模態(tài)分布，從而實(shí)現(xiàn)精細(xì)化的假設(shè)采樣。與現(xiàn)有方法的比較也表明，我們的方法在MVS基準(zhǔn)測試上能夠達(dá)到最先進(jìn)的性能水平。

審核編輯：黃飛

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

函數(shù)

函數(shù)

+關(guān)注

關(guān)注
3

文章
4327

瀏覽量
62569
圖像特征

圖像特征

+關(guān)注

關(guān)注
0

文章
13

瀏覽量
7041
采樣器

采樣器

+關(guān)注

關(guān)注
0

文章
34

瀏覽量
2462

原文標(biāo)題：讀者理解：

文章出處：【微信號：3D視覺工坊，微信公眾號：3D視覺工坊】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

濾波器設(shè)計(jì)過程中對射頻有什么挑戰(zhàn)

工作環(huán)境的變化而改變。接著，將會介紹被動(dòng)互調(diào)(PIM)測量的設(shè)置，在滿足濾波器產(chǎn)品要求的過程中，它可能是最具挑戰(zhàn)性的規(guī)范，主要原因包括缺乏精確的模擬工具以及測量不準(zhǔn)確。為清晰說明測試的過程，文中也提供測試

發(fā)表于 06-24 07:21

音頻設(shè)計(jì)：比你所想象的更富挑戰(zhàn)性

音頻設(shè)計(jì)：比你所想象的更富挑戰(zhàn)性 通常會認(rèn)為20 Hz ~20 kHz常規(guī)頻段的音頻設(shè)計(jì)是基本的、不具挑戰(zhàn)性的。但是本篇特別報(bào)道的作者----音頻工程（audio engineering）的專家們對

發(fā)表于 09-16 10:02 ?818次閱讀

當(dāng)前智能機(jī)器人發(fā)展若干挑戰(zhàn)性問題

在本專場中，北京航空航天大學(xué)教授、北京航空航天大學(xué)機(jī)器人研究所名譽(yù)所長、長江學(xué)者特聘教授王田苗教授率先登場，為本專場做了題為“當(dāng)前智能機(jī)器人發(fā)展若干挑戰(zhàn)性問題”的大會報(bào)告。

發(fā)表于 07-09 10:44 ?5453次閱讀

Mipsology Zebra在深度學(xué)習(xí)推斷的應(yīng)用

Zebra 可消除深度學(xué)習(xí)推斷中具有挑戰(zhàn)性的編程及 FPGA 任務(wù)。Zebra 可輕松部署和適應(yīng)廣泛的神經(jīng)網(wǎng)絡(luò)及框架。

發(fā)表于 07-21 10:59 ?962次閱讀

Mipsology Zebra在<b class='flag-5'>深度</b>學(xué)習(xí)推斷的應(yīng)用

便攜式醫(yī)療系統(tǒng)中無線監(jiān)控的挑戰(zhàn)性要求

本文探討了便攜式醫(yī)療系統(tǒng)中無線監(jiān)控的挑戰(zhàn)性要求。在設(shè)計(jì)高可靠性醫(yī)療設(shè)備時(shí)需要權(quán)衡各種工程環(huán)節(jié)，從超低功耗收發(fā)器和各種協(xié)議，到高效電源管理和傳感器接口。

發(fā)表于 09-28 17:01 ?2271次閱讀

便攜式醫(yī)療系統(tǒng)<b class='flag-5'>中</b>無線監(jiān)控的<b class='flag-5'>挑戰(zhàn)性</b>要求

Facebook為挑戰(zhàn)性環(huán)境優(yōu)化6DoF控制器追蹤

Facebook進(jìn)一步介紹關(guān)于最近用以優(yōu)化控制器追蹤性能的版本更新，尤其是針對具有挑戰(zhàn)性的追蹤環(huán)境，如包含圣誕樹或假日裝飾燈具的空間。

發(fā)表于 07-25 10:27 ?712次閱讀

基于多孔卷積神經(jīng)網(wǎng)絡(luò)的圖像深度估計(jì)模型

針對在傳統(tǒng)機(jī)器學(xué)習(xí)方法下單幅圖像深度估計(jì)效果差、深度值獲取不準(zhǔn)確的問題，提出了一種基于多孔卷積神經(jīng)網(wǎng)絡(luò)（ACNN）的深度估計(jì)模型。首先，利用

發(fā)表于 09-29 16:20 ?5次下載

基于多孔卷積神經(jīng)網(wǎng)絡(luò)的圖像<b class='flag-5'>深度</b><b class='flag-5'>估計(jì)</b>模型

針對系統(tǒng)提供商最具挑戰(zhàn)性需求的自定義模塊

針對系統(tǒng)提供商最具挑戰(zhàn)性需求的自定義模塊

發(fā)表于 04-26 16:15 ?4次下載

針對系統(tǒng)提供商最具<b class='flag-5'>挑戰(zhàn)性</b>需求的自定義模塊

深度神經(jīng)網(wǎng)絡(luò)的基本理論和架構(gòu)

隨著數(shù)學(xué)優(yōu)化和計(jì)算硬件的迅猛發(fā)展，深度神經(jīng)網(wǎng)絡(luò)（Deep Neural Networks, DNN）（名詞解釋>）已然成為解決各領(lǐng)域中許多挑戰(zhàn)性問題的強(qiáng)大工具，包括決策、計(jì)算成像、全息技術(shù)等。

發(fā)表于 04-11 12:24 ?3406次閱讀

介紹第一個(gè)結(jié)合相對和絕對深度的多模態(tài)單目深度估計(jì)網(wǎng)絡(luò)

單目深度估計(jì)分為兩個(gè)派系，metric depth estimation(度量深度估計(jì)，也稱絕對深度估計(jì)

發(fā)表于 03-21 18:01 ?5561次閱讀

深度學(xué)習(xí)在語音識別中的應(yīng)用及挑戰(zhàn)

的挑戰(zhàn)。二、深度學(xué)習(xí)在語音識別中的應(yīng)用 1.基于深度神經(jīng)網(wǎng)絡(luò)的語音識別：深度神經(jīng)網(wǎng)絡(luò)（DNN）和循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）是

發(fā)表于 10-10 18:14 ?895次閱讀

一種利用幾何信息的自監(jiān)督單目深度估計(jì)框架

本文方法是一種自監(jiān)督的單目深度估計(jì)框架，名為GasMono，專門設(shè)計(jì)用于室內(nèi)場景。本方法通過應(yīng)用多視圖幾何的方式解決了室內(nèi)場景中幀間大旋轉(zhuǎn)和低紋理導(dǎo)致自監(jiān)督深度

發(fā)表于 11-06 11:47 ?427次閱讀

單目深度估計(jì)開源方案分享

可以看一下單目深度估計(jì)效果，這個(gè)深度圖的分辨率是真的高，物體邊界分割的非常干凈！這里也推薦工坊推出的新課程《單目深度估計(jì)方法：算法梳理與代碼

發(fā)表于 12-17 10:01 ?802次閱讀

康謀分享 | 在基于場景的AD/ADAS驗(yàn)證過程中，識別挑戰(zhàn)性場景！

基于場景的驗(yàn)證是AD/ADAS系統(tǒng)開發(fā)過程中的重要步驟，然而面對海量駕駛記錄數(shù)據(jù)時(shí)，如何實(shí)現(xiàn)自動(dòng)且高效地識別、分類和提取駕駛記錄中的挑戰(zhàn)性場景？本文康謀為您介紹IVEX軟件識別挑戰(zhàn)性場

發(fā)表于 08-28 10:16 ?1062次閱讀

建筑物邊緣感知和邊緣融合的多視圖立體三維重建方法

航空建筑深度估計(jì)是三維數(shù)字城市重建中的一項(xiàng)重要任務(wù)，基于深度學(xué)習(xí)的多視圖立體（MVS）方法在該領(lǐng)域取得了較好的成果。目前的主要方法通過修改MVS

發(fā)表于 11-07 10:16 ?187次閱讀