rm新时代爆单,RM新时代官方网站|首入球时间

摘要：近年來自動駕駛場景中的預測任務逐漸興起一種新形式，即預測未來基于鳥瞰圖的空間占有柵格（occupancy）和光流（flow）。此類預測任務與傳統(tǒng)預測軌跡的任務相比在很多場景下會提供更多的信息，作為自動駕駛上下游的一環(huán)，有著更廣泛的應用場景。在今年的Waymo Open Dataset Challenge 2022上，Waymo推出了此任務的全新挑戰(zhàn)賽。地平線在這個項目上研發(fā)出了一種全新的利用時空信息進行編碼解碼的層級網(wǎng)絡，通過多重編碼網(wǎng)絡，多尺度時空融合，預測隱變量以及聯(lián)合柵格占有和光流的損失函數(shù)等創(chuàng)新性技術(shù)，將這一任務的精度推上新的高度。

背景

預測任務是自動駕駛場景中至關(guān)重要的一項任務，其目的是通過對運動物體的歷史軌跡和運動狀態(tài)的觀測，結(jié)合道路信息，推測其未來的行為，為下游的規(guī)劃控制提供更豐富的預測信息。其表征形式通常為多條未來可能的軌跡。近年來，越來越多的研究表明，基于鳥瞰圖的空間占有柵格和光流的表征形式相比多條軌跡預測有更強的表征能力。相比于軌跡的形式，占有柵格有更豐富的空間分布信息，能更好的表征動態(tài)物體的位置，形狀，身份的不確定性；其聯(lián)合概率分布的形式在一定程度上可以處理物體之間的交互的能力；同時，所有的動態(tài)物體可以同時并行處理，極大地提升了處理的效率；另外，此種方法還具有推測被遮擋物體的能力，能有效預防諸如“鬼探頭”等的情況；最后，其鳥瞰圖下的表征形式能更好地與上下游相結(jié)合。基于這個趨勢，Waymo于今年推出了全新的自動駕駛挑戰(zhàn)賽項目，即Occupancy and Flow Predic tion Challenge。此挑戰(zhàn)賽給定過去一秒中動態(tài)物體（車輛，自行車和行人）的運動軌跡，要求對未來八秒的可觀測物體的柵格占有、遮擋物體的柵格占有以及對應光流做預測。本方法結(jié)合了CNN、transformer、三維稀疏卷積等優(yōu)勢，利用隱變量豐富了未來的信息，創(chuàng)新性地引入了層級時序解碼機制，在此次Waymo挑戰(zhàn)賽中取得了極佳的成績。

方法

輸入

模型的輸入包含了動態(tài)信息和靜態(tài)信息。其中動態(tài)信息包含了歷史幀和當前幀的動態(tài)物體（車輛，自行車和行人）的空間占有柵格信息以及對應物體的屬性信息（比如物體檢測框的長寬高和速度等信息），靜態(tài)信息包含了整個場景的路面相關(guān)信息（比如道路中線，道路邊緣，路面其他特征等）。所有信息都被處理成二維鳥瞰圖并進一步進行時間尺度上的聚合。我們同時使用了2D編碼器和3D編碼器，其中針對2D編碼器，動態(tài)信息輸入會直接在特征維上進行時間拼接；而針對3D編碼器，時間會作為額外的維度（靜態(tài)信息在每一幀上進行復制），并且輸入會作稀疏化處理。

編碼器

編碼器一共分為三種，分別是基本編碼器，注意力編碼器以及時空編碼器

基本編碼器：作為整個框架的基本編碼器，我們選擇使用了RegNet［1］模型。RegNet是一個設計完備且效率很高的模型。編碼器經(jīng)過層層降采樣編碼，生成了5個維度上的特征，對應的尺度分別是輸入的1/2，1/4，1/8，1/16和1/32。

注意力編碼器：近年來，在檢測和分割任務中，SwinTransformer及其升級版SwinTransformerV2［2］取得了很好的結(jié)果。基于其獨特的局部窗口注意力機制，不僅能很好地編碼動態(tài)物體和路面間的交互，還大量地減少了網(wǎng)絡計算量，因此我們使用了SwinTransformerV2來作為整個網(wǎng)絡的注意力編碼器。為了可以和基本編碼器輸出特征的尺度相對應，我們將每個patch的尺寸由4改成了2，由此注意力編碼器可以輸出和基本編碼器尺度相同的5個特征。

時空編碼器：為了更好地進行幀間信息交互提取，我們設計了一個3D時空編碼器來額外捕捉時間尺度上的信息。因為我們的輸入信息在鳥瞰圖上有著很高的稀疏度，我們選擇使用3D稀疏卷積和子流形稀疏卷積［3］來搭建網(wǎng)絡。這樣既可以大量地加速3D卷積的計算也可以有效防止稀疏特征在早期過快地膨脹（dilation）。我們對應其他編碼器，設計了5階段網(wǎng)絡，其中時間維在2和4階段進行下采樣。針對網(wǎng)絡的每個輸出特征，我們將時間維和特征維進行合并來使特征降維。

聚合器

聚合器由兩部分組成，在空間尺度上，我們利用BiFPN做多尺度的聚合；在時間尺度上，我們利用隱變量模型來豐富未來的信息。類比于條件變分器，我們在每一個尺度，每一個空間位置都對未來的概率進行建模。在訓練階段，我們基于現(xiàn)在時刻的概率分布做采樣。推理階段，我們直接采用概率分布均值。為了保證預測分布和已觀測分布的一致性，我們采用Kullback-Leibler divergence損失函數(shù)作為監(jiān)督信號。

解碼器

解碼器采用多層級多尺度的特征金字塔形式，基本的組成單元為3D卷積Bottleneck結(jié)構(gòu)。3D bottleneck中采用了膨脹卷積和分組卷積，可以極大地擴大感受野并節(jié)省計算量。同時，為了將編碼后的2D特征做時序展開，我們引入了3D轉(zhuǎn)置卷積Bottleneck。這些堆疊的bottleneck通過上采樣進行多尺度的鏈接，有效地融合了多尺度的信息。同時，為了節(jié)省計算量，我們在輸出尺度上用ConvLSTM做時序上的修正。

損失函數(shù)

對于可觀測占有柵格和被遮擋占有柵格的預測，我們采用Focal Loss作為其監(jiān)督信號，兩者采用相同的權(quán)重進行加權(quán)。

對于光流的預測，我們采用Smooth L1損失函數(shù)。為了將光流和占有率的預測解耦，我們利用占有率的真值做加權(quán)。

為了保證柵格占有率和光流預測的一致性，我們采用跟蹤損失函數(shù)進行進一步監(jiān)督。利用光流的預測，我們可以對前一幀的柵格占有率進行空間變形來得到當前幀的基于光流的空間占有預測。

最后將基于光流的空間占有預測和當前幀柵格占有預測相乘，來得到當前幀的空間占有-光流聯(lián)合預測，并用此聯(lián)合預測和當前幀的柵格占有真值來計算損失函數(shù)traced loss。我們同時采用Focal loss和交叉熵損失函數(shù)進行監(jiān)督［4］。

為保證聚合器中隱變量中現(xiàn)在和未來的一致性，我們采用Kullback-Leibler divergence損失函數(shù)作為監(jiān)督信號［5］來監(jiān)督預測的概率分布函數(shù)參數(shù)。

最后，所有的損失函數(shù)進行加權(quán)和作為最后的損失函數(shù)。

實驗結(jié)果

消融實驗

本表展示了在Waymo數(shù)據(jù)集上的消融實驗結(jié)果，灰色的一列為評測的主指標?？梢钥闯觯琹oss的改進，如focal loss和traced loss分別帶來了2.01%和0.46%的提升。同時，更豐富的柵格化輸入帶來了1.23%的提升。同時，結(jié)構(gòu)化的改進，包括隱變量，時空解碼器，以及解碼器的改進帶來了約1.21%的提升。最后TTA帶來了約0.40%的提升。值得一提的是，所有的實驗都是在十分之一的數(shù)據(jù)集上做的驗證。這些結(jié)果充分的說明了我們方法的有效性。

測試集表現(xiàn)

下表展示了我們方法在waymo測試集上的排名，灰色的一列代表評測的主指標，可以看出，我們的結(jié)果在主指標上大幅領(lǐng)先對手，充分說明我們方法的優(yōu)越性。

結(jié)果可視化

下面展示我們的方法在特定場景下的對接下來8秒占有柵格（左）和光流（右）的可視化結(jié)果。下面列出了直行，紅綠燈路口左轉(zhuǎn)右轉(zhuǎn)掉頭，無保護左轉(zhuǎn)，4-way-stop，無保護左轉(zhuǎn)，自主避障，停車入庫，被遮擋物體的猜測等場景?？梢钥闯?，我們的方法能有效地處理復雜場景，能實現(xiàn)多動態(tài)物體的交互，交通信息和規(guī)則的理解，自主避障，對被遮擋物體的推測等功能。

普通路面：主要展示對不同車速/加速減速情況的車流預測，可以看出HOPE能對未來軌跡的不確定性進行很好的建模

交叉路口：主要展示對不同轉(zhuǎn)彎，停車等待的車流預測

掉頭場景：復雜路口

不確定場景：直行、右轉(zhuǎn)兩條車道都有可能駛?cè)?/p>

右轉(zhuǎn)：右轉(zhuǎn)車輛對直行車輛進行了避讓

左轉(zhuǎn)：根據(jù)路口紅綠燈、交通規(guī)則等綜合信息對路權(quán)進行判斷

無保護左轉(zhuǎn)：左轉(zhuǎn)車輛對直行車輛進行了避讓

2 way stop：可以看見車輛交互，處理先來后到順序

遮擋繞行：可以看見車輛對前方靜止車輛進行了繞行

停車入庫：小樣本、低速場景預測，可以看見低速場景下軌跡的不確定性更高，模型可以有多種可能的軌跡預測

遮擋物體的猜測：綠色的為被遮擋物體

原文標題：開發(fā)者說 | HOPE：基于自動駕駛場景Occupancy和Flow的運動預測

文章出處：【微信公眾號：地平線HorizonRobotics】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

審核編輯：彭靜

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

編碼解碼

編碼解碼

+關(guān)注

關(guān)注
0

文章
7

瀏覽量
7179
自動駕駛

自動駕駛

+關(guān)注

關(guān)注
784

文章
13784

瀏覽量
166375
地平線

地平線

+關(guān)注

關(guān)注
0

文章
340

瀏覽量
14941

原文標題：開發(fā)者說 | HOPE：基于自動駕駛場景Occupancy和Flow的運動預測

文章出處：【微信號：horizonrobotics，微信公眾號：地平線HorizonRobotics】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

地平線引入國際公司高管！陳黎明博士履新地平線任總裁

9月1日，地平線官方微信宣布，陳黎明博士履新地平線任總裁。陳黎明博士于1995年加入博世集團，曾任技術(shù)專家，研發(fā)高級經(jīng)理、總監(jiān)和副總裁，他領(lǐng)導創(chuàng)建的博世底盤控制系統(tǒng)研發(fā)中心是博世公司在

發(fā)表于 09-01 10:57 ?5628次閱讀

<b class='flag-5'>地平線</b>引入國際公司高管！陳黎明博士履新<b class='flag-5'>地平線</b>任總裁

地平線RDK系列再升級，NodeHub驚喜發(fā)布

7月25日，“地平線2023機器人開發(fā)者創(chuàng)享日”在深圳成功舉辦?；顒蝇F(xiàn)場，地平線官宣了一系列重要發(fā)布：全新地平線RDK系列機器人開發(fā)者套件正式上線，機器人操作系統(tǒng)TogetheROS.

發(fā)表于 07-26 09:01 ?862次閱讀

<b class='flag-5'>地平線</b>RDK系列再升級，NodeHub驚喜發(fā)布

【地平線旭日X3派試用體驗】開箱篇硬件介紹

地平線旭日X3是夢寐以求的開發(fā)板，上圖，地平線是一家細心的公司，包裝都做得這么精致。還帶個散熱片。接口：一個CSI的相機接口，板載USB有3個，包含1個USB3.0和2個USB2.0，

發(fā)表于 07-26 19:13

一種對時空信息的kNN查詢處理方法

理位置和時間信息的K近鄰查詢（ST-kNN查詢）處理方法，首先，利用時空相似度對數(shù)據(jù)對象的地理位置變量和時間變量進行映射變換，將數(shù)據(jù)對象映射到新的三維空間中，用三維空間中兩點之間的距離相似度來近似代替兩個對象之間實際的

發(fā)表于 01-09 18:10 ?0次下載

地平線推出全新一代 AIoT 邊緣 AI 芯片平臺

9 月 9 日，地平線釋放芯效能產(chǎn)品發(fā)布會于深圳舉辦，宣布推出全新一代 AIoT 邊緣 AI 芯片平臺地平線旭日 3。依托極致效能、開放易用的旭日 3 芯片，地平線在廣泛的 AIoT

發(fā)表于 09-24 11:55 ?2645次閱讀

地平線推出自主研發(fā)的人工智能芯片

地平線發(fā)布的“旭日 1.0”和“征程 1.0”是完全由地平線自主研發(fā)的人工智能芯片，具有全球領(lǐng)先的性能。我們知道，人工智能芯片及其使用的卷積神經(jīng)網(wǎng)絡算法已經(jīng)成功地應用于圖像處理、自動駕

發(fā)表于 10-27 10:13 ?3281次閱讀

來地平線投身底層的科技創(chuàng)新戰(zhàn)役

“來地平線，與最酷的人做最酷的事！” “有多酷？” 近日，地平線在北京順義研發(fā)中心舉辦了一場招聘 Open Day 直播體驗日活動。地平線創(chuàng)

發(fā)表于 12-18 15:30 ?1120次閱讀

一種多層級特征融合就的深度卷積網(wǎng)絡

采用卷積神經(jīng)網(wǎng)絡對單目圖像的深度進行估計時，存在深度信息不精確、邊緣模糊以及細節(jié)缺失等問題。為此，提出一種多層級特征融合結(jié)構(gòu)的深度卷積

發(fā)表于 03-16 09:21 ?7次下載

<b class='flag-5'>一種</b>多<b class='flag-5'>層級</b>特征融合就的深度卷積<b class='flag-5'>網(wǎng)絡</b>

一種編碼解碼模式的肺分割算法

CT成像技術(shù)是輔助醫(yī)生診斷肺部疾病的重要手段。針對肺部各組織結(jié)構(gòu)復雜，難以準確地對肺部CT像中肺實質(zhì)進行分割和提取的問題，提岀了一種編/解碼模弌的肺分割算法。為了獲得圖像的多尺度信息，

發(fā)表于 04-13 10:46 ?11次下載

<b class='flag-5'>一種</b><b class='flag-5'>編碼</b><b class='flag-5'>解碼</b>模式的肺分割算法

包含時空信息特征的視頻指紋算法

為滿足視頻拷貝檢測系統(tǒng)的魯棒性、獨特性和緊湊性，提出一種包含時空信息特征的視頻指紋算法。利用時空切片和關(guān)鍵幀構(gòu)成時空信息，將包含視頻關(guān)鍵幀空域信息

發(fā)表于 06-10 11:20 ?15次下載

比亞迪與地平線正式宣布達成定點合作

比亞迪與地平線正式宣布達成定點合作，比亞迪將在其部分車型上搭載地平線高性能、大算力自動駕駛芯片征程5，打造更具競爭力的行泊一體方案，實現(xiàn)高等級自動駕駛功能。按照計劃，搭載地平線征程5的

發(fā)表于 05-07 17:16 ?2841次閱讀

地平線獲得一汽紅旗全新車型項目應用

將于2023年在一汽紅旗全新車型上實現(xiàn)量產(chǎn)，未來還將應用于更多紅旗車型。同時，雙方正在基于地平線征程2芯片推動輔助駕駛功能的研發(fā)應用，合作車型將于今年量產(chǎn)落地。

發(fā)表于 05-14 17:08 ?2168次閱讀

地平線GitLab使用指導

地平線開發(fā)者社區(qū)致力于連接地平線和開發(fā)者，為大家提供前沿技術(shù)內(nèi)容和豐富的技術(shù)活動，打造更好的開發(fā)者文化和氛圍，共建開源生態(tài)

發(fā)表于 11-04 14:18 ?764次閱讀

旭日，從地平線升起——地平線旭日X3派開箱試用

地平線旭日X3派，開啟你的嵌入式開發(fā)之旅

發(fā)表于 11-08 15:22 ?1639次閱讀

地平線Journey 3的電源設計

電子發(fā)燒友網(wǎng)站提供《地平線Journey 3的電源設計.pdf》資料免費下載

發(fā)表于 09-04 10:48 ?0次下載