新时代RM娱乐app软件,新时代官方下载

引言

進(jìn)入文章正題之前，我們需要先簡(jiǎn)單講清楚本文中所提到的“規(guī)控”究竟是什么。

相信凡是自動(dòng)駕駛行業(yè)的人，一定都知道感知、定位、決策、規(guī)劃、控制這幾大模塊——盡管大家日常溝通時(shí)如此區(qū)分，但具體工作中如果還這么分類(lèi)就有點(diǎn)問(wèn)題了。

這里的問(wèn)題出在決策上，廣義地說(shuō)，決策包含預(yù)測(cè)，而預(yù)測(cè)的劃分非常尷——預(yù)測(cè)本身與感知高度相關(guān)，但預(yù)測(cè)又是決策的前置階段，只有先預(yù)測(cè)之后才能進(jìn)行決策。

所有已經(jīng)發(fā)生的既定事實(shí)我們可以稱(chēng)之為T(mén)0+，感知就是已經(jīng)發(fā)生過(guò)的既定事實(shí)。例如車(chē)輛未來(lái)應(yīng)該怎么走、別人可能會(huì)怎么等都屬于未來(lái)將要發(fā)生的事情，我們可以稱(chēng)之為T(mén)0-。

以T0為分水嶺劃分會(huì)有一個(gè)好處：感知環(huán)節(jié)只需關(guān)心路面上已經(jīng)發(fā)生的既定事實(shí)即可，此后基于這個(gè)既定事實(shí)的任何推斷都可以直接放到?jīng)Q策部分。

如此分類(lèi)可以將預(yù)測(cè)的結(jié)果與決策部分更加緊密地結(jié)合，從而人為“弱化”預(yù)測(cè)與感知的關(guān)系，“增強(qiáng)”預(yù)測(cè)與決策的關(guān)系。反映到實(shí)際工作中，這么劃分就可以更好地確定到底該預(yù)測(cè)哪些內(nèi)容、如何更好地用預(yù)測(cè)的結(jié)果服務(wù)于決策。（以上內(nèi)容是筆者在跟領(lǐng)駿科技CEO楊文利博士交流后總結(jié)的）

基于以上邏輯，自動(dòng)駕駛公司內(nèi)部通常都會(huì)有一個(gè)PNC組，PNC組的主要任務(wù)就是負(fù)責(zé)規(guī)控方面的工作。大家在PNC組干時(shí)間長(zhǎng)了就會(huì)把預(yù)測(cè)、決策、規(guī)劃、控制統(tǒng)一稱(chēng)呼為“規(guī)控”。

那么此“規(guī)控”，即為本文中所稱(chēng)的“規(guī)控”。

接下來(lái)，我們?cè)賹ⅰ皵?shù)據(jù)驅(qū)動(dòng)”與“規(guī)控”結(jié)合起來(lái)講。

盡管“數(shù)據(jù)驅(qū)動(dòng)”早成為自動(dòng)駕駛產(chǎn)業(yè)的基本共識(shí)，但事實(shí)上，直到現(xiàn)在，數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)算法仍主要應(yīng)用在感知模塊，而在規(guī)控中應(yīng)用的卻很少——目前，行業(yè)內(nèi)的規(guī)控相關(guān)算法主要還是基于規(guī)則驅(qū)動(dòng)。

雖然目前公開(kāi)的自動(dòng)駕駛規(guī)控算法相關(guān)資料大都是針對(duì)基于規(guī)則的算法的，但筆者打開(kāi)招聘軟件卻經(jīng)常能看到自動(dòng)駕駛企業(yè)招聘規(guī)控算法工程師時(shí)會(huì)要求候選人懂深度學(xué)習(xí)算法，這在某種程度上也說(shuō)明了目前很多企業(yè)也正在向混合決策算法“進(jìn)軍”。

（圖片來(lái)源于某自動(dòng)駕駛公司的招聘要求）

目前還鮮有文章完整細(xì)致地闡述過(guò)深度學(xué)習(xí)算法在自動(dòng)駕駛規(guī)控中的應(yīng)用情況。因此，本文將從規(guī)則的局限性與深度學(xué)習(xí)算法的潛在優(yōu)勢(shì)、為什么現(xiàn)階段深度學(xué)習(xí)算法尚不能被大規(guī)模應(yīng)用于規(guī)控算法、未來(lái)的規(guī)控算法以規(guī)則為主還是以深度學(xué)習(xí)為主這三個(gè)方面來(lái)詳述。

一．規(guī)則的局限性與深度學(xué)習(xí)算法的潛在優(yōu)勢(shì)

1.基于規(guī)則的算法有局限性

目前，規(guī)控相關(guān)算法主要還是基于規(guī)則，但隨著自動(dòng)駕駛等級(jí)的提升及應(yīng)用場(chǎng)景的不斷拓展，基于規(guī)則的規(guī)控算法在實(shí)際測(cè)試中就會(huì)暴露出它的局限性。

使基于規(guī)則的規(guī)控算法暴露出短板的，主要是非確定性場(chǎng)景、強(qiáng)交互場(chǎng)景、強(qiáng)主觀場(chǎng)景這三個(gè)大類(lèi)的corner case：

（1）非確定性場(chǎng)景

非確定性場(chǎng)景是相對(duì)于確定性場(chǎng)景而言的，最簡(jiǎn)單的確定性場(chǎng)景就是紅燈停綠燈行、可以在白色虛線變道、不能在白色實(shí)線變道，除此類(lèi)的場(chǎng)景則都可視為“非確定性場(chǎng)景”。

例如，大部分情況下車(chē)都在有車(chē)道線的道路開(kāi)，但有一種情況是當(dāng)前的道路是三條干道加一條輔路，而輔路與干道間只有車(chē)道線沒(méi)有綠化帶，這也就意味著輔路的車(chē)輛在任何情況下都有可能并線進(jìn)入主路，這就是一個(gè)典型的非確定性場(chǎng)景。因?yàn)榇蠖鄶?shù)司機(jī)根本不會(huì)管實(shí)線虛線，你根本不知道周邊什么時(shí)候會(huì)突然出現(xiàn)一輛車(chē)，它有多大的概率會(huì)直接變道。

因?yàn)榈缆分衅渌?chē)輛的軌跡帶有概率，基于規(guī)則的算法很難處理。

（2）強(qiáng)交互場(chǎng)景

最典型的場(chǎng)景就是十字路口，多個(gè)物體在一個(gè)場(chǎng)景下的路線會(huì)發(fā)生交互而互相影響，所以交互的時(shí)候是有一定博弈在里面。

在非常復(fù)雜的一個(gè)道路場(chǎng)景里，不斷地對(duì)周?chē)?chē)做預(yù)測(cè)，然后基于交互的結(jié)果去調(diào)規(guī)劃，這不是能夠用人的規(guī)則描述清楚的。

（3）強(qiáng)主觀場(chǎng)景

簡(jiǎn)單說(shuō)就是在不同路況下，人會(huì)無(wú)意識(shí)地根據(jù)環(huán)境去調(diào)節(jié)自車(chē)跟前車(chē)的距離。因?yàn)槿四X中可能有一套規(guī)則在驅(qū)動(dòng)，但這些規(guī)則又很抽象、不能明確，只可意會(huì)不可言傳的，例如變道的時(shí)機(jī)、在路口對(duì)其他車(chē)輛的反應(yīng)等等。

有的場(chǎng)景下，雖然可以用規(guī)則算法來(lái)模仿車(chē)主的一些行為和駕駛風(fēng)格，但人的主觀習(xí)慣很難用規(guī)則解決，即使能解決也需要大量的人力。

用基于規(guī)則的算法應(yīng)對(duì)corner case,最難的是預(yù)測(cè)環(huán)節(jié)。因?yàn)?，除了要預(yù)測(cè)自車(chē)軌跡外，自動(dòng)駕駛車(chē)輛還需要預(yù)測(cè)“其他道路使用者”的軌跡，而道路中往往不只有一個(gè)“其他道路使用者”，他們彼此間會(huì)產(chǎn)生交互，所以預(yù)測(cè)他們的軌跡很難。

人類(lèi)駕駛員在做預(yù)測(cè)時(shí)會(huì)通過(guò)觀察車(chē)的歷史軌跡、駕駛員的駕駛風(fēng)格，根據(jù)“經(jīng)驗(yàn)”和“直覺(jué)”來(lái)做決策，即可以根據(jù)其他車(chē)輛是否保守來(lái)選擇自車(chē)的策略，然而，基于規(guī)則的算法很難達(dá)到和人類(lèi)類(lèi)似的預(yù)測(cè)效果。

此外，當(dāng)車(chē)輛遇到一些corner case需要制動(dòng)時(shí)，基于規(guī)則的規(guī)控系統(tǒng)很難保證曲線時(shí)刻平滑。

舉個(gè)例子，如果前方有輛車(chē)正以很低的速度行駛，此時(shí)自動(dòng)駕駛系統(tǒng)下達(dá)“向右變道超車(chē)”的指令，但剛變道至一半時(shí)突然旁邊有一輛車(chē)正在向右側(cè)車(chē)道飛速超車(chē)，決策系統(tǒng)隨即取消變道決策，并重新生成一條平滑曲線讓車(chē)輛返回原來(lái)的車(chē)道中。

這里的難點(diǎn)在于，如何平衡好舒適性、安全、效率、動(dòng)力模型的可實(shí)現(xiàn)性等元素，并保證此時(shí)生成的軌跡規(guī)劃路徑是光滑的？

依舊以上文為例，如果無(wú)法保證此時(shí)生成的路徑是平滑的，那么車(chē)輛開(kāi)起來(lái)會(huì)很“硬”，行駛途中會(huì)變得很不舒適。如果駕駛員/乘客此時(shí)能看到周?chē)霈F(xiàn)緊急情況，而系統(tǒng)及時(shí)幫他避免了事故，他就會(huì)認(rèn)為系統(tǒng)很靠譜，哪怕是急剎車(chē)乘客也會(huì)認(rèn)為自動(dòng)駕駛系統(tǒng)“幫我避免了一次事故”。

但現(xiàn)實(shí)情況卻是，多數(shù)情況下，系統(tǒng)早就發(fā)現(xiàn)了問(wèn)題并做出了決策，直接“防患于未然”?？蓡?wèn)題在于，大多數(shù)駕駛員/乘客不會(huì)知道一次“看起來(lái)很普通”的變道在剛剛“差點(diǎn)釀成事故”，甚至可能都沒(méi)發(fā)現(xiàn)后方有來(lái)車(chē)。所以，如果此時(shí)規(guī)控系統(tǒng)無(wú)法生成一條光滑的曲線，駕駛員/乘客不會(huì)非但不會(huì)認(rèn)為系統(tǒng)“幫我避免了一次事故”，反而會(huì)怪系統(tǒng)“太生硬”，變道“甩來(lái)甩去”的。

這類(lèi)問(wèn)題雖然也可以用基于規(guī)則的算法解決，但解決的過(guò)程卻非常麻煩。

除此之外，盡管從理論上講，有一些長(zhǎng)尾場(chǎng)景也可以用基于規(guī)則的算法來(lái)解決，但在實(shí)際工作中，工程師很難保證這些復(fù)雜的代碼在解決問(wèn)題的同時(shí)還能不占用太多計(jì)算資源。這些代碼放在離線系統(tǒng)上可以很輕松地跑起來(lái)，但上車(chē)后，車(chē)載芯片是否能支撐起這么龐大的算力消耗？解決這些問(wèn)題非常考驗(yàn)工程師的代碼水平和工程能力。

而且，可能有的工程師寫(xiě)了幾千行代碼，他自己都忘記自己寫(xiě)過(guò)什么了。規(guī)則越來(lái)越多、邏輯越來(lái)越亂，當(dāng)“未來(lái)”某個(gè)時(shí)刻又新加了一個(gè)需求的時(shí)候，系統(tǒng)也將會(huì)變得難以維護(hù)。

2.深度學(xué)習(xí)算法可以在合適的場(chǎng)景提升系統(tǒng)的擬人性

上文說(shuō)了很多規(guī)則算法的局限性，但實(shí)際上規(guī)則算法的局限性不止于此。如果把所有問(wèn)題綜合來(lái)看，我們可以統(tǒng)稱(chēng)為規(guī)則算法的“擬人性低”。

所謂擬人性，就是系統(tǒng)在行駛過(guò)程中像不像一個(gè)“老司機(jī)”。毫末智行的一位規(guī)控算法專(zhuān)家說(shuō)：

“擬人化老司機(jī)的核心能力是隨機(jī)應(yīng)變，而用基于規(guī)則的系統(tǒng)就得設(shè)定一大堆規(guī)則來(lái)區(qū)分場(chǎng)景，設(shè)定大量的環(huán)境參數(shù)和代價(jià)函數(shù)，不停地尋找最優(yōu)解，從數(shù)學(xué)上很難做到實(shí)時(shí)。”

目前，能夠上路測(cè)試的自動(dòng)駕駛車(chē)輛在多數(shù)情況下更像一個(gè)“新手司機(jī)”，而“老司機(jī)”與“新手司機(jī)”最大的差別是：“老司機(jī)”的預(yù)測(cè)能力更強(qiáng)，并且對(duì)長(zhǎng)尾場(chǎng)景隨機(jī)應(yīng)變的能力更強(qiáng)。

兩相比較，多數(shù)“新手司機(jī)”雖然也很安全，但“新手司機(jī)”在路上開(kāi)車(chē)會(huì)很“傻”，而“老司機(jī)”則可以在保證安全的前提下各種操作都會(huì)更加順滑、效率更高。這個(gè)差別叫做“假釋經(jīng)驗(yàn)”。

本質(zhì)上，“新手司機(jī)”在路上更多依靠的是“基于駕校的教材”，決策規(guī)劃方式更像if else（規(guī)則算法），而“老司機(jī)”決策時(shí)依靠的是經(jīng)驗(yàn)和主觀判斷，決策規(guī)劃的方式相對(duì)抽象，更像是“深度學(xué)習(xí)算法”。

綜上，在規(guī)控環(huán)節(jié)引入深度學(xué)習(xí)算法，盡可能多地學(xué)習(xí)人類(lèi)司機(jī)的經(jīng)驗(yàn)，自動(dòng)提煉特征找規(guī)律，就可以提升規(guī)控算法的“擬人性”。

特斯拉在本屆 AI Day 上提到的數(shù)據(jù)引擎，就是將通過(guò)將數(shù)據(jù)輸入到神經(jīng)網(wǎng)絡(luò)，提高確定性，以更好地去解決現(xiàn)實(shí)世界的預(yù)測(cè)問(wèn)題。

輕舟智航規(guī)控算法負(fù)責(zé)人認(rèn)為，預(yù)測(cè)（判斷其他車(chē)輛的未來(lái)軌跡）是最適合也是率先大規(guī)模應(yīng)用深度學(xué)習(xí)算法的環(huán)節(jié)。他說(shuō)：“輕舟智航的預(yù)測(cè)算法就使用了深度學(xué)習(xí)?！?/p>

具體到場(chǎng)景方面，他認(rèn)為，那些高度依賴人的主觀判斷的場(chǎng)景，更需要用深度學(xué)習(xí)算法做指導(dǎo)。

小馬智行的規(guī)控算法專(zhuān)家稱(chēng)，小馬已將AI模型可以應(yīng)用在多個(gè)層次。

“比如可以用傳統(tǒng)分類(lèi)AI模型（可以是深度學(xué)習(xí)，也可以是傳統(tǒng)的機(jī)器學(xué)習(xí)分類(lèi)模型）來(lái)做decision making，用深度學(xué)習(xí)做軌跡生成來(lái)指導(dǎo)path planning，用端到端強(qiáng)化學(xué)習(xí)給出當(dāng)前應(yīng)該執(zhí)行的ac tion來(lái)指導(dǎo)motion planning（最終軌跡的規(guī)劃）?！?/p>

這位專(zhuān)家還認(rèn)為，結(jié)構(gòu)化的高速場(chǎng)景可能更容易由傳統(tǒng)算法解決，而非結(jié)構(gòu)化的城區(qū)場(chǎng)景則可能有更大空間發(fā)揮AI模型的優(yōu)勢(shì)。

而摯途則是高速匝道口場(chǎng)景的決策環(huán)節(jié)用到了強(qiáng)化學(xué)習(xí)算法。

領(lǐng)駿科技CEO楊文利博士認(rèn)為，在自動(dòng)駕駛的不同模塊上，深度學(xué)習(xí)算法的重要性及適用性不完全相同。

“從感知-融合-預(yù)測(cè)-決策-規(guī)劃-控制，這個(gè)流程來(lái)看，越靠前的部分，深度學(xué)習(xí)算法的效果越好?！?/p>

楊文利博士說(shuō)：

“感知系統(tǒng)數(shù)據(jù)處理量大，但允許出錯(cuò)，對(duì)準(zhǔn)確率和召回率有一定容忍度（因?yàn)楹罄m(xù)的融合和決策可以對(duì)感知糾錯(cuò)），所以，深度學(xué)習(xí)方法比較合適。

“決策這部分，規(guī)則和學(xué)習(xí)各有所長(zhǎng)，所以我們用的混合架構(gòu)，用深度學(xué)習(xí)方法提升性能，用規(guī)則方法保證安全。

“控制系統(tǒng)數(shù)據(jù)量小，對(duì)可靠性要求強(qiáng)，絕對(duì)不允許出錯(cuò)，而使用深度學(xué)習(xí)算法非但不能提升性能，還有可能引入不確定性和不可靠因素，因此不適合采用深度學(xué)習(xí)算法。并且，控制這種底層技術(shù)，已經(jīng)有200年歷史了，數(shù)學(xué)證明上很完美了，也沒(méi)必要再用深度學(xué)習(xí)?！?/p>

況且，在規(guī)劃算法出錯(cuò)的情況下，控制算法還需要為安全兜底。在經(jīng)典控制算法的PID中，控制層為了保證安全，就可以拒絕執(zhí)行規(guī)劃層發(fā)出的“錯(cuò)誤指令”。例如，規(guī)劃下達(dá)指令讓車(chē)輛開(kāi)到120公里/小時(shí)，但車(chē)輛本身的硬件并不能支持120公里/小時(shí)的車(chē)速，這個(gè)時(shí)候，控制算法就可以做一個(gè)校驗(yàn)，直接拒絕執(zhí)行指令，保證車(chē)輛能正常行駛，不會(huì)開(kāi)翻。

而控制算法要想為一切失誤兜底，就必須要用基于規(guī)則的算法來(lái)保證可靠性。

據(jù)此看，通常在提到“深度學(xué)習(xí)算法應(yīng)用于規(guī)控”時(shí)，大家所說(shuō)的“規(guī)控”，其實(shí)主要指預(yù)測(cè)、決策和規(guī)劃，而不包括控制。

除去解決實(shí)際技術(shù)難題外，深度學(xué)習(xí)算法還有一個(gè)不可忽視的巨大優(yōu)勢(shì)，即充分利用GPU或神經(jīng)網(wǎng)絡(luò)專(zhuān)用處理器，降低CPU算力消耗。

為了實(shí)現(xiàn)某些功能，自動(dòng)駕駛發(fā)展初期使用的復(fù)雜規(guī)則代碼會(huì)消耗大量CPU算力，但車(chē)載芯片的設(shè)計(jì)一般傾向于提高深度學(xué)習(xí)算力，而CPU部分的算力有限，工程師必須想方設(shè)法節(jié)省。而通過(guò)深度學(xué)習(xí)算法替換大量復(fù)雜的基于規(guī)則的算法，便可以節(jié)省不少CPU算力。

輕舟智航規(guī)控算法專(zhuān)家認(rèn)為，城區(qū)NOA量產(chǎn)車(chē)上一般使用嵌入式芯片，CPU都是基于ARM架構(gòu)，CPU算力資源沒(méi)法跟基于X86架構(gòu)的L4 Demo車(chē)比，因此，如果要實(shí)現(xiàn)接近于L4的駕乘體驗(yàn)，供應(yīng)商們有必要嘗試在規(guī)控環(huán)節(jié)引入深度學(xué)習(xí)算法，把計(jì)算負(fù)載放到深度學(xué)習(xí)專(zhuān)用處理器上去。

二．現(xiàn)階段，深度學(xué)習(xí)算法還不能大規(guī)模應(yīng)用于規(guī)控算法

既然深度學(xué)習(xí)算法聽(tīng)上去這么“?！保菫槭裁磳?shí)踐中的規(guī)控算法仍以規(guī)則為主，而不是深度學(xué)習(xí)算法呢？

這是因?yàn)?，深度學(xué)習(xí)算法同樣有不少短板，正是這些短板導(dǎo)致，在短期內(nèi)，深度學(xué)習(xí)算法的效果還不如規(guī)則。

1.很難斷定人類(lèi)司機(jī)的駕駛行為是否“值得學(xué)習(xí)”

在理想的情況下，用于訓(xùn)練的數(shù)據(jù)越多，深度學(xué)習(xí)算法的效果就越好，但在某些情況下，隨著數(shù)據(jù)量的增加，算法的效果卻可能下降。這是為何？

深度學(xué)習(xí)算法首先要學(xué)習(xí)大量人類(lèi)司機(jī)的駕駛行為，然后才有可能被應(yīng)用于規(guī)控算法，但問(wèn)題在于，不同司機(jī)的駕駛風(fēng)格不一樣，同一個(gè)司機(jī)在不同情況下的駕駛風(fēng)格也不完全一致，那如何確保人類(lèi)司機(jī)的駕駛行為就是值得學(xué)習(xí)的良好數(shù)據(jù)？

比如說(shuō)在路口里面的一些變道行為，我們?cè)谡Ｐ旭偟臅r(shí)候不能壓實(shí)線變道，但經(jīng)常很多司機(jī)特別喜歡壓實(shí)線去變。

小馬智行的規(guī)控算法專(zhuān)家說(shuō)：

“人類(lèi)司機(jī)駕駛也有很多壞習(xí)慣，如果只是盲目追求擬人性而忽視了安全、舒適和高效這三個(gè)自動(dòng)駕駛系統(tǒng)的主要優(yōu)化目標(biāo)，那就本末倒置了。實(shí)際上，即便用AI模型來(lái)彌補(bǔ)傳統(tǒng)算法方面的不足，也應(yīng)該是圍繞著這3個(gè)維度來(lái)改進(jìn)的。”

因此，在許多情況下，只有預(yù)先對(duì)數(shù)據(jù)做個(gè)“清洗”，深度學(xué)習(xí)算法的效果才會(huì)好。然而，大規(guī)模的即時(shí)數(shù)據(jù)清洗，效率和質(zhì)量如何保證？這是個(gè)問(wèn)題。

針對(duì)這一問(wèn)題，有一些公司的做法是，人為地去設(shè)定一些規(guī)則，評(píng)價(jià)司機(jī)開(kāi)得好還是不好，然后把看起來(lái)不好都得過(guò)濾掉，但這便是用規(guī)則來(lái)“約束”深度學(xué)習(xí)了；并且，這種做法過(guò)于簡(jiǎn)單粗暴，有可能是“倒洗澡水的時(shí)候連孩子一起倒掉”，把一些有用的駕駛行為數(shù)據(jù)給誤刪。

2.深度學(xué)習(xí)算法比規(guī)則更難應(yīng)對(duì)需求變更

某家自動(dòng)駕駛企業(yè)的算法規(guī)定，在路上行駛時(shí)與前車(chē)的安全距離應(yīng)不小于五米。某一天，產(chǎn)品經(jīng)理提出了一個(gè)新需求：在路上正常行駛時(shí)與前車(chē)的安全距離從不小于五米更改到不小于十米。

這種情況就會(huì)暴露深度學(xué)習(xí)算法的一個(gè)問(wèn)題：工程師如果想根據(jù)需求更改模型，則需要對(duì)模型重新訓(xùn)練，成本很高。但如果用的是基于規(guī)則的算法，此時(shí)就非常簡(jiǎn)單，幾行代碼即可解決問(wèn)題。

并且，如果出現(xiàn)事故，深度學(xué)習(xí)算法很難像規(guī)則算法那樣在最短的時(shí)間里快速排查出問(wèn)題究竟出在哪兒。

3.深度學(xué)習(xí)算法的效果可能不如規(guī)則

輕舟智航規(guī)控算法專(zhuān)家說(shuō)：

如果在各項(xiàng)數(shù)據(jù)基礎(chǔ)設(shè)施不完善的情況下就引入AI模型，AI模型的表現(xiàn)很難達(dá)到預(yù)期。

比如，通過(guò)簡(jiǎn)單的測(cè)試標(biāo)定就可以確定的ACC跟車(chē)距離，通過(guò)AI模型卻可能很難達(dá)到相同效果。其主要原因是，許多公司的數(shù)據(jù)基礎(chǔ)設(shè)施不完善，沒(méi)有辦法找到不同跟車(chē)場(chǎng)景下的多樣的數(shù)據(jù)，導(dǎo)致很難訓(xùn)練出一個(gè)達(dá)到或者超過(guò)規(guī)則表現(xiàn)的模型。

毫末智行的規(guī)控算法專(zhuān)家也說(shuō)：

“現(xiàn)在AI模型效果還沒(méi)有完全打敗規(guī)則，試圖擬人但效果還不夠好，因?yàn)檫@類(lèi)認(rèn)知網(wǎng)絡(luò)的模型架構(gòu)、輸入輸出定義、，數(shù)據(jù)準(zhǔn)備都還沒(méi)有完全做好，并沒(méi)有達(dá)到感知模型的程度，大家還在探索（但我覺(jué)得一年之內(nèi)就會(huì)有重大突破）?！?/p>

4.深度學(xué)習(xí)算法仍需要規(guī)則來(lái)兜底

在車(chē)輛上路行駛的過(guò)程中，決策算法出錯(cuò)其實(shí)是無(wú)法徹底避免的。因?yàn)槟呐率侨嗽陂_(kāi)車(chē)，再厲害的老司機(jī)也不可能保證自己的決策永遠(yuǎn)完全正確，基于深度學(xué)習(xí)模型的決策算法也一樣。

因此，在系統(tǒng)設(shè)計(jì)時(shí)，開(kāi)發(fā)者們應(yīng)當(dāng)考慮到“決策算法會(huì)出錯(cuò)”這一可能性，并做好“接受”決策出錯(cuò)這一潛在事實(shí)的“心理準(zhǔn)備”。

對(duì)此，領(lǐng)駿科技采用了混合決策架構(gòu)，該公司CEO楊文利博士的說(shuō)法是“深度學(xué)習(xí)算法由于善于學(xué)習(xí)人類(lèi)的駕駛經(jīng)驗(yàn)，因此主要用于提升性能，而由程序員設(shè)計(jì)的規(guī)則已進(jìn)行過(guò)充分測(cè)試論證的，用來(lái)保證安全，擁有更高的優(yōu)先級(jí)?！?/p>

再往下層看，規(guī)劃層也能拒絕來(lái)自決策的“錯(cuò)誤指令”。例如，輸入的障礙物速度及尺寸應(yīng)該在某一個(gè)范圍之內(nèi)（比如不能出現(xiàn)時(shí)速100m/s如同“起飛”的小轎車(chē)）；再比如，決策層給出指令“向左換道”，但此時(shí)左邊都是車(chē)，因?yàn)榇藭r(shí)變道則空間規(guī)劃無(wú)完全解，此時(shí)，規(guī)劃就可以直接“拒絕執(zhí)行指令”。

這里提到的拒絕來(lái)自上一環(huán)的“錯(cuò)誤指令”的規(guī)劃算法，只能是基于規(guī)則的。

根據(jù)以上，我們可以看到，在那些可以使用深度學(xué)習(xí)算法的場(chǎng)景中，扮演“兜底”角色的規(guī)則依舊是必不可少的。

5.引入深度學(xué)習(xí)算法，意味著大量代碼需要被替換

還有一個(gè)非?？简?yàn)自動(dòng)駕駛公司的問(wèn)題：如果要用混合式規(guī)控算法，就必然面臨大量代碼需要被替換的問(wèn)題，而這么做又必然需要“堆人”。

輕舟規(guī)控算法專(zhuān)家說(shuō)，傳統(tǒng)基于規(guī)則的系統(tǒng)在設(shè)計(jì)的時(shí)候沒(méi)有考慮加入與深度學(xué)習(xí)相關(guān)接口，而且代碼庫(kù)經(jīng)過(guò)多年發(fā)展已經(jīng)相對(duì)固化，為引入深度學(xué)習(xí)而對(duì)代碼進(jìn)行重構(gòu)成本很高，

“但輕舟智航在2019年開(kāi)始構(gòu)建決策規(guī)劃算法棧時(shí)就考慮到了AI的廣泛使用，并在各個(gè)接口層面都事先考慮到了模型引入后的情況，針對(duì)性地做了架構(gòu)調(diào)整”。

據(jù)一位曾在某頭部Robotaxi公司擔(dān)任規(guī)控算法負(fù)責(zé)人的資深專(zhuān)家說(shuō)，在規(guī)控中引入深度學(xué)習(xí)后，代碼重寫(xiě)的工作量非常大，因?yàn)樯婕霸诰€、離線、仿真等多個(gè)系統(tǒng)的改造。

筆者曾經(jīng)在互聯(lián)網(wǎng)行業(yè)多次聽(tīng)過(guò)用戶抱怨，為什么某某軟件的程序員面對(duì)臃腫的系統(tǒng)一直選擇打補(bǔ)丁而不是重構(gòu)。這個(gè)例子在某種程度上與用混合式規(guī)控算法替代基于規(guī)則的規(guī)控算法時(shí)所面臨的問(wèn)題相同——重構(gòu)的效益很低。

你重寫(xiě)了，系統(tǒng)運(yùn)行水平的改進(jìn)是有限的，但你卻要為此付出巨大的成本，這種“吃力不一定討好”的事情對(duì)任何一家企業(yè)都是“無(wú)法承受之重”。這一顧慮也讓自動(dòng)駕駛公司對(duì)混合式規(guī)控算法內(nèi)心產(chǎn)生“只想遠(yuǎn)觀，不愿褻玩”的心理。

事實(shí)上，筆者在跟多家自動(dòng)駕駛公司的規(guī)控算法負(fù)責(zé)人/工程師交流后發(fā)現(xiàn)，不同于2014—2015年深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)被應(yīng)用于感知時(shí)的“場(chǎng)面”，目前，大家普遍對(duì)深度學(xué)習(xí)算法在規(guī)控環(huán)節(jié)的應(yīng)用“不著急”。

可以說(shuō)，大家更多地還是以一種“可有可無(wú)”的心態(tài)來(lái)開(kāi)展預(yù)研和實(shí)際應(yīng)用。

更具體一點(diǎn)說(shuō)，自動(dòng)駕駛公司知道在采用規(guī)則+深度學(xué)習(xí)算法的“混合式規(guī)控算法”是未來(lái)，但目前能用到混合式規(guī)控算法的場(chǎng)景也不多，那干脆招幾個(gè)人“讓他們自己慢慢預(yù)研去”。

所以，現(xiàn)階段，多數(shù)自動(dòng)駕駛公司對(duì)混合式規(guī)控算法的態(tài)度是：只在應(yīng)對(duì)匝道、十字路口等極少數(shù)場(chǎng)景時(shí)采用混合式規(guī)控算法；而過(guò)去用基于規(guī)則的算法已經(jīng)解決的corner case，只要沒(méi)發(fā)現(xiàn)“令人無(wú)法容忍”的問(wèn)題就“不動(dòng)”。

還有規(guī)控算法專(zhuān)家很直白地說(shuō)，具體用不用混合式規(guī)控算法還得看需求，這是個(gè)工程性的問(wèn)題。

根據(jù)以上邏輯，目前自動(dòng)駕駛公司對(duì)混合式規(guī)控算法的態(tài)度是“可有可無(wú)”，而未來(lái)混合式規(guī)控算法的應(yīng)用范圍也需要“打一個(gè)問(wèn)號(hào)”。

三、規(guī)則為主or 深度學(xué)習(xí)算法為主？

我們接著上一節(jié)的邏輯繼續(xù)探討。

有不少專(zhuān)家都認(rèn)為，無(wú)論深度學(xué)習(xí)算法、混合框架發(fā)展的多么成熟，規(guī)控算法永遠(yuǎn)是規(guī)則代碼占多數(shù)，深度學(xué)習(xí)算法僅扮演輔助角色。

他們給出的關(guān)鍵理由是：深度學(xué)習(xí)算法具有“不可解釋性”的特點(diǎn)，用深度學(xué)習(xí)算法去做預(yù)測(cè)和決策，遵循的是概率，而不是嚴(yán)格意義上的因果關(guān)系，因此，讓它去承擔(dān)規(guī)控的“第一責(zé)任人”，難免讓人“不放心”。

如領(lǐng)駿科技CEO楊文利博士說(shuō)：

“深度學(xué)習(xí)是黑箱，人理解的‘場(chǎng)景’和深度學(xué)習(xí)理解的‘場(chǎng)景’可能不一樣。之前有個(gè)diss人工智能的例子，在圖像上改幾個(gè)像素，人工智能就認(rèn)錯(cuò)了；在交通標(biāo)記上貼幾個(gè)黑膠布，特斯拉就認(rèn)不出來(lái)了。除非是像素級(jí)的‘一致’，否則人們認(rèn)為的‘同一場(chǎng)景’，在深度學(xué)習(xí)看來(lái)，極有可能是‘不同場(chǎng)景’。

“深度學(xué)習(xí)算法是基于輸入輸出的擬合，從輸入輸出特性上可以獲得更好的擬人性，但其實(shí)它很難理解駕駛的內(nèi)部邏輯關(guān)系?！搬槍?duì)用深度學(xué)習(xí)算法做決策出錯(cuò)的可能性，我們采用了混合決策架構(gòu)?！?/p>

某商用車(chē)無(wú)人駕駛公司CTO和某造車(chē)新勢(shì)力規(guī)控算法專(zhuān)家也持類(lèi)似觀點(diǎn)。

在9月底的一場(chǎng)技術(shù)交流活動(dòng)上，地平線CTO黃暢博士也談到了這個(gè)問(wèn)題，但黃暢認(rèn)為，在混合式規(guī)控算法中，深度學(xué)習(xí)將是主流，而規(guī)則僅作為“必要的輔助”——以免出現(xiàn)明顯的、在語(yǔ)義上都可以解釋的錯(cuò)誤?！?

黃暢解釋說(shuō)，根據(jù)他的經(jīng)驗(yàn)，對(duì)于一個(gè)已經(jīng)雕琢了很多年、調(diào)得很好的一套基于規(guī)則的系統(tǒng)，僅在某一個(gè)局部模塊引入深度學(xué)習(xí)，改善是非常有限的，甚至沒(méi)有改善?！耙?yàn)槠渌哪K還是基于規(guī)則去設(shè)計(jì)，在這種大框架下，你用深度學(xué)習(xí)算法替換一個(gè)模塊，那其他模塊跟這邊個(gè)新模塊適配的成本很高。整個(gè)驗(yàn)證的周期很長(zhǎng)，長(zhǎng)到你沒(méi)有耐心去完成。”

某Robotaxi公司規(guī)控算法負(fù)責(zé)人和輕舟規(guī)控算法專(zhuān)家同樣認(rèn)為，未來(lái)的規(guī)控算法是以深度學(xué)習(xí)為主，規(guī)則為輔。

輕舟規(guī)控算法專(zhuān)家說(shuō)，在輕舟智航，目前在預(yù)測(cè)環(huán)節(jié)，深度學(xué)習(xí)算法相關(guān)運(yùn)算（包括前處理，模型推理和后處理）占整體模塊運(yùn)行時(shí)間的比例已接近95%，在決策和規(guī)劃環(huán)節(jié)，深度學(xué)習(xí)算法運(yùn)算占比也已達(dá)到了30%左右。

“不太容易量化，但總的算下來(lái)，在規(guī)控算法中，深度學(xué)習(xí)算法占比應(yīng)該有50%-60%?！?/p>

他認(rèn)為，最終，規(guī)控算法80%-90%的運(yùn)算時(shí)間會(huì)花在深度學(xué)習(xí)算法上。并且，不同于楊文利博士在前面提到的“底層控制算法中沒(méi)必要用到AI”，他認(rèn)為，控制算法是以規(guī)則為主，但也可以使用深度學(xué)習(xí)模型優(yōu)化控制的參數(shù)，增加算法的適應(yīng)性。

他指出：

“如果說(shuō)之前產(chǎn)業(yè)里對(duì)‘AI為主’還是‘規(guī)則為主’存在爭(zhēng)議，是可以理解的，但特斯拉最近一次AI DAY上公布出的信息已經(jīng)顯示，特斯拉大量使用深度學(xué)習(xí)的規(guī)控算法表現(xiàn)非常亮眼，這從側(cè)面反映了馬斯克的‘第一性原理’在某種意義上也可以適用于基于深度學(xué)習(xí)的規(guī)控算法：如果人類(lèi)的大腦作為一個(gè)復(fù)雜的神經(jīng)網(wǎng)絡(luò)，能夠通過(guò)大量的經(jīng)驗(yàn)學(xué)會(huì)駕駛，那規(guī)控算法也可以利用深度學(xué)習(xí)去獲得更好的性能和表現(xiàn)。”

深度學(xué)習(xí)算法存在一個(gè)很大的爭(zhēng)議即它的“不可解釋性”，那么，如果某個(gè)場(chǎng)景從“未知”變成“已知”了，我們是否需要再在算法里面加一個(gè)規(guī)則把它“確定下來(lái)”？

對(duì)筆者的這一問(wèn)題，某Robotaxi公司規(guī)控算法專(zhuān)家認(rèn)為，通過(guò)規(guī)則將AI對(duì)場(chǎng)景辯識(shí)的不確定性確定化，“具有可行性”；但黃暢和輕舟規(guī)控算法專(zhuān)家則認(rèn)為“不可行”“也沒(méi)必要”。

黃暢說(shuō)：

“我們不能強(qiáng)求這個(gè)系統(tǒng)一定要‘可解釋’——因?yàn)?，所謂‘可解釋’就是拿規(guī)則去約束它，甚至完全依賴規(guī)則，像專(zhuān)家系統(tǒng)一樣，結(jié)果就是，在A城市跑得很溜的系統(tǒng)，到B城市去跑時(shí)還需要大量的工程師做調(diào)試才行；并且，它會(huì)讓那些復(fù)雜的、無(wú)法用人為規(guī)則描述的corner case‘無(wú)解’了?！?/p>

可見(jiàn)，強(qiáng)求系統(tǒng)一定要“可解釋”，這就又回到了本文第一節(jié)所提到的“規(guī)則的局限性”上了。

黃暢認(rèn)為，在將深度學(xué)習(xí)算法引入規(guī)控時(shí)，我們不必過(guò)分糾結(jié)于系統(tǒng)是否“可解釋”。

“我跟你交流，我們之間，我能夠充分理解你，并能推理你的整套邏輯，但對(duì)你底層的一些直覺(jué)、一些隱藏的特質(zhì)，我卻是不知道的（甚至你自己也未必知道），但這并不影響我們能建立起信任感、能順暢地交流。同理，我們也不必用是否‘可解釋’去限制去探索深度學(xué)習(xí)算法的應(yīng)用邊界。

“我前段時(shí)間看了一篇帖子，說(shuō)深度學(xué)習(xí)和經(jīng)典的統(tǒng)計(jì)學(xué)之間的區(qū)別在于經(jīng)典統(tǒng)計(jì)學(xué)依然嘗試用規(guī)則模型的方式讓整個(gè)系統(tǒng)變得‘可解釋’，但深度學(xué)習(xí)突破了這一點(diǎn)，它甚至非常極端去優(yōu)化最終的目標(biāo)。

“人會(huì)犯錯(cuò)，規(guī)則系統(tǒng)會(huì)犯錯(cuò)，數(shù)據(jù)系統(tǒng)也會(huì)犯錯(cuò)，但是如果在廣泛統(tǒng)計(jì)學(xué)意義上，當(dāng)數(shù)據(jù)規(guī)模足夠大的時(shí)候，深度學(xué)習(xí)算法會(huì)比規(guī)則系統(tǒng)強(qiáng)一個(gè)數(shù)量級(jí)，因此，我們可以放心地使用它。

“在這個(gè)基礎(chǔ)上，把環(huán)境模型這樣的東西可視化，讓人可以理解，再在規(guī)劃的最后一個(gè)階段引入少量的必要的規(guī)則去約束深度學(xué)習(xí)算法，這樣就足夠了?！?/p>

黃暢認(rèn)為，在算法2.0時(shí)代，AI有能力去完成自適應(yīng)，因此，自動(dòng)駕駛公司可能要設(shè)計(jì)一些“在算法之上的算法”，使得它能夠幫助基礎(chǔ)的算法更好地在應(yīng)用場(chǎng)景中去迭代、去適應(yīng)。

輕舟規(guī)控算法專(zhuān)家認(rèn)為，筆者提到的“當(dāng)一個(gè)場(chǎng)景從未知變成已知的時(shí)候，就用規(guī)則把應(yīng)對(duì)方案給‘確定’下來(lái)”的設(shè)想在實(shí)踐中很難行得通，因?yàn)?，現(xiàn)實(shí)中的場(chǎng)景往往是動(dòng)態(tài)調(diào)整的——起初可能是清晰的，但變著變著，就“模糊不清”了，因而很難用規(guī)則將其描述清楚。

關(guān)于深度學(xué)習(xí)算法的“不可解釋性”，他的回應(yīng)是：“有好多人會(huì)說(shuō)深度學(xué)習(xí)‘不可解釋’，但其實(shí)如果你仔細(xì)地去設(shè)計(jì)你的深度學(xué)習(xí)算法，它可也以實(shí)現(xiàn)‘可解釋性’的效果，甚至，這種可解釋性可能會(huì)比規(guī)則還強(qiáng)?！?/p>

他舉了這樣一個(gè)例子：自動(dòng)駕駛車(chē)輛在十字路口右轉(zhuǎn)彎，需要避讓直行而來(lái)的車(chē)，這個(gè)時(shí)候，很難用規(guī)則窮舉在直行車(chē)輛的車(chē)速是多少、兩車(chē)之間的距離是多少時(shí)自動(dòng)駕駛系統(tǒng)應(yīng)該采取什么措施，但如果是用深度學(xué)習(xí)算法，只要給出自車(chē)和潛在障礙物（直行車(chē)輛）的位置和狀態(tài)，以及一些相關(guān)的環(huán)境和歷史信息，經(jīng)過(guò)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)能夠就能夠算出“你讓我”或“我讓你”的概率分別是多少，這跟人開(kāi)車(chē)做決策的思路是一樣的。“概率，比規(guī)則更容易解釋?！?/p>

說(shuō)到這里，筆者想到一個(gè)看似跟本文主題不直接相關(guān)、但又有很深的關(guān)聯(lián)的話題——什么是人的“直覺(jué)”？

之前經(jīng)?？吹揭恍┳銎髽I(yè)管理研究的人說(shuō)，企業(yè)家們?cè)谥卮笫马?xiàng)決策的關(guān)鍵時(shí)刻，依賴的往往不是調(diào)研，而是直覺(jué)。很少有人能解釋清楚這個(gè)直覺(jué)究竟是什么，但筆者覺(jué)得，這個(gè)“直覺(jué)”，其實(shí)就是數(shù)據(jù)驅(qū)動(dòng)的“深度學(xué)習(xí)算法”。

所謂的“直覺(jué)準(zhǔn)”，并不是什么天分，其背后都是日積月累的信息及在此基礎(chǔ)上形成的認(rèn)知。類(lèi)似于大數(shù)據(jù)分析，結(jié)論和信息之間有相關(guān)性，但沒(méi)有因果關(guān)系，或者是因果關(guān)系不夠直接、不夠明顯，人很難用邏輯解釋清楚，便說(shuō)這是“直覺(jué)”。

從這個(gè)意義上說(shuō)，我們確實(shí)不必強(qiáng)求深度學(xué)習(xí)算法一定要“可解釋”。

不過(guò)，毫末智行的規(guī)控算法專(zhuān)家認(rèn)為，即使上了大量AI模型做認(rèn)知，那也一定是場(chǎng)景化的，必須有顯式的、可解釋的“意圖和意義”，“這是我們的原則”。

這位專(zhuān)家說(shuō)：

“深度學(xué)習(xí)的強(qiáng)項(xiàng)在于可以隨機(jī)應(yīng)變，各種復(fù)雜環(huán)境都能快速給出一個(gè)解，但它的黑盒特質(zhì)導(dǎo)致有時(shí)候給的解會(huì)出錯(cuò)，而基于規(guī)則的算法其實(shí)都是‘我知道我知道’以及‘我知道我不知道’，它對(duì)‘未知’的復(fù)雜場(chǎng)景給出一個(gè)正確解的可能性比深度學(xué)習(xí)方法要低，但‘我做不出正確答案并不影響我在看到答案之后評(píng)判它是對(duì)是錯(cuò)啊’。因此，AI為做題主力，規(guī)則負(fù)責(zé)校驗(yàn)是我們使用的方式?！?/p>

小馬智行的規(guī)控算法專(zhuān)家認(rèn)為，現(xiàn)階段，深度學(xué)習(xí)算法很難保證安全，所以在，未來(lái)很長(zhǎng)時(shí)間內(nèi)都一定是傳統(tǒng)算法和深度學(xué)習(xí)相結(jié)合。

這位規(guī)控算法專(zhuān)家說(shuō)：

“我們認(rèn)為，L2很可能可以達(dá)到AI為主的狀態(tài)，因?yàn)锳I無(wú)需應(yīng)對(duì)好所有的corner case——畢竟還有司機(jī)可以做最后的安全保證，特斯拉在AI Day上的分享也說(shuō)明了這一點(diǎn)。

“但L4的算法在未來(lái)很長(zhǎng)一段時(shí)間內(nèi)都不太可能做到以AI為主，主要原因還是它的可解釋性和對(duì)有安全風(fēng)險(xiǎn)的corner case處理能力的問(wèn)題；不過(guò)，隨著技術(shù)的進(jìn)步，我們相信算法中AI的部分會(huì)越來(lái)越多。

“事實(shí)上，傳統(tǒng)規(guī)控算法絕不是規(guī)則的堆砌，好的傳統(tǒng)規(guī)控算法更多是對(duì)場(chǎng)景歸納總結(jié)后抽象出來(lái)的數(shù)學(xué)模型——借助不同的數(shù)學(xué)工具對(duì)規(guī)劃問(wèn)題建模并通過(guò)優(yōu)化方式求解，它有能力刻畫(huà)問(wèn)題的本質(zhì)，從根本上保證理論范圍內(nèi)的安全性。

“因此，所以引入深度學(xué)習(xí)，并不會(huì)涉及到大量的代碼重寫(xiě)，更多應(yīng)該是如何結(jié)合好傳統(tǒng)算法和深度學(xué)習(xí)，用傳統(tǒng)算法保證行車(chē)的安全性?？梢哉f(shuō)，傳統(tǒng)規(guī)控算法和AI模型并不是一個(gè)簡(jiǎn)單的替代關(guān)系，算法研發(fā)也是逐步迭代的，不存在要花很大成本一下子把規(guī)則代碼替換成AI模型的需求，而是循序漸進(jìn)的。”

而一位主機(jī)廠的架構(gòu)師則提出這樣一個(gè)建議：在主系統(tǒng)里跑基于規(guī)則的算法，在影子模式里跑深度學(xué)習(xí)算法，等深度學(xué)習(xí)算法的訓(xùn)練效果超過(guò)規(guī)則的時(shí)候，再將深度學(xué)習(xí)算法部署到主系統(tǒng)中去。

附. 兩個(gè)關(guān)于深度學(xué)習(xí)算法應(yīng)用于自動(dòng)駕駛規(guī)控中的案例

7月底，九章智駕在蘇州高鐵新城舉辦過(guò)一場(chǎng)主題為“數(shù)據(jù)驅(qū)動(dòng)的規(guī)控算法”的技術(shù)沙龍，在這次沙龍上，輕舟智航和智加的專(zhuān)家通過(guò)簡(jiǎn)單的例子給與會(huì)者們分享了一下深度學(xué)習(xí)算法如何應(yīng)用于自動(dòng)駕駛規(guī)控。我們?cè)诮?jīng)過(guò)專(zhuān)家當(dāng)事人同意后將這兩個(gè)案例分享如下——

1.智加：通過(guò)深度學(xué)習(xí)算法降低油耗

智加對(duì)數(shù)據(jù)驅(qū)動(dòng)的決策的應(yīng)用，也經(jīng)歷了以規(guī)則為主過(guò)度到規(guī)則+數(shù)據(jù)混合決策的過(guò)程。智加科技首席科學(xué)家崔迪瀟曾說(shuō)，他們認(rèn)為換道時(shí)機(jī)很適合用深度學(xué)習(xí)算法來(lái)做輔助做決策。

因?yàn)楦删€物流對(duì)時(shí)效和油耗要求非常高，一方面不合適的換道時(shí)機(jī)會(huì)導(dǎo)致司機(jī)使用自動(dòng)換道功能比例降低，另一方面以規(guī)則為主的換道算法偏保守，如果僅僅在前車(chē)車(chē)速過(guò)低時(shí)才觸發(fā)“換道”指令，會(huì)導(dǎo)致更多的后續(xù)剎車(chē)，進(jìn)而帶來(lái)整個(gè)時(shí)效和油耗的損耗。為了降低油耗，自動(dòng)駕駛系統(tǒng)通過(guò)收集數(shù)據(jù)來(lái)觀察司機(jī)如何做決策，再去研究更類(lèi)人的換道決策。

這一方案經(jīng)歷過(guò)兩個(gè)階段。

第一階段為換道決策由司機(jī)“自觸發(fā)”形式變?yōu)椤跋到y(tǒng)建議”。在這個(gè)階段，工程師會(huì)不斷去研究為什么司機(jī)在某個(gè)點(diǎn)會(huì)做出換道決策，進(jìn)而形成換道建議的規(guī)則。在系統(tǒng)給出換道建議后，如果司機(jī)允許換道，則系統(tǒng)認(rèn)為此時(shí)的決策是合適的，如果司機(jī)認(rèn)為此時(shí)不應(yīng)該換道，則司機(jī)可不采納換道建議。

第二階段是，工程師還會(huì)在不同場(chǎng)景采集人工換道的數(shù)據(jù)，并結(jié)合第一階段收集的系統(tǒng)換道決策和司機(jī)換道決策不一致場(chǎng)景的數(shù)據(jù)（如司機(jī)觸發(fā)換道，系統(tǒng)未觸發(fā)；或系統(tǒng)觸發(fā)換道，但司機(jī)未采納）進(jìn)行標(biāo)注和模型訓(xùn)練，得到換道決策模型，改進(jìn)系統(tǒng)原本的規(guī)控算法，進(jìn)一步提高節(jié)油性能。

2.輕舟智航：用深度學(xué)習(xí)算法提升系統(tǒng)的“擬人性”

據(jù)輕舟智航預(yù)測(cè)和規(guī)控專(zhuān)家還介紹，現(xiàn)階段，輕舟規(guī)控算法給深度學(xué)習(xí)預(yù)留了大量的接口，并積極研發(fā)深度學(xué)習(xí)規(guī)控算法。輕舟智航的整體規(guī)控算法架構(gòu)的最終目標(biāo)是實(shí)現(xiàn)AI First（深度學(xué)習(xí)算法優(yōu)先），讓模型做大部分行為的輸出，然后再用規(guī)則去做互補(bǔ)（規(guī)則主要處理安全相關(guān)的問(wèn)題）。

輕舟智航認(rèn)為，規(guī)控能力將是城市NOA功能差異化的重要體現(xiàn)。目前，輕舟智航已開(kāi)始嘗試在城市NOA方案的規(guī)控環(huán)節(jié)盡可能多運(yùn)用AI來(lái)處理，讓系統(tǒng)在多數(shù)情況下的決策“接近人”、在極端情況下的決策“超越人”。

例如，對(duì)變道時(shí)機(jī)選擇、匝道m(xù)erge時(shí)機(jī)選擇、路口博弈等在使用城市NOA會(huì)遇到的某些規(guī)劃關(guān)鍵場(chǎng)景，輕舟已經(jīng)有專(zhuān)門(mén)的深度學(xué)習(xí)算法來(lái)進(jìn)行處理。

為保證深度學(xué)習(xí)算法的可預(yù)見(jiàn)性和可控性，輕舟智航會(huì)通過(guò)對(duì)輸入和輸出設(shè)置校驗(yàn)的方式，來(lái)確保輸入數(shù)據(jù)是否符合當(dāng)前設(shè)計(jì)的需求。在輸入層面會(huì)使用規(guī)則的方式來(lái)選擇深度學(xué)習(xí)算法適用的場(chǎng)景，確保模型的輸入的合理性，限定模型運(yùn)行在設(shè)計(jì)的問(wèn)題范圍之內(nèi)，在輸出層面也會(huì)使用規(guī)則進(jìn)行輸出的校驗(yàn)，保證輸出達(dá)到預(yù)設(shè)的效果。同時(shí)，如果遇到模型處理不好的場(chǎng)景，也可以自動(dòng)記錄時(shí)間點(diǎn)和場(chǎng)景相關(guān)信息，后續(xù)通過(guò)數(shù)據(jù)閉環(huán)來(lái)更新模型，讓模型泛化能力更強(qiáng)，適應(yīng)更多場(chǎng)景。

目前，在輕舟智航，通過(guò)深度學(xué)習(xí)（比如模仿學(xué)習(xí)或者強(qiáng)化學(xué)習(xí)）來(lái)生成自車(chē)“未來(lái)可能的軌跡”這一技術(shù)已經(jīng)比較成熟，通過(guò)收集大量專(zhuān)家駕駛的軌跡來(lái)訓(xùn)練模型，現(xiàn)在模型生成的軌跡在90%情況下都無(wú)需做后續(xù)的修飾；但在10%的情況下，深度學(xué)習(xí)生成的軌跡效果可能不好，甚至有安全風(fēng)險(xiǎn)，這時(shí)候就需要一個(gè)框架能夠去修正/修改它。輕舟使用其國(guó)內(nèi)在首創(chuàng)的時(shí)空聯(lián)合算法（一種基于數(shù)值優(yōu)化的算法）對(duì)深度學(xué)習(xí)生成的軌跡進(jìn)行微調(diào)。

輕舟規(guī)控算法專(zhuān)家說(shuō)，時(shí)空聯(lián)合規(guī)劃算法相比傳統(tǒng)的橫向縱向分離更適合與深度學(xué)習(xí)算法協(xié)同使用。因?yàn)椋蒙疃葘W(xué)習(xí)算法生成的軌跡本身其實(shí)就是一個(gè)時(shí)空聯(lián)合的軌跡，這個(gè)軌跡上面不僅有位置、速度、方向信息，還有時(shí)間信息。因此，時(shí)空聯(lián)合規(guī)劃算法就能較好地跟模型出來(lái)的結(jié)果結(jié)合到一起，進(jìn)而能夠無(wú)縫地給深度學(xué)習(xí)算法加上安全防護(hù)。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

算法

算法

+關(guān)注

關(guān)注
23

文章
4606

瀏覽量
92809
自動(dòng)駕駛

自動(dòng)駕駛

+關(guān)注

關(guān)注
784

文章
13782

瀏覽量
166351
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5497

瀏覽量
121097

原文標(biāo)題：萬(wàn)字長(zhǎng)文解讀深度學(xué)習(xí)算法在自動(dòng)駕駛規(guī)控中的應(yīng)用

文章出處：【微信號(hào)：阿寶1990，微信公眾號(hào)：阿寶1990】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

Perforce SAST專(zhuān)家詳解：自動(dòng)駕駛汽車(chē)的安全與技術(shù)挑戰(zhàn)，Klocwork、Helix QAC等靜態(tài)代碼分析成必備合規(guī)性工具

自動(dòng)駕駛汽車(chē)的未來(lái)已來(lái)，你怎么看？期待還是擔(dān)憂？本文從自動(dòng)駕駛技術(shù)、法律法規(guī)、合規(guī)性工具等多個(gè)角度，解讀自動(dòng)駕駛汽車(chē)的安全與挑戰(zhàn)，歡迎一讀！

發(fā)表于 11-26 13:53 ?879次閱讀

Perforce SAST專(zhuān)家詳解：<b class='flag-5'>自動(dòng)駕駛</b>汽車(chē)的安全與技術(shù)挑戰(zhàn)，Klocwork、Helix QAC等靜態(tài)代碼分析成必備合<b class='flag-5'>規(guī)</b>性工具

MEMS技術(shù)在自動(dòng)駕駛汽車(chē)中的應(yīng)用

MEMS技術(shù)在自動(dòng)駕駛汽車(chē)中的應(yīng)用主要體現(xiàn)在傳感器方面，這些傳感器為自動(dòng)駕駛汽車(chē)提供了關(guān)鍵的環(huán)境感知和數(shù)據(jù)采集能力。以下是對(duì)MEMS技術(shù)在

發(fā)表于 11-20 10:19 ?312次閱讀

NPU在深度學(xué)習(xí)中的應(yīng)用

設(shè)計(jì)的硬件加速器，它在深度學(xué)習(xí)中的應(yīng)用日益廣泛。 1. NPU的基本概念 NPU是一種專(zhuān)門(mén)針對(duì)深度學(xué)習(xí)算

發(fā)表于 11-14 15:17 ?490次閱讀

Mobileye端到端自動(dòng)駕駛解決方案的深度解析

強(qiáng)大的技術(shù)優(yōu)勢(shì)。 Mobileye的端到端解決方案概述 1.1 什么是端到端自動(dòng)駕駛？端到端自動(dòng)駕駛解決方案是一種新型的智能系統(tǒng)架構(gòu)，旨在通過(guò)AI學(xué)習(xí)從感知到?jīng)Q策再到操作的全流程。Mobileye的端到端方案依賴于

發(fā)表于 10-17 09:35 ?344次閱讀

FPGA在自動(dòng)駕駛領(lǐng)域有哪些優(yōu)勢(shì)?

FPGA（Field-Programmable Gate Array，現(xiàn)場(chǎng)可編程門(mén)陣列）在自動(dòng)駕駛領(lǐng)域具有顯著的優(yōu)勢(shì)，這些優(yōu)勢(shì)使得FPGA成為自動(dòng)駕駛技術(shù)中不可或缺的一部分。以下是FP

發(fā)表于 07-29 17:11

FPGA在自動(dòng)駕駛領(lǐng)域有哪些應(yīng)用？

是FPGA在自動(dòng)駕駛領(lǐng)域的主要應(yīng)用：一、感知算法加速圖像處理：自動(dòng)駕駛中需要通過(guò)攝像頭獲取并識(shí)別道路信息和行駛環(huán)境，這涉及到大量的圖像處

發(fā)表于 07-29 17:09

自動(dòng)駕駛識(shí)別技術(shù)有哪些

自動(dòng)駕駛的識(shí)別技術(shù)是自動(dòng)駕駛系統(tǒng)中的重要組成部分，它使車(chē)輛能夠感知并理解周?chē)h(huán)境，從而做出智能決策。自動(dòng)駕駛識(shí)別技術(shù)主要包括多種傳感器及其融合技術(shù)，以及基于這些傳感器數(shù)據(jù)的處理和識(shí)別

發(fā)表于 07-23 16:16 ?626次閱讀

深度學(xué)習(xí)算法在集成電路測(cè)試中的應(yīng)用

隨著半導(dǎo)體技術(shù)的快速發(fā)展，集成電路（IC）的復(fù)雜性和集成度不斷提高，對(duì)測(cè)試技術(shù)的要求也日益增加。深度學(xué)習(xí)算法作為一種強(qiáng)大的數(shù)據(jù)處理和模式識(shí)別工具，在集成電路測(cè)試領(lǐng)域展現(xiàn)出了巨大的應(yīng)用潛

發(fā)表于 07-15 09:48 ?947次閱讀

深度學(xué)習(xí)在自動(dòng)駕駛中的關(guān)鍵技術(shù)

隨著人工智能技術(shù)的飛速發(fā)展，自動(dòng)駕駛技術(shù)作為其中的重要分支，正逐漸走向成熟。在自動(dòng)駕駛系統(tǒng)中，深度學(xué)習(xí)

發(fā)表于 07-01 11:40 ?751次閱讀

標(biāo)貝數(shù)據(jù)采集標(biāo)注在自動(dòng)駕駛場(chǎng)景中落地應(yīng)用實(shí)例

AI數(shù)據(jù)服務(wù)作為人工智能和機(jī)器學(xué)習(xí)的基礎(chǔ)，在自動(dòng)駕駛領(lǐng)域中有著重要地位。與其他人工智能應(yīng)用場(chǎng)景相比，自動(dòng)駕駛的落地場(chǎng)景相對(duì)復(fù)雜，想要讓汽車(chē)本身的算法

發(fā)表于 05-28 14:22 ?542次閱讀

未來(lái)已來(lái)，多傳感器融合感知是自動(dòng)駕駛破局的關(guān)鍵

方面表示，這是L4級(jí)自動(dòng)駕駛公司和車(chē)企為了打造Robotaxi量產(chǎn)車(chē)，在國(guó)內(nèi)成立的首個(gè)合資公司。首款車(chē)型已完成產(chǎn)品定義，正在進(jìn)行設(shè)計(jì)造型的聯(lián)合評(píng)審，計(jì)劃明年實(shí)現(xiàn)量產(chǎn)。未來(lái)已來(lái)，2024年是全球L3

發(fā)表于 04-11 10:26

邊緣計(jì)算與自動(dòng)駕駛系統(tǒng)如何結(jié)合

當(dāng)前自動(dòng)駕駛中，大規(guī)模的人工智能算法模型和大規(guī)模數(shù)據(jù)集中化分析均放在云端進(jìn)行。因?yàn)椋贫藫碛写罅康挠?jì)算資源，可以在極短的時(shí)間內(nèi)完成數(shù)據(jù)的處理，但是僅依靠云端為

發(fā)表于 03-25 09:26 ?533次閱讀

FPGA在深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈鶪PU

、筆記本電腦或機(jī)架式服務(wù)器上訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí)，這不是什么大問(wèn)題。但是，許多部署深度學(xué)習(xí)模型的環(huán)境對(duì) GPU 并不友好，比如自動(dòng)駕駛汽車(chē)、工廠、機(jī)器人和許多智慧城市環(huán)境，在這些環(huán)境中硬件必

發(fā)表于 03-21 15:19

自動(dòng)駕駛發(fā)展問(wèn)題及解決方案淺析

汽車(chē)的發(fā)展提供有益的參考。 ? 自動(dòng)駕駛汽車(chē)發(fā)展的現(xiàn)狀與挑戰(zhàn) （一）技術(shù)難題 自動(dòng)駕駛汽車(chē)的核心在于通過(guò)先進(jìn)的傳感器、算法和控制系統(tǒng)實(shí)現(xiàn)車(chē)輛的自主駕駛。然而，

發(fā)表于 03-14 08:38 ?1127次閱讀

語(yǔ)音數(shù)據(jù)集在自動(dòng)駕駛中的應(yīng)用與挑戰(zhàn)

隨著人工智能技術(shù)的快速發(fā)展，自動(dòng)駕駛汽車(chē)已經(jīng)成為交通領(lǐng)域的研究熱點(diǎn)。語(yǔ)音數(shù)據(jù)集在自動(dòng)駕駛中發(fā)揮著重要的作用，為駕駛員和乘客提供了更加便捷和安全的交互方式。本文將詳細(xì)介紹語(yǔ)音數(shù)據(jù)集

發(fā)表于 12-25 09:48 ?552次閱讀