RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于人工智能無人車的研究案例

獨愛72H ? 來源:劉林華 ? 作者:電子發(fā)燒友 ? 2019-01-01 11:15 ? 次閱讀

清華大學(xué)自動化系系統(tǒng)工程研究所副教授李力作為第一作者以及林懿倫,鄭南寧,王飛躍,劉躍虎,曹東璞,王坤峰,黃武陵等發(fā)表了一篇關(guān)于人工智能測試和無人車測試的英文論文《Artificial intelligence test: a case study of intelligent vehicles》,集中探討了人工智能應(yīng)用領(lǐng)域中關(guān)于智能性的測試和設(shè)計方法。文章認(rèn)為,智能性測試和機(jī)器學(xué)習(xí)的過程類似,兩者如同一個硬幣的兩面,“終生測試”將是一場持久戰(zhàn)。文章最后還提出了虛實結(jié)合的平行測試方法。

1. 概述

本篇文章主要是講述在人工智能應(yīng)用領(lǐng)域?qū)χ悄苄缘臏y試,基于場景和任務(wù)的測試體系的描述,以及介紹了如何設(shè)計智能性測試中基于仿真的測試及其測試指標(biāo),并在智能車這一典型人工智能領(lǐng)域舉例說明。

2. 無人駕駛和人工智能

人工智能(AI)通常是指機(jī)器表現(xiàn)出來的和人類類似的智能?,F(xiàn)如今,人工智能已經(jīng)極大的改變了我們的生活,大到自動駕駛汽車,小到掃地機(jī)器人,都是人工智能的應(yīng)用領(lǐng)域。我們堅信,人工智能將會在未來的20年內(nèi)進(jìn)一步的改變我們生活包括健康,教育,娛樂,安全等各個領(lǐng)域。在享受人工智能的帶來的各種便利的同時,也帶來一些疑問:如何保證人工智能機(jī)器按照人類設(shè)計的思路來正確運行?無人駕駛車輛是否會在某些極端環(huán)境中失控照成事故?廚房機(jī)器人是否會把房子點燃?基于以上,我們迫切的需要對人工智能的可靠性進(jìn)行規(guī)范的測試和衡量。

為了回答以上問題,我們需要思索一下人工智能的定義:維基百科對于人工智能的定義:機(jī)器所展現(xiàn)出來的智能;我們對其進(jìn)行擴(kuò)展,給出的定義:人工智能是指機(jī)器(在同樣的任務(wù)中)表現(xiàn)出(和人類似的、或一樣的、甚至是超過人類的)智能,明斯基(Minsky 1968)對人工智能給出過類似的定義“[AI] is the science of making machines capable of performing tasks that would require intelligence if done by [humans]”。 明斯基的定義更加注重對完成任務(wù)的所需要的智能(原因?qū)颍?,而本文的定義則更加傾向于所完成的任務(wù)所表現(xiàn)的智能(結(jié)果導(dǎo)向)。

同時必須注意到的是,為測試智能性所選擇的任務(wù)也是有特定針對性的,不同的任務(wù)測試不同方面的智能性,例如,一個文盲可能能成為一個很好的司機(jī),但是一個眼盲的飽學(xué)之士卻無法開車。

圖靈測試是迄今為止我們所知的最早的針對智能性的測試。圖靈測試是圖靈對于人工智能的睿智思考,其核心思想是:要求計算機(jī)在沒有直接物理接觸的情況下,盡可能把自己偽裝成人類回答人類的詢問。但是,圖靈測試在無人車智能性測試方面也無法全盤套用。

當(dāng)今,智能性測試有越來越多的應(yīng)用領(lǐng)域,那么我們到底應(yīng)該用何種方法來測試智能性呢?我們所提出的基于任務(wù)的智能性測試方法又有哪些優(yōu)越性呢?接下來,我們將會列舉智能性測試的難點,以及我們提出測試方法如何解決這些難點,以及如何更好的設(shè)計基于“任務(wù)”的測試用例。

3. 無人駕駛智能的設(shè)計和測試

3.1. 智能性測試的困境

3.1.1. 任務(wù)的定義/描述

第一個困境是如何來更好的定義智能性測試中的任務(wù):

圖靈測試中最大的短板就是任務(wù)的描述。需要指出的是,當(dāng)今的無人駕駛車輛智能測試和中文屋等早期圖靈測試已經(jīng)有了很大差別:其一,早期圖靈測試并未明確的規(guī)定測試任務(wù)以及何種答案可以視為正確,這導(dǎo)致一些試圖通過圖靈測試的機(jī)器經(jīng)常采用摸棱兩可的方式來試圖避免直接回答。而當(dāng)今的無人駕駛車輛智能測試都對任務(wù)進(jìn)行了明確的界定;其二,早期圖靈測試有人來判定測試結(jié)果,而為了檢驗無人駕駛車輛的識別算法是否通過各種可能場景的測試,我們必須使用機(jī)器來幫助判定數(shù)以萬記的測試任務(wù)是否通過。

總之,我們需要建立一系列的可以量化的測試任務(wù),這是智能性測試最根本的基礎(chǔ)。

3.1.2. 任務(wù)的驗證

第二個困境是:如何保證被測智能機(jī)器在所遇到的所有場景中表現(xiàn)出其行為的一致性。因此需要保證任務(wù)測試的枚舉性/覆蓋性。

通俗的講,我們可以把任務(wù)看作是對智能機(jī)器測試的輸入,如果完成該任務(wù),輸出“是”,反之輸出“否”。對于一些相對簡單的智能性測試,通過枚舉所有可能的任務(wù)組合,我們可以窮盡可能的交通場景。如果車輛能通過所有這些場景,則車輛將足夠智能。但由于任務(wù)空間的時空連續(xù)性,枚舉是不可能完成的。因此,必須依賴虛擬采樣測試來加大如何合理采樣,在降低場景生成復(fù)雜度的同時,提升測試覆蓋性成為測試的關(guān)鍵技術(shù)。通過記錄受試車輛和其他車輛的軌跡,我們可以定量刻畫車輛的智能水平(駕駛性能)。

3.1.3. 仿真測試的設(shè)計

為了在有限的時間和財力內(nèi)盡量解決任務(wù)覆蓋問題,現(xiàn)在的研究者多采取仿真測試來彌補(bǔ)實地測試的不足[4]。由此出發(fā),研究者進(jìn)一步研究了如下諸多衍生問題:

1)如何保證虛擬測試中虛擬物行為的真實性;

2)如何保證虛擬測試中虛擬物表現(xiàn)的豐富性;

3)如何保證虛擬測試中場景和任務(wù)的覆蓋性;

4)如何實現(xiàn)虛擬測試中機(jī)器判定的正確性。

例如在仿真測試方面,目前的無人駕駛車輛研究者考慮了如何從現(xiàn)實采集的2D圖像數(shù)據(jù)中提取物體的3D屬性,并在3D引擎中重新渲染并產(chǎn)生新的2D虛擬測試數(shù)據(jù)。而另外一些研究者則考慮了如何基于生成式對抗網(wǎng)絡(luò)來直接從2D實測圖像數(shù)據(jù)來生成新的2D虛擬測試數(shù)據(jù)。

再者,測試標(biāo)準(zhǔn)的設(shè)定也是研究者探討的熱點之一。對于駕駛這類典型的多目標(biāo)問題,如何評價不同算法的優(yōu)劣并設(shè)計適應(yīng)不同用戶要求的測試標(biāo)準(zhǔn)尚有很大的難度。

3.1.4. 測試指標(biāo)的設(shè)定

測試指標(biāo)的設(shè)定的方法有幾種,第一種是要求智能機(jī)器做出類似人的行為表現(xiàn)。這種方法里首先需要確定人在完成該任務(wù)時會如何表現(xiàn),然后再根據(jù)智能機(jī)器在完成該任務(wù)的過程中的表現(xiàn)和人的表現(xiàn)的區(qū)別來做判定。

第二種測試指標(biāo)設(shè)定方式是要求智能機(jī)器有最好的表現(xiàn)。比如,在設(shè)計針對圍棋的人工智能機(jī)器時,我們要求其能夠一直勝利,而不是像一個人類選手的方式去下棋。對于這一類目標(biāo)相對簡單的情況下,這種方式更加合適。在智能車測試中,目標(biāo)往往比較復(fù)雜,不能像圍棋一樣以贏得棋局為目標(biāo),需要考慮行駛安全性,速度,燃油效率等其他復(fù)雜的因素。以不同的因素為目標(biāo)會導(dǎo)致完全不同的設(shè)計。例如在2016,2017年的中國無人車未來挑戰(zhàn)賽中,智能車通過設(shè)定的10個特定場景任務(wù)的時間被作為評價指標(biāo)之一,如果發(fā)生了碰撞,壓線,闖紅燈,也會扣去相應(yīng)的分?jǐn)?shù)。當(dāng)人的感受被納入考察因素的時候,考慮到每個人對于同一件事物的感受都會有一定的區(qū)別,測試指標(biāo)的設(shè)定會變的更加艱難。

3.2. 智能車的智能性測試

我們這里以智能車的智能性測試為例,來說明我們的觀點:

3.3.1. 智能性測試中測試任務(wù)的設(shè)定

傳統(tǒng)的無人駕駛車輛智能測試主要分為兩大流派:場景測試流派和功能測試流派。

1) 場景測試

往往是指處在特定時空中的測試系統(tǒng)。例如,交通場景一般指的是由眾多交通參與者和特定道路環(huán)境共同構(gòu)成的交通系統(tǒng)。如果受試車輛能夠自主行駛通過該交通系統(tǒng),則稱為通過該特定場景的駕駛測試。例如DARPA 2005 年無人車挑戰(zhàn)賽便選取了212 公里的沙漠道路作為測試場景(其實2004年也是選擇了沙漠作為測試場景,但是“全軍覆沒”,相比之下,2005年則是一段光輝歲月)(Grand Challenge 2005)。DARPA 2007 年無人車挑戰(zhàn)賽則選取了96 公里的城市道路作為測試場景(Urban Challenge 2007)。

2) 功能測試

功能測試更加側(cè)重?zé)o人駕駛的單項或多項功能實現(xiàn)。依據(jù)人類智能的功能歸類方式,可將駕駛智能劃分成信息感知、分析決策、動作執(zhí)行等較為概括的三大類能力。例如路徑規(guī)劃就屬于分析決策類的單項智能。該定義方式強(qiáng)調(diào)的是實現(xiàn)這些單項智能的方法和技術(shù)上的共性。但由于不能與具體的交通場景以及無人駕駛測試任務(wù)聯(lián)系起來,在衡量無人駕駛的智能水平方面有所不足。功能測試的隱含假設(shè)是,如果無人駕駛通過某種功能的一次或幾次測試,那么,以后需要使用該功能時也可以順利執(zhí)行。這一假設(shè)看似合乎邏輯,但事實證明,也過于樂觀。此外,目前的功能測試還存在其它問題:

單一功能測試較多,綜合測試涉及較少,無法檢驗多項功能之間的協(xié)同配合能力

缺少完備、公平、公開的Benchmark集。

我們認(rèn)為,無人駕駛車輛的智能可以用廣義的語義網(wǎng)絡(luò)來定義。

語義網(wǎng)絡(luò)是一種采用網(wǎng)絡(luò)形式表示人類知識的方法,如今已在人工智能領(lǐng)域中得到了比較廣泛的應(yīng)用。語義網(wǎng)絡(luò)用有向圖來表達(dá)復(fù)雜的概念及其之間的相互關(guān)系。圖中的頂點表示概念,而邊則表示這些概念間的語義關(guān)系。

針對無人駕駛智能的廣義語義網(wǎng)絡(luò)分為場景、任務(wù)、單項能力和綜合能力四類節(jié)點。其中任務(wù)將場景和能力打通并連接起來,應(yīng)該是無人駕駛智能研究的核心,參見下圖。

關(guān)于人工智能無人車的研究案例

*圖1. 無人駕駛智能定義的語義關(guān)系圖釋

場景一詞源于戲劇,是指在一定的時間、空間(主要是空間)內(nèi)發(fā)生的一定的任務(wù)行動或因人物關(guān)系所構(gòu)成的具體人事片段。在系統(tǒng)學(xué)研究中,場景多被定義為處于特定時空中的特定系統(tǒng)。交通場景一般指的是由眾多交通參與者和特定道路環(huán)境共同構(gòu)成的特定交通系統(tǒng)。

任務(wù)原指交派的工作。駕駛?cè)蝿?wù)既可以指跟馳、換道、停車等某類一般性的駕駛工作,亦可指特定環(huán)境中的某項特定駕駛工作。

如果受試車輛能夠自主行駛完成某項特定任務(wù),則稱為通過該特定任務(wù)的駕駛測試。相對于駕駛場景而言,駕駛?cè)蝿?wù)更為具體,時空范圍更為明確。一個特定的駕駛場景通常包含多個駕駛?cè)蝿?wù)。近兩年,中國智能車未來挑戰(zhàn)賽注意到了任務(wù)測試的重要性,精心設(shè)計了任務(wù)庫,測試無人駕駛車輛的特定能力。

不過,這里還存在一個問題:通過測試任務(wù),仍然不能說明被測系統(tǒng)具備了無人駕駛智能和駕駛能力。駕駛能力一般指的是完成某種特定駕駛行為的能力。完成一個特定的駕駛?cè)蝿?wù)通常需要受試車輛具有多種駕駛能力。不同于場景和任務(wù),每項駕駛能力可以被量化評估。進(jìn)一步將各個能力進(jìn)行匯總,即可定量評估整個無人駕駛車輛的駕駛能力。

在圖1所示的語義網(wǎng)絡(luò)中,沿著場景、任務(wù)直到能力之間的正向連接,我們可以從駕駛場景中梳理出具體駕駛能力,將能夠量化的駕駛能力指標(biāo)進(jìn)行細(xì)分和標(biāo)準(zhǔn)化,以便建立完備的測試體系。

而沿著從能力、任務(wù)直到場景之間的反向連接,我們可以根據(jù)功能測試需求,自動產(chǎn)生合理的駕駛?cè)蝿?wù)乃至駕駛場景,解決測試配套的駕駛環(huán)境自動設(shè)計問題。待駕駛場景確定之后,便可以自動化虛擬生成配套駕駛環(huán)境,用于無人駕駛智能的仿真測試和實路測試。

3.3.2. 智能性測試中測試場景的生成

基于圖1,場景測試位于該語義網(wǎng)絡(luò)的左端,而功能測試位于該語義網(wǎng)絡(luò)的右端。我們提出的無人駕駛智能體系,實際上是將已有的兩種無人駕駛智能定義方式融為一體,相輔相成。基于上述定義,我們可以進(jìn)一步生成特定的測試場景。

生成測試場景,第一個要考慮的因素是,如何確定場景中所含有的任務(wù),并確定這一系列任務(wù)的出現(xiàn)和需要完成的時間—空間位置。下圖2描述了一個非常簡單場景中,受試車輛A的若干不同任務(wù)在任務(wù)時空圖中是如何排布的。受試車輛需要在每個任務(wù)需要完成的截止時間和截止空間前完成該任務(wù)。同時下圖3描述了從抽象的測試場景到具體測試實例的轉(zhuǎn)換過程。

每個場景中的任務(wù)數(shù)目和時空排列決定了該測試場景的難易程度。任務(wù)數(shù)據(jù)越多越難,需要同時處理的任務(wù)數(shù)量越多越難。

關(guān)于人工智能無人車的研究案例

*圖2. a) 一種典型的城市駕駛場景; b) 分配任務(wù)的時空排列; c) 隨時間變化的相應(yīng)計算開銷

關(guān)于人工智能無人車的研究案例

*圖3. 一個駕駛?cè)蝿?wù)逐級細(xì)化的過程也就是對于任務(wù)空間的抽樣過程,包括逐級確定分配任務(wù)的時空排列和創(chuàng)建實例

3.3.3. 智能車智能性測試框架

在傳統(tǒng)汽車測試開發(fā)中我們經(jīng)常使用V字型開發(fā)方法。如下圖所示,在這種方法中,人們在開發(fā)階段就定義了相應(yīng)級別的測試用例。

關(guān)于人工智能無人車的研究案例

*圖4. 傳統(tǒng)汽車測試V字形開發(fā)流程

V模型的第一階段是整體需求確認(rèn)階段,在該階段與整體需求對應(yīng)的測試用例也會提前定義。第二階段,第三階段分別是系統(tǒng)級別(High-Level-Design)以及子系統(tǒng)級別(Low-Level-Design)的設(shè)計和對應(yīng)測試用力的書寫。在這兩個階段系統(tǒng)的功能會被分解細(xì)化,軟件中的各種類,以及類間關(guān)系會被定義。同時,也需要在這兩個階段書寫同樣級別的測試用例。第四階段是模塊設(shè)計,在這個階段,子系統(tǒng)會進(jìn)一步分解成為小的模塊,對應(yīng)的對于模塊的測試用例也會在這個階段定義完成。

如果把我們提出的測試方法和V模型一一對應(yīng),就能得到如下的Λ-V模型:不斷學(xué)習(xí)新示例,舉一反三,逐步完善任務(wù)描述。

關(guān)于人工智能無人車的研究案例

*圖5. Λ-V模型測試框架

V模型對于傳統(tǒng)汽車研發(fā)這一類系統(tǒng)性和可推導(dǎo)性比較強(qiáng)的系統(tǒng)工程有較好的效果,但是由于我們需要在具體的編程之前就設(shè)計好所有的測試用例,這使得該模型在較為復(fù)雜的人工智能系統(tǒng)開發(fā)中很難直接套用。

我們認(rèn)為,在開發(fā)智能系統(tǒng)過程中,機(jī)器學(xué)習(xí)和測試如同一個硬幣的兩面,智能性測試應(yīng)該和機(jī)器學(xué)習(xí)有著類似的流程。

關(guān)于人工智能無人車的研究案例

(a)

關(guān)于人工智能無人車的研究案例

(b)

*圖6. 智能車測試框架

在平行學(xué)習(xí)的框架下,首先要解決的問題是如何獲取新的數(shù)據(jù)用來學(xué)習(xí),該階段我們稱為描述性學(xué)習(xí)階段;在第二階段,會從第一階段中提取特定的數(shù)據(jù)有針對性的進(jìn)行學(xué)習(xí),從而獲得“小知識”,該階段我們稱為特定數(shù)據(jù)學(xué)習(xí)階段;第三階段是預(yù)測性學(xué)習(xí)階段,在該階段,會把前兩階段得來的數(shù)據(jù)和知識一一對應(yīng),這種聯(lián)系也會被記錄下來。最后,所有的新數(shù)據(jù)會在第三階段已有聯(lián)系的基礎(chǔ)上找到對應(yīng)的“小知識”。

與此類似的,如圖6(b)所示,智能車的智能性測試也有著類似的流程。第一階段是創(chuàng)建新的測試任務(wù)。在這個過程中,在場景中的測試任務(wù)都會被逐步分解成為細(xì)化的功能。第二階段是在第一階段創(chuàng)建的測試任務(wù)中選取有挑戰(zhàn)性的部分(測試取樣)。最后一個階段是測試的執(zhí)行,也就是在前兩個階段創(chuàng)建的任務(wù)中觀察智能車的表現(xiàn)。在這個階段,我們需要從測試結(jié)果中得到兩類關(guān)聯(lián)信息,第一類是車輛智能性和其在我們搭建的測試環(huán)境中的表現(xiàn)的關(guān)聯(lián),這種關(guān)聯(lián)對于我們在新的測試任務(wù)中取樣有很大的幫助;第二種關(guān)聯(lián)是測試本身和測試環(huán)境的關(guān)聯(lián),我們需要從不同的測試環(huán)境中學(xué)習(xí)到如何更好的創(chuàng)建測試任務(wù)。

我們提出了以上的智能性測試框架是基于以下考慮:

1) 如果不進(jìn)行測試,我們無法預(yù)知智能車的行為表現(xiàn)。所以,在沒有測試之前,我們也無法確認(rèn)哪些測試任務(wù)更加的具有挑戰(zhàn)性。所以我們需要通過不斷的測試,取樣,執(zhí)行,分析這樣一個循環(huán)來達(dá)到最優(yōu)的測試效果。

2) 測試本身就是一個自我標(biāo)定的自循環(huán)過程,我們必須根據(jù)測試結(jié)果來判定車輛的智能性。

3) 如果測試要覆蓋所有的智能車的功能所需要的資源是巨大無比的,所以,我們需要一些更優(yōu)的方法和工具來縮短這個過程。

3.3. 平行測試

3.3.1. 傳統(tǒng)虛擬仿真

目前很多研究人員都把更多的精力放在視覺領(lǐng)域的虛擬仿真,當(dāng)然,也有人開始注意到駕駛員行為的重要性。在視覺領(lǐng)域的仿真中,有以下幾種圖像注入方式:1.采集真實的2D數(shù)據(jù),然后基于該數(shù)據(jù)建立3D模型,再在此3D模型的基礎(chǔ)上上投影成2D的圖像注入智能車的感知系統(tǒng);2.使用對抗式網(wǎng)絡(luò)生成新的2D模型注入; 3.基于以上兩種方法盡可能多的圖像注入。

3.3.2. 平行測試方法

我們這里提出一種新型的虛實結(jié)合的智能車平行測試方法。如圖7所示,車輛智能性測試可以分為三步:測試環(huán)境,測試規(guī)劃和測試執(zhí)行。同樣,我們在虛擬世界里也能夠建立一一映射的測試流程。

圖7. 平行測試方法

1) 首先在真實環(huán)境下建立有多種交通元素(十字路口,交通燈)的場景,對應(yīng)的在虛擬空間內(nèi),根據(jù)不同的測試目標(biāo),可以把該場景細(xì)分成不同的任務(wù),功能團(tuán),單個功能;

2) 基于這種分解模式,可以建立相應(yīng)的測試計劃來有針對性的測試不同的功能。例如假設(shè)我們要測試交通標(biāo)示識別和變道這兩個功能團(tuán),很容易發(fā)現(xiàn),交通標(biāo)示識別重要性沒有那么高,而測試變道能更好的提升車輛的可靠性。在測算了場景中包含的任務(wù),以及任務(wù)中包含的功能團(tuán)之后,我們能選出包含更多的變道的任務(wù)來在真實環(huán)境中進(jìn)行測試,而包含更多交通標(biāo)志識別的任務(wù)可以在仿真環(huán)境中進(jìn)行測試;

3) 一旦制訂了在真實和虛擬環(huán)境中的測試計劃,按照計劃執(zhí)行之后對測試結(jié)果可信度以及功能重要性進(jìn)行加權(quán)就能得到相應(yīng)的加權(quán)分?jǐn)?shù)。同時,在真實環(huán)境中得到的測試數(shù)據(jù)又能注入仿真環(huán)境,通過這種方式,仿真環(huán)境能夠不斷更新加強(qiáng)。真實環(huán)境和虛擬環(huán)境中的測試是異步的,我們可以在真實環(huán)境進(jìn)行某一項測試的同時,在虛擬環(huán)境中進(jìn)行多項測試。

和傳動的仿真測試環(huán)境相比,平行測試體系有如下兩個不同。

1. 平行的虛擬環(huán)境不僅僅是真實環(huán)境的一一映射,同時也和真實環(huán)境在狀態(tài)上存在交互,真實環(huán)境會影響虛擬環(huán)境,虛擬環(huán)境也會影響真實環(huán)境,這樣就形成了一個自我不斷增強(qiáng)系統(tǒng);

2.平行系統(tǒng)是一種自我學(xué)習(xí)的系統(tǒng),一些在虛擬環(huán)境中的關(guān)鍵元素是數(shù)據(jù)驅(qū)動型,這使得平行系統(tǒng)比那些基于隨機(jī)模型的系統(tǒng)要更加自動化,可信度也更高。

3.3.3. 平行測試實際應(yīng)用

在江蘇省常熟市,這樣一個平行測試系統(tǒng)已經(jīng)建立起來,并且很好的支持了2017年中國智能車未來挑戰(zhàn)賽。如圖8所示,我們先在虛擬環(huán)境中找到最具挑戰(zhàn)性的測試任務(wù)然后再在真實環(huán)境中進(jìn)行測試。

圖8. 平行測試實際應(yīng)用

4. 智能性測試的相關(guān)討論

4.1. 倫理道德問題

包括圖靈在內(nèi)的大部分研究者都認(rèn)為人能夠按照自己的經(jīng)驗做出正確的決定,而智能機(jī)器也應(yīng)該和人類一樣來完成這些決定,因此我們的工作就簡化成為在智能測試中去判斷智能機(jī)器是否完成了和人類一樣的決定。

但是在某些情況下,哪怕是人類也很難確定什么是正確的,例如著名的鐵軌問題:你是一輛剎車失靈的火車司機(jī),在你前面的鐵軌上有5個人被綁在軌道上,你可以選擇切換到另外軌道,另外那條軌道上只有1個人綁在鐵軌上,那么請問你會選擇撞死5個人還是切換軌道撞死1個人?對于這個問題本文中不做更多的討論,即使是人類,在這個問題上都很難做出“正確的”決定,更何況智能機(jī)器?所以在本文中我們不去討論這些問題,我們也不會為倫理問題設(shè)置智能性測試。

4.2. 測試結(jié)果的自動實時分析

圖靈測試和現(xiàn)在很多新的智能測試的區(qū)別在于,圖靈測試用人來做判定,而新的智能測試使用的是機(jī)器來做判定。之所以這么做的原因在于我們清晰的定義了任務(wù),同時很多情況下沒有機(jī)器的幫助人很難完成正確的判定。

以智能車測試為例,為了節(jié)約成本,我們往往在某一條測試路線上設(shè)置了多個測試任務(wù),車輛需要不停歇的完成多個測試任務(wù)。

例如在中國智能車未來挑戰(zhàn)賽中就設(shè)置了14個測試任務(wù),分別是U-Turn,通過T字型路口,通過十字路口,避讓作業(yè)車,隧道,停止標(biāo)志,避讓行人,右轉(zhuǎn),鄉(xiāng)村道路,避讓自行車,施工區(qū)域,限速,停車。車輛需要連續(xù)通過這些任務(wù)點,為了能夠自動測評,我們需要使用V2X設(shè)備連接車輛上的傳感器和數(shù)據(jù)中心,上傳車輛數(shù)據(jù)到數(shù)據(jù)中心來完成自動測評。

關(guān)于人工智能無人車的研究案例

*圖9. 智能車比賽測試項

青島慧拓智能機(jī)器有限公司聯(lián)合清華大學(xué)一起開發(fā)了自動測評系統(tǒng)并成功應(yīng)用于此次比賽中。如圖10所示,左邊展示的是正在比賽中的5輛車的實時軌跡和實時排名,右邊屏幕里是實時的視頻回傳數(shù)據(jù),展示著裁判車數(shù)據(jù),比賽車輛數(shù)據(jù),以及場邊攝像頭數(shù)據(jù)。這些數(shù)據(jù)通過V2X或者4G的方式傳回數(shù)據(jù)中心。

在2009年-2015年的比賽中,比賽由裁判來人工打分,這種方式比較主觀,也非常耗時。在2017年比賽中,大部分的任務(wù)可以通過回傳過來的數(shù)據(jù)實現(xiàn)自動打分。我們同樣能夠通過深度學(xué)習(xí)的方式用視覺的方式來檢查車輛是否有壓線,來實現(xiàn)自動打分,如圖11所示。

*圖10. 智能車比賽實時評測

*圖11. 實時壓線檢測

4.3. 駕駛員在環(huán)測試

按照上文中說到,我們最終的目的是讓機(jī)器代替人來評價智能性測試結(jié)果。但是目前階段,這種情況卻難以完全實現(xiàn)。

首先,測試任務(wù)的描述需要由人類專家來完成。所有的任務(wù)描述都是使用人類語言,目前也并沒有一種計算機(jī)語言能夠更好的完成該任務(wù)。機(jī)器的智能水平往往受限于它的設(shè)計者,所以我們最終總是還是需要用人類的智慧來在衡量測試結(jié)果的基礎(chǔ)上提升機(jī)器的智能性水平。

其次,人類專家能夠按照自己的經(jīng)驗更好的幫助機(jī)器設(shè)計那些極限的測試任務(wù)。

最后,人類是智能性測試的最后決策者,往往由機(jī)器做出的判斷還要由人類來檢查。就像在2017年中國智能車未來挑戰(zhàn)賽中視頻回傳系統(tǒng)就是方便人類專家隨時能夠監(jiān)督智能車的表現(xiàn),這能夠讓人類和自動打分系統(tǒng)同時以對方的判斷為基礎(chǔ)改善自己的評判能力。

4.4. 用測試來進(jìn)行智能水平分級

SAE把汽車自動化水平分為從無自動化到完全自動化六個級別,但是在該分級體系中并沒有給出明確的需要完成的任務(wù)?,F(xiàn)在有更多人認(rèn)為,只有明確了分級系統(tǒng)中的測試任務(wù),才能更好的對汽車智能性水平進(jìn)行分級。

智能機(jī)器在特定的領(lǐng)域越來越智能,甚至在某些領(lǐng)域(比如圍棋領(lǐng)域的阿法狗,射擊領(lǐng)域的Top Gun)已經(jīng)超過了人類。也許在未來的某一天,機(jī)器能夠取代人成為智能性水平的最終定義者。

4.5. 可釋性測試

如同圖靈測試一樣,我們現(xiàn)在更多的關(guān)注智能機(jī)器的外在表現(xiàn)多于機(jī)器內(nèi)部的運行機(jī)制。如果某智能機(jī)器通過了所有的測試任務(wù),我們就承認(rèn)了其在該領(lǐng)域的智能性。但是我們很難知道怎樣的外在表現(xiàn)是最優(yōu)的。

當(dāng)今的智能機(jī)器越來越復(fù)雜,我們很難完全搞懂其內(nèi)部的算法(例如復(fù)雜的深度學(xué)習(xí)算法),這就類似于一個“黑盒子”。并且我們基于傳統(tǒng)可釋性邏輯制造出來的機(jī)器很難和這種“黑盒子”媲美,距今為止,很少有人能找出一種“內(nèi)外兼修”的測試方法,這將是未來一個很重要的研究方向。

4.6. 智能性測試在智能機(jī)器軟件開發(fā)中的必要性

鑒于目前大部分AI的程序都是在電腦中通過編程完成,所以測試實現(xiàn)AI的軟件顯得尤為重要,所以我們需要建立一套完善的對這些軟件的測試體系。例如測試驅(qū)動型開發(fā)(TDD)就在當(dāng)今工業(yè)界被廣為接受:TDD最基礎(chǔ)的思路是首先把需求分解轉(zhuǎn)換成相應(yīng)的測試用例,然后不停的優(yōu)化軟件讓其通過這些測試。在這種研發(fā)思路中,我們能很好的保證軟件的質(zhì)量并能讓軟件有更好的可讀性。

目前在該領(lǐng)域最缺乏的是良好的測試和調(diào)試工具,這種對于AI軟件的測試工具市面上非常少。

4.7. 終生測試

就像前文所述的,現(xiàn)在有越來越多的方法來測試智能性,但是這些測試方法的落地還需要很長一段時間。我們把這一落地過程稱之為“終生測試”(Life-long Testing)。我們應(yīng)該把AI機(jī)器的研發(fā)和測試當(dāng)作一個整體來考慮,隨著測試的不斷深入,機(jī)器的智能性也會因此而提升。

在當(dāng)今工業(yè)界,我們更多的是把多種“低級別”的簡單機(jī)器進(jìn)行組合來制造“高級別”機(jī)器。很難想象,我們400年前只能制造一些很小的玩具,而如今我們卻有著十分復(fù)雜的GPU,CPU等。同樣的,我們相信在AI領(lǐng)域,也會是如此,會有更多的“高智能性”機(jī)器從“低智能性”機(jī)器中衍生而來,我們可以一起見證這一時刻的到來。

4.8. 測試的商業(yè)化

目前的AI革命正在極大的改變我們的生活,有很多人類的工作正在或者在不就的將來就會被機(jī)器代替。同時,新的AI領(lǐng)域也催生了一大批新的工作,智能性測試當(dāng)然也在其中之列,例如我們現(xiàn)在需要非常多的人來標(biāo)定視頻數(shù)據(jù)來訓(xùn)練我們的深度學(xué)習(xí)模型。

5. 結(jié)論

本文主要討論了智能性測試的難點,并以此為基礎(chǔ)提出了智能性測試方法:智能性測試和機(jī)器學(xué)習(xí)的過程類似,兩者如同一個硬幣的兩面。并且我們提出了虛實結(jié)合的平行測試方法:首先在虛擬環(huán)境中描述測試任務(wù),然后進(jìn)行取樣,最后執(zhí)行測試,通過這個流程我們能夠找到其中最難的測試任務(wù);另外,虛擬測試需要平行的去執(zhí)行,這樣可以幫助我們更好的找到更“真實”更“豐富”的測試數(shù)據(jù)集,這將極大的改善測試的效率和經(jīng)濟(jì)性。

但是,“終生測試”將是一場持久戰(zhàn),目前我們還沒有能夠找到一個脫離人能夠自己運行的虛實結(jié)合的平行測試系統(tǒng),我們相信,這一天遲早會到來。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    47183

    瀏覽量

    238242
  • 自動駕駛
    +關(guān)注

    關(guān)注

    784

    文章

    13784

    瀏覽量

    166382
  • 無人車
    +關(guān)注

    關(guān)注

    1

    文章

    301

    瀏覽量

    36469
收藏 人收藏

    評論

    相關(guān)推薦

    人工智能是什么?

    簡單的理解為“人工”與“智能”的完美結(jié)合呢?關(guān)于這個問題,仁者見仁智者見智。 現(xiàn)在繼續(xù)剛才的話題,以目前服務(wù)機(jī)器人的智商度來看的話,當(dāng)前人工智能雖然在不斷高速前進(jìn),但還是處于弱
    發(fā)表于 09-16 15:40

    人工智能的前世今生 引爆人工智能大時代

    醒來人工智能的時代就到來了。就像前段時間引力波被探測出來,我越來越覺得——Anything is possible。然后我有開始查了很多關(guān)于人工智能的資料,想和大家一起來看看人工智能
    發(fā)表于 03-03 11:05

    從入門到研究,人工智能領(lǐng)域最值得一讀的10本資料(附下載)

    從入門到研究人工智能領(lǐng)域最值得一讀的10本資料(附下載)鏈接: https://pan.baidu.com/s/1o8l2qWa 密碼: gm6h人工智能正在我們?nèi)祟惖纳钪邪l(fā)揮越來越重要的價值
    發(fā)表于 10-12 11:38

    AI人工智能:54份行業(yè)重磅報告匯總(附下載)

    的企業(yè)都是智能企業(yè)......”你還不需要開始了解人工智能嗎?我們分享各個行業(yè)關(guān)于人工智能的發(fā)展及研究報告供所有人參考學(xué)習(xí)!報告1:中國
    發(fā)表于 11-21 09:56

    Python助力百度無人 人工智能時代到來

    今年7月份,在“百度AI開發(fā)者大會”上,百度CEO李彥宏親自乘坐百度無人,在真實路況下演示了百度無人駕駛技術(shù),預(yù)示著人工智能時代的到來。百度無人
    發(fā)表于 12-13 14:48

    人工智能就業(yè)前景

    越大薪酬越高的現(xiàn)象。人工智能目前是一個快速增長的領(lǐng)域,人才需求量大,相比于其他技術(shù)崗位,競爭度偏低,薪資相對較高,因此,現(xiàn)在是進(jìn)入人工智能領(lǐng)域的大好時機(jī)。研究還表明,掌握三種以上技能的人才對企業(yè)的吸引力更大,且趨勢越來越明顯,因
    發(fā)表于 03-29 15:46

    天津大學(xué)與中科視拓共建“人工智能聯(lián)合實驗室”

    產(chǎn)業(yè)落地方面的實踐經(jīng)驗和人工智能基礎(chǔ)設(shè)施平臺的研發(fā)優(yōu)勢,與天津大學(xué)共同致力于AI高等教育實訓(xùn)課程體系設(shè)計和實訓(xùn)軟硬件平臺建設(shè),助力天津大學(xué)的人工智能人才培養(yǎng)。雙方將在智能無人
    發(fā)表于 05-25 10:19

    程序教會無人更“懂禮貌”

    `無人和人類將如何互動?這是一個棘手的問題,因為人工智能系統(tǒng)在解決任務(wù)時往往與人類的行為不同。如今,加州大學(xué)伯克利分校的研究人員試圖通過編程,教會
    發(fā)表于 08-15 11:03

    解讀人工智能的未來

    `已歷經(jīng)60多年的人工智能在物聯(lián)網(wǎng)以及大數(shù)據(jù)的推動下,實現(xiàn)飛躍式的發(fā)展,并且迎來了第三個黃金周期。必優(yōu)傳感今天和大家解讀一下關(guān)于人工智能的未來。自從有了人工智能,引發(fā)了人類的各種“未來
    發(fā)表于 11-14 10:43

    AIRU解決人工智能零售無人售貨店/機(jī)新方案

    ,已經(jīng)廣泛融入到我們的日常生活中,小到刷臉進(jìn)門刷臉付卡,大到智能制造,很多產(chǎn)品也已經(jīng)走進(jìn)千家萬戶,無人售貨市場業(yè)已成為很多企業(yè)在人工智能領(lǐng)域的布局方向。<<2019北京國際
    發(fā)表于 12-28 08:46

    人工智能醫(yī)生未來或上線,人工智能醫(yī)療市場規(guī)模持續(xù)增長

    +醫(yī)療市場規(guī)模持續(xù)增長   由廣州市婦女兒童醫(yī)療中心教授夏慧敏、加州大學(xué)圣地亞哥分校教授張康等專家領(lǐng)銜的醫(yī)療數(shù)據(jù)智能化應(yīng)用團(tuán)隊,聯(lián)合人工智能研究和轉(zhuǎn)化機(jī)構(gòu)研發(fā)出“輔診熊”人工智能診斷
    發(fā)表于 02-24 09:29

    鄭交會人工智能科技展

    2019年,“智能+”作為一個概念,首次出現(xiàn)在***工作報告中,人工智能也已連續(xù)三年被寫入***工作報告。在國務(wù)院印發(fā)的關(guān)于“新一代人工智能發(fā)展規(guī)劃”提出的重點任務(wù)中包含“建設(shè)安全便
    發(fā)表于 09-16 18:24

    人工智能的應(yīng)用領(lǐng)域有哪些?

    ` 本帖最后由 cdhqyj 于 2020-10-23 11:09 編輯 人工智能的應(yīng)用領(lǐng)域有哪些?人工智能的定義可以分為兩部分,即“人工”和“智能”,應(yīng)用領(lǐng)域非常廣泛。麥肯錫全球
    發(fā)表于 10-23 11:07

    人工智能芯片是人工智能發(fā)展的

    人工智能芯片是人工智能發(fā)展的 | 特倫斯謝諾夫斯基責(zé)編 | 屠敏本文內(nèi)容經(jīng)授權(quán)摘自《深度學(xué)習(xí) 智能時代的核心驅(qū)動力量》從AlphaGo的人機(jī)對戰(zhàn),到無人駕駛汽車的上路,再到AI合成主播
    發(fā)表于 07-27 07:02

    物聯(lián)網(wǎng)人工智能是什么?

    智能的,但是并不真正擁有智能,也不會有自主意識。 二、人工智能應(yīng)用領(lǐng)域人工智能已經(jīng)滲透到人類生活的各個領(lǐng)域,游戲,媒體,金融,建材等行業(yè),并且運用到各種領(lǐng)先
    發(fā)表于 09-09 14:12
    RM新时代网站-首页