RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如果我們想讓AI通過觀察人類行為學會打游戲,我們該怎么做?

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-04-08 09:03 ? 次閱讀

為了創(chuàng)建游戲中的AI機器人,游戲開發(fā)者通常會根據(jù)規(guī)則手工編寫一系列代碼。在大多數(shù)情況下,這種方法能使機器人在模仿人上做到極盡逼真,但它們本質(zhì)上和人還是有較大區(qū)別,大部分玩家還是一眼就能分辨出這個隊友/敵人究竟是真人還是AI。

那么,除了手動寫規(guī)則,或是寫一些硬編碼,我們還有別的方式能使游戲AI更仿真嗎?如果我們想讓AI通過觀察人類行為學會打游戲,我們該怎么做?

為了探索這些問題,我們首先需要一個能提供大量比賽數(shù)據(jù)的游戲,比如《FIFA》。所以接下來我們就以《FIFA》系列的最新版《FIFA 18》為例,用記錄了玩家行為和決定的大量游戲錄像訓(xùn)練一個端到端的深度學習機器人。需要注意一點是,我們不會針對單個游戲規(guī)則編寫硬編碼。

Github地址:github.com/ChintanTrivedi/DeepGamingAI_FIFA.git

玩游戲的機制

因為我們不能訪問游戲的內(nèi)部代碼,所以為機器人構(gòu)建基本的游戲機制是一個首要任務(wù)。這其實也是種優(yōu)勢,這個項目的一個前提就是不依賴任何游戲內(nèi)部信息。因此,我們的機器人只會看到簡單的游戲窗口屏幕截圖,玩家看到的是什么,它看到的就是什么。它會通過處理這些視覺信息輸出想要采取的動作,并用手柄模擬器把指令傳達給游戲。之后不斷刷新圖像,重復(fù)循環(huán)。

如上圖所示,現(xiàn)在我們建立了一整個為機器人提供輸入,并由它輸出操控游戲角色的指令的框架。這時我們就來到了一個有趣的環(huán)節(jié):學習游戲智能。它可以被分為兩個步驟:(1)用卷積神經(jīng)網(wǎng)絡(luò)理解截圖;(2)用長短期記憶網(wǎng)絡(luò)理解圖像內(nèi)容并做出決策。

第1步:訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)(CNN)

CNN以其能高精度檢測圖像中物體的能力而聞名。在它的基礎(chǔ)上,我們輔之以高性能的GPU、更智能的神經(jīng)網(wǎng)絡(luò)架構(gòu),我們就能獲得一個可以實時運行的CNN模型。

為了讓我們的機器人了解輸入的圖像,我們可以使用這個名為MobileNet的輕量級、高速CNN。該網(wǎng)絡(luò)能在高度理解截圖的前提下從圖中抓取特征圖,例如玩家或玩家關(guān)注的角色在屏幕上的位置。之后再結(jié)合物體檢測模型SSD檢測球場上的球員、球以及球門。

第2步:訓(xùn)練長期短期記憶網(wǎng)絡(luò)(LSTM)

現(xiàn)在我們已經(jīng)理解了圖像,也就是說機器人擁有了進行決策的能力。但是我們不希望只讓它看到一個個檢測框然后采取行動,我們希望它能看到圖像的短序列。這就是為什么引入LSTM的原因——它們能夠模擬視頻數(shù)據(jù)中的時間序列。我們把連續(xù)的幀用作時間步長,并用CNN模型從每一幀中提取特征映射,再把這些同時饋入兩個LSTM網(wǎng)絡(luò)。

第一個LSTM負責了解玩家需要做什么動作,因此,這就是一個多類分類模型。第二個LSTM得到的輸入和第一個相同,但它必須決定采取什么動作來實現(xiàn)橫傳、直塞、短傳、射門:另一個多類分類模型。我們把這兩個分類問題的輸出轉(zhuǎn)換為按鍵,以此達到控制游戲的目的。

評估機器人的性能

除了讓AI機器人直接上賽場,其實我們也找不出任何測試性能的方法。在訓(xùn)練了400分鐘后,機器人學會了向?qū)Ψ角蜷T靠近、向前方傳球并在發(fā)現(xiàn)球門時射門。在《FIFA 18》的新手模式下,我們的機器人在6常比賽中打進了4粒球,比17/18賽季的Paul Pogba還多出1球。

(口音聽不太清,請自己練聽力)

小結(jié)

這只是一種創(chuàng)建機器人的方法,就結(jié)果來看,它還是挺積極的。訓(xùn)練中也曾出現(xiàn)兩個問題,一是機器人分不清敵我雙方,另一個則是它把球踢過半場就開始往回跑。關(guān)于第一點,作者的解決方案是把截圖和按鍵信息作為監(jiān)督學習的訓(xùn)練數(shù)據(jù),并始終用相同的主隊和不同的客隊比賽,久而久之,機器人就能分出哪些是自己人,哪些是對手。而關(guān)于第二點,一位網(wǎng)友提出了一種更為簡單的解決方案,就是以中線為界把球場分為兩部分,翻轉(zhuǎn)一側(cè)的截圖并調(diào)整方位,起到事半功倍的效果。

在有限的訓(xùn)練下,機器人已經(jīng)掌握了基本的比賽規(guī)則:朝球門移動并把球踢進網(wǎng)里。如果再經(jīng)過一段時間的訓(xùn)練,相信它能比現(xiàn)有的游戲AI更接近人類,而且更容易創(chuàng)建。此外,如果我們能擴展一下這個實驗,用真實的比賽數(shù)據(jù)來訓(xùn)練它,相信機器人的行為能更自然和現(xiàn)實。所以也許游戲開發(fā)商們可以換種方式來做AI了,你說對嗎,EA?

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    211

    文章

    28379

    瀏覽量

    206913
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4771

    瀏覽量

    100712
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30728

    瀏覽量

    268886

原文標題:自制AI隊友:創(chuàng)建一個會玩《FIFA 18》的深度神經(jīng)網(wǎng)絡(luò)

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    不寒而栗:機器人只需看看 就能模仿人類

    研發(fā)了通過觀察人類就能夠了解自然系統(tǒng)和人工系統(tǒng)運行規(guī)律的機器人。通過圖靈測試的原理,我們可以探究一個系統(tǒng)是如何工作的。終有一天,新一代的機器人能夠
    發(fā)表于 09-05 09:12 ?768次閱讀

    教你如何通過打游戲邊學編程

    經(jīng)常聽到有朋友說,學習編程是一件非常枯燥無味的事情。其實,大家有沒有認真想過,可能是我們的學習方法不對?比方說,你有沒有想過,可以通過打游戲來學編程?
    的頭像 發(fā)表于 07-13 12:01 ?1418次閱讀

    家里的電燈照度可調(diào) 應(yīng)該怎么做

    家里的電燈照度可調(diào) 應(yīng)該怎么做 ?
    發(fā)表于 01-20 18:34

    我們談?wù)摍C器人的時候,我們到底談什么?

    ,「人工智能」就是給機器賦予人類的智能,機器能夠像人類那樣獨立思考;而「機器學習」通俗的說就是機器自己去學習,然后通過學習到的知識來指導(dǎo)
    發(fā)表于 01-11 14:16

    程序員之我們學會正確的失敗

    程序員毒雞湯我們學會正確的失敗
    發(fā)表于 07-08 16:53

    如何在基于Arm的設(shè)備上運行游戲AI

    在本系列的第 2 部分中,我們展示了游戲 AI 代理是如何設(shè)計的。我們還展示了為 Dr Arm 的 Boss Battle 演示生成的神經(jīng)網(wǎng)絡(luò) (NN) 模型的外觀。第 3 部分著眼于
    發(fā)表于 08-15 15:43

    Versa 是怎樣 AI 的,以及小公司如何 AI 才能贏

    今天我跟大家討論一個話題,就是小公司怎么做 AI?小公司在這個 AI 時代怎么做? 我小小的介紹一下 Versa,它是基于計算機視覺
    的頭像 發(fā)表于 01-02 15:17 ?4265次閱讀

    首款經(jīng)濟行為學游戲化實驗上線了

    AlchemyGod是第一款經(jīng)濟行為學游戲化實驗,由Oathom區(qū)塊實驗室開發(fā)完成??梢哉f,這是一款革命性、系統(tǒng)性、能夠產(chǎn)生價值的經(jīng)濟學游戲,具有豐富的自由度和高度的發(fā)展空間。無論站在游戲
    發(fā)表于 04-03 07:19 ?849次閱讀

    西悉尼大學已推出網(wǎng)絡(luò)安全與行為學

    未來的網(wǎng)絡(luò)安全將取決于人類是否能夠盡快創(chuàng)新解決方案,努力確保公司、國家與個人的數(shù)據(jù)安全。西悉尼大學的網(wǎng)絡(luò)安全與行為學位是澳大利亞與亞太地區(qū)第一個網(wǎng)絡(luò)安全學位,學位同時分析技術(shù)與人類
    的頭像 發(fā)表于 12-28 14:52 ?3005次閱讀

    AI終會讀懂我們人類

    終有一天AI將能真正讀懂人類的語言、動作、情緒等各類因素。屆時,如何處理好其間可能存在的問題,還需我們提前進行思考。
    發(fā)表于 11-04 15:10 ?590次閱讀

    真菌毒素檢測我們怎么做

    真菌毒素檢測我們怎么做?推薦南京微測真菌毒素檢測儀,采用時間分辨熒光定量檢測技術(shù),結(jié)果準確可靠,與國標法高度符合,前處理簡便,操作步驟簡易,通過ID卡導(dǎo)入標準曲線,樣品隨到隨檢。
    發(fā)表于 10-13 15:45 ?447次閱讀

    真菌毒素檢測我們怎么做

    真菌毒素檢測我們怎么做?推薦上海飛測真菌毒素檢測儀,采用時間分辨熒光定量檢測技術(shù),結(jié)果準確可靠,與國標法高度符合,前處理簡便,操作步驟簡易,通過ID卡導(dǎo)入標準曲線,樣品隨到隨檢。
    發(fā)表于 10-13 15:49 ?617次閱讀

    真菌毒素檢測我們怎么做

    真菌毒素檢測我們怎么做?推薦南京微測真菌毒素檢測儀,采用時間分辨熒光定量檢測技術(shù),結(jié)果準確可靠,與國標法高度符合,前處理簡便,操作步驟簡易,通過ID卡導(dǎo)入標準曲線,樣品隨到隨檢。
    發(fā)表于 10-14 16:19 ?481次閱讀

    電子地磅的稱重儀表出現(xiàn)老化怎么做

    電子地磅的稱重儀表出現(xiàn)老化怎么做
    的頭像 發(fā)表于 03-11 13:24 ?1177次閱讀
    電子地磅的稱重儀表出現(xiàn)老化<b class='flag-5'>該</b><b class='flag-5'>怎么做</b>

    消除VCR電阻電壓系數(shù)影響,你怎么做

    消除VCR電阻電壓系數(shù)影響,你怎么做?
    的頭像 發(fā)表于 12-15 16:40 ?625次閱讀
    消除VCR電阻電壓系數(shù)影響,你<b class='flag-5'>該</b><b class='flag-5'>怎么做</b>?
    RM新时代网站-首页