新时代平台,rm新时代公司官网

為了創(chuàng)建游戲中的AI 機器人，游戲開發(fā)者通常會根據(jù)規(guī)則手工編寫一系列代碼。在大多數(shù)情況下，這種方法能使機器人在模仿人上做到極盡逼真，但它們本質(zhì)上和人還是有較大區(qū)別，大部分玩家還是一眼就能分辨出這個隊友/敵人究竟是真人還是AI。

那么，除了手動寫規(guī)則，或是寫一些硬編碼，我們還有別的方式能使游戲AI更仿真嗎？如果我們想讓AI通過觀察人類行為學會打游戲，我們該怎么做？

為了探索這些問題，我們首先需要一個能提供大量比賽數(shù)據(jù)的游戲，比如《FIFA》。所以接下來我們就以《FIFA》系列的最新版《FIFA 18》為例，用記錄了玩家行為和決定的大量游戲錄像訓(xùn)練一個端到端的深度學習機器人。需要注意一點是，我們不會針對單個游戲規(guī)則編寫硬編碼。

Github地址：github.com/ChintanTrivedi/DeepGamingAI_FIFA.git

玩游戲的機制

因為我們不能訪問游戲的內(nèi)部代碼，所以為機器人構(gòu)建基本的游戲機制是一個首要任務(wù)。這其實也是種優(yōu)勢，這個項目的一個前提就是不依賴任何游戲內(nèi)部信息。因此，我們的機器人只會看到簡單的游戲窗口屏幕截圖，玩家看到的是什么，它看到的就是什么。它會通過處理這些視覺信息輸出想要采取的動作，并用手柄模擬器把指令傳達給游戲。之后不斷刷新圖像，重復(fù)循環(huán)。

如上圖所示，現(xiàn)在我們建立了一整個為機器人提供輸入，并由它輸出操控游戲角色的指令的框架。這時我們就來到了一個有趣的環(huán)節(jié)：學習游戲智能。它可以被分為兩個步驟：（1）用卷積神經(jīng)網(wǎng)絡(luò)理解截圖；（2）用長短期記憶網(wǎng)絡(luò)理解圖像內(nèi)容并做出決策。

第1步：訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)（CNN）

CNN以其能高精度檢測圖像中物體的能力而聞名。在它的基礎(chǔ)上，我們輔之以高性能的GPU、更智能的神經(jīng)網(wǎng)絡(luò)架構(gòu)，我們就能獲得一個可以實時運行的CNN模型。

為了讓我們的機器人了解輸入的圖像，我們可以使用這個名為MobileNet的輕量級、高速CNN。該網(wǎng)絡(luò)能在高度理解截圖的前提下從圖中抓取特征圖，例如玩家或玩家關(guān)注的角色在屏幕上的位置。之后再結(jié)合物體檢測模型SSD檢測球場上的球員、球以及球門。

第2步：訓(xùn)練長期短期記憶網(wǎng)絡(luò)（LSTM）

現(xiàn)在我們已經(jīng)理解了圖像，也就是說機器人擁有了進行決策的能力。但是我們不希望只讓它看到一個個檢測框然后采取行動，我們希望它能看到圖像的短序列。這就是為什么引入LSTM的原因——它們能夠模擬視頻數(shù)據(jù)中的時間序列。我們把連續(xù)的幀用作時間步長，并用CNN模型從每一幀中提取特征映射，再把這些同時饋入兩個LSTM網(wǎng)絡(luò)。

第一個LSTM負責了解玩家需要做什么動作，因此，這就是一個多類分類模型。第二個LSTM得到的輸入和第一個相同，但它必須決定采取什么動作來實現(xiàn)橫傳、直塞、短傳、射門：另一個多類分類模型。我們把這兩個分類問題的輸出轉(zhuǎn)換為按鍵，以此達到控制游戲的目的。

評估機器人的性能

除了讓AI機器人直接上賽場，其實我們也找不出任何測試性能的方法。在訓(xùn)練了400分鐘后，機器人學會了向?qū)Ψ角蜷T靠近、向前方傳球并在發(fā)現(xiàn)球門時射門。在《FIFA 18》的新手模式下，我們的機器人在6常比賽中打進了4粒球，比17/18賽季的Paul Pogba還多出1球。

（口音聽不太清，請自己練聽力）

小結(jié)

這只是一種創(chuàng)建機器人的方法，就結(jié)果來看，它還是挺積極的。訓(xùn)練中也曾出現(xiàn)兩個問題，一是機器人分不清敵我雙方，另一個則是它把球踢過半場就開始往回跑。關(guān)于第一點，作者的解決方案是把截圖和按鍵信息作為監(jiān)督學習的訓(xùn)練數(shù)據(jù)，并始終用相同的主隊和不同的客隊比賽，久而久之，機器人就能分出哪些是自己人，哪些是對手。而關(guān)于第二點，一位網(wǎng)友提出了一種更為簡單的解決方案，就是以中線為界把球場分為兩部分，翻轉(zhuǎn)一側(cè)的截圖并調(diào)整方位，起到事半功倍的效果。

在有限的訓(xùn)練下，機器人已經(jīng)掌握了基本的比賽規(guī)則：朝球門移動并把球踢進網(wǎng)里。如果再經(jīng)過一段時間的訓(xùn)練，相信它能比現(xiàn)有的游戲AI更接近人類，而且更容易創(chuàng)建。此外，如果我們能擴展一下這個實驗，用真實的比賽數(shù)據(jù)來訓(xùn)練它，相信機器人的行為能更自然和現(xiàn)實。所以也許游戲開發(fā)商們可以換種方式來做AI了，你說對嗎，EA？

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

機器人

機器人

+關(guān)注

關(guān)注
211

文章
28379

瀏覽量
206913
神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4771

瀏覽量
100712
AI

AI

+關(guān)注

關(guān)注
87

文章
30728

瀏覽量
268886

原文標題：自制AI隊友：創(chuàng)建一個會玩《FIFA 18》的深度神經(jīng)網(wǎng)絡(luò)

文章出處：【微信號：jqr_AI，微信公眾號：論智】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

不寒而栗：機器人只需看看就能模仿人類

研發(fā)了通過觀察人類就能夠了解自然系統(tǒng)和人工系統(tǒng)運行規(guī)律的機器人。通過圖靈測試的原理，我們可以探究一個系統(tǒng)是如何工作的。終有一天，新一代的機器人能夠學

發(fā)表于 09-05 09:12 ?768次閱讀

教你如何通過邊打游戲邊學編程

經(jīng)常聽到有朋友說，學習編程是一件非常枯燥無味的事情。其實，大家有沒有認真想過，可能是我們的學習方法不對？比方說，你有沒有想過，可以通過打游戲來學編程？

發(fā)表于 07-13 12:01 ?1418次閱讀

想讓家里的電燈照度可調(diào) 應(yīng)該怎么做 ？

想讓家里的電燈照度可調(diào) 應(yīng)該怎么做 ？

發(fā)表于 01-20 18:34

當我們談?wù)摍C器人的時候，我們到底該談什么？

，「人工智能」就是給機器賦予人類的智能，讓機器能夠像人類那樣獨立思考；而「機器學習」通俗的說就是讓機器自己去學習，然后通過學習到的知識來指導(dǎo)

發(fā)表于 01-11 14:16

程序員之我們都該學會正確的失敗

程序員毒雞湯我們都該學會正確的失敗

發(fā)表于 07-08 16:53

如何在基于Arm的設(shè)備上運行游戲AI呢

在本系列的第 2 部分中，我們展示了游戲 AI 代理是如何設(shè)計的。我們還展示了為 Dr Arm 的 Boss Battle 演示生成的神經(jīng)網(wǎng)絡(luò) (NN) 模型的外觀。第 3 部分著眼于

發(fā)表于 08-15 15:43

Versa 是怎樣做 AI 的，以及小公司如何做 AI 才能贏

今天我想跟大家討論一個話題，就是小公司怎么做 AI？小公司在這個 AI 時代怎么做？我小小的介紹一下 Versa，它是基于計算機視覺

發(fā)表于 01-02 15:17 ?4265次閱讀

首款經(jīng)濟行為學游戲化實驗上線了

AlchemyGod是第一款經(jīng)濟行為學游戲化實驗，由Oathom區(qū)塊實驗室開發(fā)完成?？梢哉f，這是一款革命性、系統(tǒng)性、能夠產(chǎn)生價值的經(jīng)濟學游戲，具有豐富的自由度和高度的發(fā)展空間。無論站在游戲

發(fā)表于 04-03 07:19 ?849次閱讀

西悉尼大學已推出網(wǎng)絡(luò)安全與行為學位

未來的網(wǎng)絡(luò)安全將取決于人類是否能夠盡快創(chuàng)新解決方案，努力確保公司、國家與個人的數(shù)據(jù)安全。西悉尼大學的網(wǎng)絡(luò)安全與行為學位是澳大利亞與亞太地區(qū)第一個網(wǎng)絡(luò)安全學位，該學位同時分析技術(shù)與人類

發(fā)表于 12-28 14:52 ?3005次閱讀

AI終會讀懂我們人類嗎

終有一天AI將能真正讀懂人類的語言、動作、情緒等各類因素。屆時，如何處理好其間可能存在的問題，還需我們提前進行思考。

發(fā)表于 11-04 15:10 ?590次閱讀

真菌毒素檢測我們該怎么做

真菌毒素檢測我們該怎么做?推薦南京微測真菌毒素檢測儀，采用時間分辨熒光定量檢測技術(shù)，結(jié)果準確可靠，與國標法高度符合，前處理簡便，操作步驟簡易，通過ID卡導(dǎo)入標準曲線，樣品隨到隨檢。

發(fā)表于 10-13 15:45 ?447次閱讀

真菌毒素檢測我們該怎么做

真菌毒素檢測我們該怎么做?推薦上海飛測真菌毒素檢測儀，采用時間分辨熒光定量檢測技術(shù)，結(jié)果準確可靠，與國標法高度符合，前處理簡便，操作步驟簡易，通過ID卡導(dǎo)入標準曲線，樣品隨到隨檢。

發(fā)表于 10-13 15:49 ?617次閱讀

真菌毒素檢測我們該怎么做

真菌毒素檢測我們該怎么做?推薦南京微測真菌毒素檢測儀，采用時間分辨熒光定量檢測技術(shù)，結(jié)果準確可靠，與國標法高度符合，前處理簡便，操作步驟簡易，通過ID卡導(dǎo)入標準曲線，樣品隨到隨檢。

發(fā)表于 10-14 16:19 ?481次閱讀

電子地磅的稱重儀表出現(xiàn)老化該怎么做

電子地磅的稱重儀表出現(xiàn)老化該怎么做

發(fā)表于 03-11 13:24 ?1177次閱讀

消除VCR電阻電壓系數(shù)影響，你該怎么做？

消除VCR電阻電壓系數(shù)影響，你該怎么做？

發(fā)表于 12-15 16:40 ?625次閱讀

RM新时代网站-首页

搜索歷史

如果我們想讓AI通過觀察人類行為學會打游戲，我們該怎么做？

評論

不寒而栗：機器人只需看看就能模仿人類

教你如何通過邊打游戲邊學編程

想讓家里的電燈照度可調(diào) 應(yīng)該怎么做？

當我們談?wù)摍C器人的時候，我們到底該談什么？

程序員之我們都該學會正確的失敗

如何在基于Arm的設(shè)備上運行游戲AI呢

Versa 是怎樣做 AI 的，以及小公司如何做 AI 才能贏

首款經(jīng)濟行為學游戲化實驗上線了

西悉尼大學已推出網(wǎng)絡(luò)安全與行為學位

AI終會讀懂我們人類嗎

真菌毒素檢測我們該怎么做

真菌毒素檢測我們該怎么做

真菌毒素檢測我們該怎么做

電子地磅的稱重儀表出現(xiàn)老化該怎么做

消除VCR電阻電壓系數(shù)影響，你該怎么做？

搜索歷史

如果我們想讓AI通過觀察人類行為學會打游戲，我們該怎么做？

評論

如果我們想讓AI通過觀察人類行為學會打游戲，我們該怎么做？