資料介紹
描述
強(qiáng)化學(xué)習(xí)是人工智能的一個分支,計(jì)算機(jī)通過與問題直接交互來了解問題。該項(xiàng)目使用強(qiáng)化學(xué)習(xí)來嘗試學(xué)習(xí)在舊 iPhone 上玩 Doodle Jump 游戲。相機(jī)每秒從 iphone 拍攝 30 張圖像。對這些圖像進(jìn)行分析,然后一個簡單的機(jī)器人通過旋轉(zhuǎn) iPhone 并按下屏幕上的按鈕來操縱 iPhone。
硬件
該項(xiàng)目的“智能”部分是運(yùn)行機(jī)器人操作系統(tǒng) (ROS) 和 TensorFlow 的 Nvidia Jetson。機(jī)器人包括:
- 用于旋轉(zhuǎn) iPhone 的步進(jìn)電機(jī)。
- 用于按下 iPhone 屏幕上的按鈕的伺服電機(jī)和螺線管。
- Ximea 相機(jī)用于捕捉 iPhone 屏幕的圖片,并通過 USB3 將它們提供給 Jetson。
- EIBot 板驅(qū)動步進(jìn)器和伺服系統(tǒng)。
- 復(fù)古外觀的盒子中還有一個電源,可為 Jetson 提供 12 伏電壓,為 EIBot 板提供 19 伏電壓,為 USB 集線器提供 5 伏電壓。
- 用于運(yùn)行 Linux 和控制事物的鍵盤、鼠標(biāo)和顯示器。
軟件
ROS 是構(gòu)建此類項(xiàng)目的絕佳方式。使用 ROS,我可以將系統(tǒng)構(gòu)建為一組使用標(biāo)準(zhǔn)消息傳遞系統(tǒng)進(jìn)行通信的獨(dú)立進(jìn)程。該項(xiàng)目包括 C++ 和 Python 進(jìn)程。消息編譯器以兩種語言構(gòu)建存根,因此可以輕松傳遞消息。ROS的主要模塊包括:
- 從相機(jī)接收圖像的相機(jī)驅(qū)動程序。
- 從屏幕上讀取分?jǐn)?shù)的簡單神經(jīng)網(wǎng)絡(luò)。
- 一個更大的、基于 TensorFlow 的神經(jīng)網(wǎng)絡(luò),用于分析從相機(jī)接收到的圖片。這是通過與機(jī)器人交互訓(xùn)練的網(wǎng)絡(luò)。
- 一個存檔過程,負(fù)責(zé)將操作和屏幕圖像保存在 sqlite 數(shù)據(jù)庫中以供以后訓(xùn)練使用。
- EIBot 板驅(qū)動程序。
- 屏幕驅(qū)動程序。
強(qiáng)化學(xué)習(xí)
人工智能的強(qiáng)化學(xué)習(xí)分支是最活躍的領(lǐng)域之一。該系統(tǒng)使用一種稱為模仿學(xué)習(xí)的變體。我使用機(jī)器人操縱 iPhone 玩了數(shù)百場 Doodle Jump 游戲。系統(tǒng)存檔圖像和我采取的行動。這些圖像和動作被用作神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集。在系統(tǒng)開始做任何有意義的事情之前,它需要數(shù)千張訓(xùn)練圖像。目前該系統(tǒng)可以玩一個基本的游戲。它不會瘋狂??地按下按鈕或隨機(jī)搖動屏幕。作為學(xué)習(xí)的一部分,我會盡可能及時地糾正錯誤的決定。這些游戲和修正,以及隨機(jī)選擇的最后 20K 張圖像,在每次運(yùn)行后用作訓(xùn)練。
這個過程比我預(yù)期的要慢得多。我希望通過采用更復(fù)雜的學(xué)習(xí)模型來改進(jìn)事情,我希望讓系統(tǒng)松散以自行學(xué)習(xí)。
- 使用Matlab進(jìn)行強(qiáng)化學(xué)習(xí)電子版資源下載 0次下載
- 基于強(qiáng)化學(xué)習(xí)的虛擬場景角色乒乓球訓(xùn)練 62次下載
- 基于深度強(qiáng)化學(xué)習(xí)的無人機(jī)控制律設(shè)計(jì)方法 46次下載
- 一種新型的多智能體深度強(qiáng)化學(xué)習(xí)算法 36次下載
- 基于深度強(qiáng)化學(xué)習(xí)仿真集成的壓邊力控制模型 0次下載
- 基于強(qiáng)化學(xué)習(xí)的壯語詞標(biāo)注方法 14次下載
- 虛擬乒乓球手的強(qiáng)化學(xué)習(xí)模仿訓(xùn)練方法 12次下載
- 基于深度強(qiáng)化學(xué)習(xí)的路口單交叉信號控制 21次下載
- 強(qiáng)化學(xué)習(xí)的雙權(quán)重最小二乘Sarsa算法 5次下載
- 模型化深度強(qiáng)化學(xué)習(xí)應(yīng)用研究綜述 9次下載
- 機(jī)器學(xué)習(xí)中的無模型強(qiáng)化學(xué)習(xí)算法及研究綜述 11次下載
- 一種基于多智能體協(xié)同強(qiáng)化學(xué)習(xí)的多目標(biāo)追蹤方法 20次下載
- 人工智能到底是什么?什么工作需要學(xué)習(xí)人工智能 17次下載
- 人工智能深度學(xué)習(xí)處理架構(gòu)的演進(jìn)GPU功耗和延遲問題如何解決 28次下載
- 強(qiáng)化學(xué)習(xí)在RoboCup帶球任務(wù)中的應(yīng)用劉飛 0次下載
- 通過強(qiáng)化學(xué)習(xí)策略進(jìn)行特征選擇 210次閱讀
- 機(jī)器學(xué)習(xí)是如何工作的? 人工智能與機(jī)器學(xué)習(xí)實(shí)例 1963次閱讀
- 懶惰強(qiáng)化學(xué)習(xí)算法在發(fā)電調(diào)控REG框架的應(yīng)用 858次閱讀
- 如何避開人工智能的陷阱 1179次閱讀
- 對NAS任務(wù)中強(qiáng)化學(xué)習(xí)的效率進(jìn)行深入思考 4888次閱讀
- 量化深度強(qiáng)化學(xué)習(xí)算法的泛化能力 2275次閱讀
- 如何構(gòu)建強(qiáng)化學(xué)習(xí)模型來訓(xùn)練無人車算法 4769次閱讀
- 基于強(qiáng)化學(xué)習(xí)的MADDPG算法原理及實(shí)現(xiàn) 2.1w次閱讀
- 用PopArt進(jìn)行多任務(wù)深度強(qiáng)化學(xué)習(xí) 5546次閱讀
- 強(qiáng)化學(xué)習(xí)環(huán)境研究,智能體玩游戲?yàn)槭裁磪柡?/a> 3530次閱讀
- 什么是強(qiáng)化學(xué)習(xí)?純強(qiáng)化學(xué)習(xí)有意義嗎?強(qiáng)化學(xué)習(xí)有什么的致命缺陷? 1.7w次閱讀
- 探討機(jī)器學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、NLP、計(jì)算機(jī)視覺最新進(jìn)展 5547次閱讀
- 人工智能強(qiáng)化學(xué)習(xí)的原理和目標(biāo) 4730次閱讀
- 5個頂級的人工智能開源工具 6100次閱讀
- 利用強(qiáng)化學(xué)習(xí)探索多巴胺對學(xué)習(xí)的作用 4613次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數(shù)據(jù)手冊
- 1.06 MB | 532次下載 | 免費(fèi)
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費(fèi)
- 3TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費(fèi)
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費(fèi)
- 5元宇宙深度解析—未來的未來-風(fēng)口還是泡沫
- 6.40 MB | 227次下載 | 免費(fèi)
- 6迪文DGUS開發(fā)指南
- 31.67 MB | 194次下載 | 免費(fèi)
- 7元宇宙底層硬件系列報(bào)告
- 13.42 MB | 182次下載 | 免費(fèi)
- 8FP5207XR-G1中文應(yīng)用手冊
- 1.09 MB | 178次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33566次下載 | 免費(fèi)
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費(fèi)
- 4開關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21549次下載 | 免費(fèi)
- 5電氣工程師手冊免費(fèi)下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費(fèi)
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費(fèi)
- 7電子制作實(shí)例集錦 下載
- 未知 | 8113次下載 | 免費(fèi)
- 8《LED驅(qū)動電路設(shè)計(jì)》 溫德爾著
- 0.00 MB | 6656次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537798次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191187次下載 | 免費(fèi)
- 7十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183279次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138040次下載 | 免費(fèi)
評論
查看更多