RM新时代网站-首页

電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示
創(chuàng)作
電子發(fā)燒友網>電子資料下載>人工智能>數(shù)據(jù)高效的第三人稱模仿學習方法綜述

數(shù)據(jù)高效的第三人稱模仿學習方法綜述

2021-04-14 | pdf | 1.84 MB | 次下載 | 免費

資料介紹

  模仿學習提供了一種能夠使智能體從專家示范中學習如何決策的框架。在學習過程中,智能體無需與專家進行交互也不依賴于環(huán)境的獎勵信號,而只需要大量的專家示范。經典的模仿學習方法霱要使用第一亼稱的專家示范,該示范由一個狀態(tài)序列以及對應的專家動作序列組成。但是,在現(xiàn)實生活中,專家示范通常以第三人稱視頻的形式存在。相比第一人稱專家示范,第三人稱示范的觀察視角與智能體的存在差異,導致兩者之間缺乏一一對應關系,因此第三人稱示范無法被直接用于模仿學習中。針對此問題,文中提出了一種數(shù)據(jù)高效的第三人稱模仿學習方法。首先,該方法在生成對抗模仿學習的基礎上引入了圖像差分方法,利用馬爾可夫決策過程的馬爾可夫性質以及其狀態(tài)的時間連續(xù)性,去除環(huán)境背景、顏色等領域特征,以得到觀察圖像中與行為策略最相關的部分,并將其用于模仿學習;其次,該方法引入了一個變分判別器瓶頸,以對判別器進行限制,進步削弱了領域特征對策略學習的影響。為了驗證所提算法的性能,通過 Mujoc?o平臺中的3個實驗環(huán)境對其進行了測試,并與已有算法進行了比較。實驗結釆表明,與已有的模仿學習方法相比,該方法在第三人稱模仿學習任務中具有更妤的性能表現(xiàn),并且不需要額外増加對樣本的需求。

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1電子電路原理第七版PDF電子教材免費下載
  2. 0.00 MB  |  1491次下載  |  免費
  3. 2單片機典型實例介紹
  4. 18.19 MB  |  95次下載  |  1 積分
  5. 3S7-200PLC編程實例詳細資料
  6. 1.17 MB  |  27次下載  |  1 積分
  7. 4筆記本電腦主板的元件識別和講解說明
  8. 4.28 MB  |  18次下載  |  4 積分
  9. 5開關電源原理及各功能電路詳解
  10. 0.38 MB  |  11次下載  |  免費
  11. 6100W短波放大電路圖
  12. 0.05 MB  |  4次下載  |  3 積分
  13. 7基于單片機和 SG3525的程控開關電源設計
  14. 0.23 MB  |  4次下載  |  免費
  15. 8基于AT89C2051/4051單片機編程器的實驗
  16. 0.11 MB  |  4次下載  |  免費

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234313次下載  |  免費
  3. 2PADS 9.0 2009最新版 -下載
  4. 0.00 MB  |  66304次下載  |  免費
  5. 3protel99下載protel99軟件下載(中文版)
  6. 0.00 MB  |  51209次下載  |  免費
  7. 4LabView 8.0 專業(yè)版下載 (3CD完整版)
  8. 0.00 MB  |  51043次下載  |  免費
  9. 5555集成電路應用800例(新編版)
  10. 0.00 MB  |  33562次下載  |  免費
  11. 6接口電路圖大全
  12. 未知  |  30320次下載  |  免費
  13. 7Multisim 10下載Multisim 10 中文版
  14. 0.00 MB  |  28588次下載  |  免費
  15. 8開關電源設計實例指南
  16. 未知  |  21539次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935053次下載  |  免費
  3. 2protel99se軟件下載(可英文版轉中文版)
  4. 78.1 MB  |  537793次下載  |  免費
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420026次下載  |  免費
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234313次下載  |  免費
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費
  11. 6電路仿真軟件multisim 10.0免費下載
  12. 340992  |  191183次下載  |  免費
  13. 7十天學會AVR單片機與C語言視頻教程 下載
  14. 158M  |  183277次下載  |  免費
  15. 8proe5.0野火版下載(中文版免費下載)
  16. 未知  |  138039次下載  |  免費
RM新时代网站-首页