資料介紹
模仿學(xué)習(xí)提供了一種能夠使智能體從專家示范中學(xué)習(xí)如何決策的框架。在學(xué)習(xí)過程中,智能體無需與專家進行交互也不依賴于環(huán)境的獎勵信號,而只需要大量的專家示范。經(jīng)典的模仿學(xué)習(xí)方法霱要使用第一亼稱的專家示范,該示范由一個狀態(tài)序列以及對應(yīng)的專家動作序列組成。但是,在現(xiàn)實生活中,專家示范通常以第三人稱視頻的形式存在。相比第一人稱專家示范,第三人稱示范的觀察視角與智能體的存在差異,導(dǎo)致兩者之間缺乏一一對應(yīng)關(guān)系,因此第三人稱示范無法被直接用于模仿學(xué)習(xí)中。針對此問題,文中提出了一種數(shù)據(jù)高效的第三人稱模仿學(xué)習(xí)方法。首先,該方法在生成對抗模仿學(xué)習(xí)的基礎(chǔ)上引入了圖像差分方法,利用馬爾可夫決策過程的馬爾可夫性質(zhì)以及其狀態(tài)的時間連續(xù)性,去除環(huán)境背景、顏色等領(lǐng)域特征,以得到觀察圖像中與行為策略最相關(guān)的部分,并將其用于模仿學(xué)習(xí);其次,該方法引入了一個變分判別器瓶頸,以對判別器進行限制,進步削弱了領(lǐng)域特征對策略學(xué)習(xí)的影響。為了驗證所提算法的性能,通過 Mujoc?o平臺中的3個實驗環(huán)境對其進行了測試,并與已有算法進行了比較。實驗結(jié)釆表明,與已有的模仿學(xué)習(xí)方法相比,該方法在第三人稱模仿學(xué)習(xí)任務(wù)中具有更妤的性能表現(xiàn),并且不需要額外増加對樣本的需求。
- 數(shù)電三人搶答電路 23次下載
- protel dxp三人表決器 0次下載
- 面向異質(zhì)信息的網(wǎng)絡(luò)表示學(xué)習(xí)方法綜述 13次下載
- 基于腦電信號掃視軌跡的異質(zhì)遷移學(xué)習(xí)方法 12次下載
- 基于生成對抗網(wǎng)絡(luò)的雙循環(huán)遷移排序學(xué)習(xí)方法 4次下載
- 基于變分自編碼器的網(wǎng)絡(luò)表示學(xué)習(xí)方法 27次下載
- 基于生成對抗網(wǎng)絡(luò)的模仿學(xué)習(xí)研究綜述 2次下載
- 自編碼器基礎(chǔ)理論與實現(xiàn)方法、應(yīng)用綜述 9次下載
- 基于異質(zhì)網(wǎng)絡(luò)層次的基因節(jié)點表示學(xué)習(xí)方法 5次下載
- 最紅編程語言Python的入門學(xué)習(xí)方法資料概述 18次下載
- STM32單片機有哪些學(xué)習(xí)方法?STM32學(xué)習(xí)方法以及資料視頻資料免費下載 10次下載
- 《統(tǒng)計學(xué)習(xí)方法》李航詳細電子教材免費下載 0次下載
- ZigBee 簡介和學(xué)習(xí)方法 14次下載
- 第1章 ZigBee簡介和學(xué)習(xí)方法 8次下載
- 模擬電子電路的學(xué)習(xí)方法
- 深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)方法綜述 855次閱讀
- 爬蟲的學(xué)習(xí)方法 877次閱讀
- SiATL——最新、最簡易的遷移學(xué)習(xí)方法 3651次閱讀
- 面向人工智能的機器學(xué)習(xí)方法體系總結(jié) 3410次閱讀
- 機器學(xué)習(xí)入門寶典《統(tǒng)計學(xué)習(xí)方法》的介紹 4682次閱讀
- 如何學(xué)好機器學(xué)習(xí)?機器學(xué)習(xí)的學(xué)習(xí)方法4個關(guān)鍵點整理概述 6339次閱讀
- 74LS138和與非門設(shè)計三人表決器 74LS138設(shè)計詳解 17.5w次閱讀
- 斯坦福提出基于目標(biāo)的策略強化學(xué)習(xí)方法——SOORL 5438次閱讀
- 深度解析機器學(xué)習(xí)三類學(xué)習(xí)方法 1.4w次閱讀
- 解析圖像分類器結(jié)構(gòu)搜索的正則化異步進化方法 并和強化學(xué)習(xí)方法進行對比 3780次閱讀
- 74ls151實現(xiàn)三人表決器 20.4w次閱讀
- 讓機器人通過一段只有一個人的視頻來模仿學(xué)習(xí) 6213次閱讀
- 74LS153實現(xiàn)三人表決電路(4種方式實現(xiàn)3人表決電路) 37.9w次閱讀
- 模型驅(qū)動深度學(xué)習(xí)的標(biāo)準(zhǔn)流程與學(xué)習(xí)方法解析 4945次閱讀
- 盤點變頻器維修10種學(xué)習(xí)方法以及事例分析 6501次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費下載
- 0.00 MB | 1491次下載 | 免費
- 2單片機典型實例介紹
- 18.19 MB | 95次下載 | 1 積分
- 3S7-200PLC編程實例詳細資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識別和講解說明
- 4.28 MB | 18次下載 | 4 積分
- 5開關(guān)電源原理及各功能電路詳解
- 0.38 MB | 11次下載 | 免費
- 6100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 7基于單片機和 SG3525的程控開關(guān)電源設(shè)計
- 0.23 MB | 4次下載 | 免費
- 8基于AT89C2051/4051單片機編程器的實驗
- 0.11 MB | 4次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費
- 4LabView 8.0 專業(yè)版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費
- 5555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33562次下載 | 免費
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費
- 8開關(guān)電源設(shè)計實例指南
- 未知 | 21539次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537793次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191183次下載 | 免費
- 7十天學(xué)會AVR單片機與C語言視頻教程 下載
- 158M | 183277次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138039次下載 | 免費
評論