女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

基于分層強(qiáng)化學(xué)習(xí)的多Agent路徑規(guī)劃

大小:0.88 MB 人氣: 2017-12-27 需要積分:2

  針對(duì)路徑規(guī)劃算法收斂速度慢及效率低的問題,提出了一種基于分層強(qiáng)化學(xué)習(xí)及人工勢(shì)場的多Agent路徑規(guī)劃算法。首先,將多Agent的運(yùn)行環(huán)境虛擬為一個(gè)人工勢(shì)能場,根據(jù)先驗(yàn)知識(shí)確定每點(diǎn)的勢(shì)能值,它代表最優(yōu)策略可獲得的最大回報(bào);其次,利用分層強(qiáng)化學(xué)習(xí)方法的無環(huán)境模型學(xué)習(xí)以及局部更新能力將策略更新過程限制在規(guī)模較小的局部空間或維度較低的高層空間上,提高學(xué)習(xí)算法的性能;最后,針對(duì)出租車問題在柵格環(huán)境中對(duì)所提算法進(jìn)行了仿真實(shí)驗(yàn)。為了使算法貼近真實(shí)環(huán)境,增加算法的可移植性,在三維仿真環(huán)境中對(duì)該算法進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果表明該算法收斂速度快,收斂過程穩(wěn)定。

基于分層強(qiáng)化學(xué)習(xí)的多Agent路徑規(guī)劃

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?