基于分層強(qiáng)化學(xué)習(xí)的多Agent路徑規(guī)劃
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論(0)
針對(duì)路徑規(guī)劃算法收斂速度慢及效率低的問題,提出了一種基于分層強(qiáng)化學(xué)習(xí)及人工勢(shì)場的多Agent路徑規(guī)劃算法。首先,將多Agent的運(yùn)行環(huán)境虛擬為一個(gè)人工勢(shì)能場,根據(jù)先驗(yàn)知識(shí)確定每點(diǎn)的勢(shì)能值,它代表最優(yōu)策略可獲得的最大回報(bào);其次,利用分層強(qiáng)化學(xué)習(xí)方法的無環(huán)境模型學(xué)習(xí)以及局部更新能力將策略更新過程限制在規(guī)模較小的局部空間或維度較低的高層空間上,提高學(xué)習(xí)算法的性能;最后,針對(duì)出租車問題在柵格環(huán)境中對(duì)所提算法進(jìn)行了仿真實(shí)驗(yàn)。為了使算法貼近真實(shí)環(huán)境,增加算法的可移植性,在三維仿真環(huán)境中對(duì)該算法進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果表明該算法收斂速度快,收斂過程穩(wěn)定。
非常好我支持^.^
(0) 0%
不好我反對(duì)
(0) 0%
下載地址
基于分層強(qiáng)化學(xué)習(xí)的多Agent路徑規(guī)劃下載
相關(guān)電子資料下載
- 使用 GPT4V+AI Agent 做自動(dòng) UI 測(cè)試的探索 126
- 首批!數(shù)勢(shì)科技SwiftAgent完成中國信通院大模型驅(qū)動(dòng)的智能數(shù)據(jù)分析工具專項(xiàng)測(cè) 154
- 鴻蒙開發(fā)接口公共事件與通知:【@ohos.reminderAgent (后臺(tái)代理提醒)】 303
- 閃耀AICon!數(shù)勢(shì)科技正式發(fā)布全新智能分析產(chǎn)品SwiftAgent 2.0 129
- 有視覺記憶的Agent、大變身的搜索、更強(qiáng)的AI全家桶和大一統(tǒng)的Gemini|現(xiàn)場圍觀 445
- 鴻蒙開發(fā)接口Ability框架:【@ohos.wantAgent (WantAgent模塊)】 604
- Atlassian首次推出Rovo,為企業(yè)提供上下文搜索及添加自定義Agent 186
- 中軟國際AI Agent場景案例榮膺“2023年軟件行業(yè)典型示范案例”殊榮 249
- MCU項(xiàng)目實(shí)現(xiàn)應(yīng)用與硬件分層管理的關(guān)鍵步驟 181
- 微軟推出首個(gè)專為Windows定制的Agent 559