Facebook AI研究人員將CraftAssist開源,這是一個為Minecraft視頻游戲構(gòu)建交互式助手機器人的框架。這些機器人使用自然語言理解(NLU)來解析和執(zhí)行人類玩家的文本命令,例如在游戲世界中建造房屋的請求。研究人員可以擴展該框架的模塊化結(jié)構(gòu),以執(zhí)行自己的ML實驗。
研究團隊在最近的博客文章中對該系統(tǒng)進行了概述。CraftAssist機器人使用與標準游戲客戶端相同的協(xié)議連接到游戲,因此可以執(zhí)行人類玩家可以執(zhí)行的任何操作。機器人使用Minecraft的內(nèi)置基于文本的聊天界面與其他玩家進行交互。人類可以向機器人發(fā)出命令,包括高級指令,例如“在藍色立方體旁邊蓋房子”。該發(fā)行版的目的是幫助改善人與人工智能的協(xié)作:
該平臺旨在支持對與人類參與者指定和評估的各種任務(wù)交互有趣并有用的代理的研究。為了鼓勵更廣泛的AI研究社區(qū)將Craftcraft平臺用于他們自己的實驗,我們正在開放框架,基線助手以及用于構(gòu)建它的工具和數(shù)據(jù)的外包。
從廣義上講,機器人控制系統(tǒng)由感知和動作選擇子系統(tǒng)組成。感知是將原始傳感器數(shù)據(jù)轉(zhuǎn)換為更抽象的表示;例如,圖像識別是一種感知任務(wù),它將圖像像素轉(zhuǎn)換為描述圖像內(nèi)容的文本標簽。當對包含許多傳感器輸入示例和所需輸出的示例的數(shù)據(jù)集進行訓(xùn)練時,現(xiàn)代的深度學(xué)習(xí)模型可以在許多視覺和NLU任務(wù)上實現(xiàn)接近人類水平的性能。
動作選擇是機器人“決定”如何與世界互動以實現(xiàn)某個目標的過程。例如,為了贏得圍棋而做出的舉動。許多成功的系統(tǒng)都使用強化學(xué)習(xí)(RL),在這種學(xué)習(xí)中,機器人會反復(fù)嘗試執(zhí)行任務(wù),每次嘗試都會給出數(shù)值獎勵 結(jié)果。游戲是RL的常見測試平臺,因為它們具有明確的動作和結(jié)果集,而經(jīng)過RL訓(xùn)練的現(xiàn)代機器人在許多不同的游戲中通常都可以勝過人類的頂級能力。某些研究小組(例如Google的DeepMind)將感知和動作選擇子系統(tǒng)組合到一個由受訓(xùn)者訓(xùn)練的單一“端到端”系統(tǒng)中深度強化學(xué)習(xí),還有許多用于訓(xùn)練這些系統(tǒng)的虛擬環(huán)境,包括 Facebook開發(fā)的模擬棲息地。微軟已經(jīng)為Minecraft開源了一個名為Project Malmo的“ AI-gym”界面以及一個大型數(shù)據(jù)集,以鼓勵將Minecraft用作RL研究的測試平臺。
-
機器人
+關(guān)注
關(guān)注
213文章
29514瀏覽量
211662 -
Facebook
+關(guān)注
關(guān)注
3文章
1432瀏覽量
56218 -
開源
+關(guān)注
關(guān)注
3文章
3618瀏覽量
43505
發(fā)布評論請先 登錄
明遠智睿SSD2351開發(fā)板:語音機器人領(lǐng)域的變革力量
艾摩星機器人與小工匠機器人簽署股權(quán)轉(zhuǎn)讓框架協(xié)議
【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】視覺實現(xiàn)的基礎(chǔ)算法的應(yīng)用
【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】機器人入門的引路書
【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】+內(nèi)容初識
大象機器人攜手進迭時空推出 RISC-V 全棧開源六軸機械臂產(chǎn)品
東軟聯(lián)合推出新一代全語言交互式人社服務(wù)機器人“南小寧”
名單公布!【書籍評測活動NO.58】ROS 2智能機器人開發(fā)實踐
《AI Agent 應(yīng)用與項目實戰(zhàn)》閱讀心得2——客服機器人、AutoGen框架 、生成式代理
物理仿真人形機器人的統(tǒng)一全身控制策略

評論