通用人形機器人旨在快速適應(yīng)現(xiàn)有的以人類為中心的城市和工業(yè)工作空間,處理繁瑣、重復(fù)或體力要求高的任務(wù)。這些移動機器人經(jīng)過設(shè)計,能在以人類為中心的環(huán)境中有出色的表現(xiàn),從工廠車間到醫(yī)療保健機構(gòu),它們的價值日益凸顯。
模仿學(xué)習(xí)是機器人學(xué)習(xí)的一個子集,它能讓人形機器人通過觀察和模仿人類專家的示范來獲取新技能。在真實世界中收集這些廣泛、高質(zhì)量的數(shù)據(jù)集既繁瑣又耗時,而且成本往往高得令人卻步。從物理精確的仿真環(huán)境中生成的合成數(shù)據(jù)有助于加快這一收集過程。
NVIDIA Isaac GR00T為人形機器人開發(fā)者提供機器人基礎(chǔ)模型、數(shù)據(jù)管線和仿真框架,有助于應(yīng)對人形機器人開發(fā)中所面對的這些挑戰(zhàn)。用于合成運動生成的NVIDIA Isaac GR00T Blueprint是一個用于模仿學(xué)習(xí)的仿真工作流程,使開發(fā)者能夠從少量人類示范中生成數(shù)量呈指數(shù)級擴增的數(shù)據(jù)集。
視頻 1.借助 NVIDIA Isaac GR00T 簡化數(shù)據(jù)收集
在本文中,我們將介紹如何通過 Apple Vision Pro 捕捉遠程操作數(shù)據(jù),使用 NVIDIA Isaac GR00T 從少數(shù)人類示范中生成大量合成軌跡數(shù)據(jù)集,然后在Isaac Lab中訓(xùn)練機器人運動策略模型。
合成運動生成
該工作流的包括以下關(guān)鍵組成部分:
GR00T-Teleop:
NVIDIA CloudXR:連接到 Apple Vision Pro 頭戴設(shè)備,使用專門為人形機器人遠程操作設(shè)計的定制 CloudXR 運行時,實現(xiàn)動作的流暢傳輸 。
Isaac XR Teleop:將遠程操作數(shù)據(jù)流式傳輸?shù)?strong>NVIDIA Isaac Sim或 Isaac Lab,作為 Apple Vision Pro 的參考應(yīng)用程序。
Isaac Lab:基于 Isaac Sim 的 Isaac Lab 是一個用于機器人學(xué)習(xí)的開源模塊化框架,使用這一框架,可以實現(xiàn)訓(xùn)練機器人策略。
GR00T-Mimic:通過少量人類示范生成大量合成運動軌跡數(shù)據(jù)。
GR00T-Gen:通過隨機化場景中的背景、光照和其他變量來增加多樣性,并通過NVIDIA Cosmos對生成的圖像進行放大處理。(在本文中,我們不會詳細介紹 GR00T-Gen。)
圖 1.遠程操作架構(gòu)
合成運動生成管線是一個復(fù)雜的過程,旨在創(chuàng)建一個龐大且多樣化的數(shù)據(jù)集來訓(xùn)練機器人。
它從數(shù)據(jù)收集開始,在這個過程中,將使用像 Apple Vision Pro 這樣的高保真設(shè)備,在仿真環(huán)境中捕捉人類的動作和行為。Apple Vision Pro 將手部追蹤數(shù)據(jù)傳輸?shù)饺?Isaac Lab 的仿真平臺,同時仿真平臺將機器人環(huán)境的沉浸式視圖傳輸回該設(shè)備。這種設(shè)置使得機器人操作更加直觀和互動,有助于收集高質(zhì)量的遠程操作數(shù)據(jù)。
圖 2.準備好通過 Apple Vision Pro 進行遠程操作的機器人
Isaac Lab 中的機器人仿真畫面被傳輸?shù)?Apple Vision Pro,讓您能夠可視化機器人的環(huán)境。通過移動手部,您可以直觀地控制機器人執(zhí)行各種任務(wù)。這種設(shè)置提供了沉浸式且互動的遠程操作體驗。
圖 3.Isaac Lab 中的遠程操作
使用 GR00T-Mimic 生成合成軌跡
數(shù)據(jù)收集后,下一步是合成軌跡生成。使用 Isaac GR00T-Mimic 從少量人類示范中推算出大量合成運動軌跡。
這個過程包括在示范中標記關(guān)鍵點,并使用插值法確保合成軌跡平滑且符合情境。然后對生成的數(shù)據(jù)進行評估和優(yōu)化,以滿足訓(xùn)練所需的標準。
在這個示例中,我們成功生成了 1,000 條合成軌跡。
a.機器人
拿起輪子
b.機器人將輪子
移到托盤
c.機器人將輪子
放到托盤上
圖 4.在 Isaac Lab 中生成的一組合成軌跡
在 Isaac Lab 中使用模仿學(xué)習(xí)進行訓(xùn)練
最后,使用模仿學(xué)習(xí)技術(shù),利用合成數(shù)據(jù)集對機器人進行訓(xùn)練。在這個階段,會訓(xùn)練一個策略,比如 Robomimic 套件的循環(huán)高斯混合模型(GMM),以模仿合成數(shù)據(jù)中的動作。
訓(xùn)練在比如 Isaac Lab 這樣的仿真環(huán)境中進行,并且通過多次試驗來評估訓(xùn)練后的策略的性能。這個管線顯著減少了開發(fā)和部署機器人系統(tǒng)所需的時間和資源,使其成為機器人領(lǐng)域的一個有價值的工具。
為了展示如何使用這些數(shù)據(jù),我們訓(xùn)練了一臺帶有夾爪的 Franka 機器人,在 Isaac Lab 中執(zhí)行堆疊任務(wù)。這個夾爪類似于人形機器人的“手”。
我們使用了來自 Robomimic 套件的帶有循環(huán) GMM 策略的行為克隆方法。該策略使用了兩個隱藏維度為 400 的長短期記憶(LSTM)層。
網(wǎng)絡(luò)的輸入包括機器人末端執(zhí)行器的位姿、夾爪狀態(tài)以及相對物體的位姿,而輸出是一個用于在 Isaac Lab 中驅(qū)動機器人的增量位姿動作。
使用由 1,000 次成功示范組成的數(shù)據(jù)集,并經(jīng)過 2,000 次迭代,我們實現(xiàn)了大約 50 次迭代 / 秒的訓(xùn)練速度(相當(dāng)于在 NVIDIA RTX GPU 上大約 0.5 小時的訓(xùn)練時間)。在 50 次實驗的平均結(jié)果中,訓(xùn)練策略在堆疊任務(wù)中的成功率為 84%。
圖 5.在 Isaac Lab 中訓(xùn)練的夾爪
開始使用
在本文中,我們討論了通過 NVIDIA Isaac GR00T 生成合成軌跡數(shù)據(jù),加速推進人形機器人運動策略學(xué)習(xí):
https://developer.nvidia.cn/isaac/gr00t
GR00T-Teleop 堆棧目前還處于僅限受邀用戶訪問的階段。加入人形機器人開發(fā)者計劃,以便在該堆棧進入測試版時獲取使用權(quán)限:
https://developer.nvidia.com/humanoid-robot-program
-
Apple
+關(guān)注
關(guān)注
1文章
935瀏覽量
53632 -
NVIDIA
+關(guān)注
關(guān)注
14文章
5238瀏覽量
105766 -
人形機器人
+關(guān)注
關(guān)注
7文章
686瀏覽量
17464
原文標題:人形機器人訓(xùn)練新解:當(dāng) NVIDIA Isaac GR00T 遇上 Apple Vision Pro
文章出處:【微信號:Leadtek,微信公眾號:麗臺科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
NVIDIA 通過云端至機器人計算平臺驅(qū)動人形機器人技術(shù),賦能物理 AI

NVIDIA與光輪智能合作實現(xiàn)GR00T N1落地汽車工廠
借助OpenUSD與合成數(shù)據(jù)推動人形機器人發(fā)展
NVIDIA Isaac GR00T 詳細解析
NVIDIA發(fā)布GR00T N1基礎(chǔ)模型等方案,人形機器人開發(fā)效率顯著提升
NVIDIA Isaac GR00T N1開源人形機器人基礎(chǔ)模型+開源物理引擎Newton加速機器人開發(fā)
NVIDIA發(fā)布全球首個開源人形機器人基礎(chǔ)模型Isaac GR00T N1
機器人Blue亮相 搭載英偉達最新GR00T N1人形機器人通用基礎(chǔ)模型

深度解讀GR00T N1:英偉達開源人形機器人功能模型的技術(shù)革新與行業(yè)影響
NVIDIA 發(fā)布全球首個開源人形機器人基礎(chǔ)模型 Isaac GR00T N1——并推出加速機器人開發(fā)的仿真框架

智元機器人基于NVIDIA Isaac GR00T打造高效仿真數(shù)據(jù)采集方案

NVIDIA發(fā)布Isaac GR00T Blueprint,加速人形機器人開發(fā)
NVIDIA推出Isaac GR00T Blueprint
NVIDIA發(fā)布人形機器人重磅更新!Isaac GR00T Blueprint厲害在哪?

NVIDIA Isaac 機器人平臺利用最新的生成式 AI 和先進的仿真技術(shù),加速 AI 機器人技術(shù)的發(fā)展

評論