過去幾年間,隨著 AI 的發展,一個屬于機器人的萬億級賽道正在火熱開啟,無論是 Google 、特斯拉,還是國內的達闥、追覓、以及稚暉君創業的「智元機器人(AGIBot)」公司均投身其中。
不過,對于普通用戶而言,機器人最為重要的并不是設計得多么好看,而是實用性。在當代年輕人的“精致懶”之吃飯要人弄、家務要人做狀態下,如果有一款集做飯、收納、保潔等多個才藝于一身的機器人,豈不美哉!
近日,斯坦福大學 3 位研究人員讓許多用戶的美夢成真了,其發布了一款名為Mobile Aloha的 AI 機器人。一經展示之后,這款機器人便迅速在網絡上走紅,成為不少人想人手一個的大熱門產品。
只因為它,不僅可以煎大蝦,親自端上桌:
也能收拾不小心灑出來的水漬:
還能打開柜門,歸納整理:
刷碗:
簡單來看,Mobile Aloha 是一種用于雙手遙控操作的低成本開源硬件系統,解決了訓練需要人類操作員仔細指導的移動雙手機器人的高成本和技術挑戰。
值得一提的是,Mobile Aloha 能實現以上操作,并非完全自主,其全身也支持遠程操作。
得益于生成模型的成功,MobileAloha 可以快速從人類演示中學習,而且它可以只通過 50 次的演示就能學會一件事,合作訓練可以提高成功率高達 90%。
同時,整個機器人機載電源和計算在內的成本為3.2 萬美元,遠遠低于市場現有的系統及硬件。更讓人興奮的是,Mobile Aloha 的軟硬件均是開源的,也方便所有的 AI 愛好者、開發者深入學習與共建。
左:用戶通過遙控操作從冰箱中獲取食物;右圖:Mobile ALOHA 可以通過模仿學習完成復雜的長時間任務
硬件代碼:https://github.com/MarkFzp/mobile-aloha
軟件代碼:https://github.com/MarkFzp/act-plus-plus
項目地址:https://mobile-aloha.github.io/
研究 5 年,以低成本打破傳統機器人系統的局限性
項目的負責人之一 Tony Z.Zhao 表示,“這個我過去 5 年里最努力的項目之一!”
而之所以會萌生開發這樣一款會做飯的 AI 機器人,是因為該研究團隊發現,大多數機器人操縱任務都側重于桌面操縱。這包括最近基于 Transformer 和 Diffusion 模型(廣泛應用于生成式人工智能的架構)建立的一系列模型。
然而,日常環境中的許多任務都需要全身協調的流動性和靈巧的操作。譬如,把一個罐子放進廚房的柜子里,那么,機器人需要首先導航到柜子邊上,這就需要機器人底座可以移動;進而為了打開櫥柜,機器人需要后退,同時牢牢抓住兩個門把手,激發全身控制;隨后雙臂需要抓住鍋柄,一起將鍋放入櫥柜,雙手也要協調好。
在研究人員來看,過去有兩個主要因素阻礙了模仿學習在雙臂移動操作中的廣泛應用:
缺乏可訪問的、即插即用的全身遠程控制硬件。當然并不是說市面上沒有這種硬件,而是如果購買現成的機械手,成本會很高。像 PR2 和 TIA GO 這樣的機器人價格可能超過 20萬美元,這讓很多研究實驗室無法負擔。此外,要在這些平臺上實現遠程控制操作,還需要額外的硬件和校準。
以前的機器人學習工作沒有表現出高性能的雙臂移動操作復雜的任務。隨著自由度的增加,手臂和基礎動作之間的交互可能會變得復雜,基礎姿勢的微小偏差可能會導致手臂末端執行器姿勢的大幅偏移。
在論文中,研究員表示,“立足于硬件和學習的角度,以前的工作還沒有為雙臂移動操作提供一個實用而有說服力的解決方案。”
現如今隨著 AI 的發展,機器人到底可以不可以做到移動并實現協調全身去完成任務。研究人員研究了將模仿學習擴展到需要雙臂移動機器人全身控制的任務可行性。
https://mobile-aloha.github.io/resources/mobile-aloha.pdf
MobileALOHA 的研發
在硬件維度,研究人員提出了 MobileALOHA,擴展了原始ALOHA的功能,這是一種低成本和全身遠程控制系統,用于收集雙臂移動操作數據。
在硬件設計時,研究人員主要從四個維度切入考慮:
移動速度要快:與人類的行走速度相媲美,約為 1.42 米/秒。
穩定性:在拿起沉重的家居物品時,如鍋、吸塵器時,它是穩定的。
支持全身遠程控制:所有的自由度可以同時遠程操作,包括雙臂和移動底座。
不受限制:板載電源和計算。
要想實現 MobileALOHA 的靈活性,研究員在它的下方安裝了一個專為倉庫設計的輪子底座——Tracer AGV,它可以承載 100kg,移動速度高達 1.6m/s,而成本只有 7000 美元。
為了使 Mobile ALOHA 不受限制,研究人員配備了一個 1.26 千瓦時的電池,重量在 14 公斤,這樣還可以壓住機器人,防止不平衡摔倒。此外,整個裝置還包括網絡攝像頭和一個搭載消費級 GPU 的筆記本電腦,成本共計約為 3.2 萬美元,比現成的雙臂機器人便宜得多。
研究員在論文中介紹道,Mobile ALOHA 可同時遙控所有自由度。人類操作員的腰部被用物理的方式拴在系統上,并反向驅動車輪,在工作環境中駕駛系統,同時用控制器控制機器人手臂。同時,研究人員記錄基本速度數據和手臂操縱數據,形成一個全身遠程控制操作系統。
這樣,機器人控制系統就能同時學習動作和其他控制指令。一旦收集到足夠的信息,模型就能自主地重復一系列任務。
在模仿學習方面,Mobile ALOHA 利用了 Transformer(大型語言模型中使用的架構)。最初的 ALOHA 系統使用了一種名為 Action Chunking with Transformers (ACT) 的架構,它將來自多個視點和關節位置的圖像作為輸入并預測一系列動作。
MobileALOHA 將運動信號添加到輸入向量中,從而擴展了該系統。這種方法可以讓 Mobile ALOHA 重復使用以前的深度模仿學習算法,而只需做最小的改動。
在論文中,研究人員寫道:“我們觀察到,簡單地將底座和手臂動作連接起來,然后通過直接模仿學習進行訓練,就可以產生出色的表現。具體來說,我們將 ALOHA 的 14-DoF 關節位置與移動底座的線速度和角速度連接起來,形成 16 維動作向量。”
與此同時,研究人員汲取了近期業界在預訓練和不同機器人數據集上取得的成功經驗,并利用靜態雙臂數據集的信息,逐步提高模仿學習的性能。
在演示中,研究員展示了訓練有素的機器人烹飪三道菜,并執行了一些精細的任務,例如打碎雞蛋、切碎大蒜、倒液體、拆開蔬菜包裝以及在煎鍋中翻轉雞肉。
此外,Mobile ALOHA 還可以執行各種家務任務,包括給植物澆水、使用真空吸塵器、裝卸洗碗機、從冰箱中取出飲料、操作洗衣機。
研究人員表示:“通過協同訓練,我們只需對每項任務進行 50 次人類演示,就能在這些任務上取得超過 80% 的成功,與沒有協同訓練相比,平均絕對提高了 34%。”
Mobile ALOHA 背后的研究員
Mobile ALOHA 的到來,不僅打破了很多傳統機器人的局限性,也讓我們看到了這個年輕人團隊為 AI 帶來的無限潛力。
正如文章伊始所述,Mobile ALOHA出自斯坦福大學 3 位研究人員之手,也是華人團隊。
Zipeng Fu(項目聯合負責人)
Zipeng Fu,是斯坦福人工智能實驗室計算機科學專業的博士生,導師是Chelsea Finn。
同時,他還是 GoogleDeepMind 的學生研究員,與Google Brain Robotics機器人運動和安全團隊的技術主管經理Jie Tan一起工作。
此前,ZipengFu在加州大學洛杉磯分校完成了計算機科學與應用數學學士學位,導師是Song-Chun Zhu,后來在CMU 攻讀機器學習領域的碩士,并在機器人研究所擔任學生研究員,導師是 Deepak Pathak 和 Jitendra Malik。
他的研究興趣在于機器人學、機器學習和計算機視覺的交叉領域。重點關注機器人在非結構化開放世界中的強大性能和可部署機器人系統。
Tony Z. Zhao(項目聯合負責人)
Tony Z. Zhao 是斯坦福大學計算機科學博士三年級學生,導師同是 Chelsea Finn。同時,他也是 Google Deepmind 的兼職學生研究員。
此前,Tony Z. Zhao 在特斯拉自動駕駛汽車公司和 Google X Intrinsic 實習。于 2021 年獲得伯克利大學電子工程科學學士學位,導師是 Sergey Levine和 Dan Klein。
“我想讓機器人能夠執行復雜的精細操作任務。我對初創企業和自主機器人的未來感到興奮”,Tony Z. Zhao 寫道。
Chelsea Finn(顧問)
Chelsea Finn是斯坦福大學計算機科學與電子工程系助理教授。她的實驗室 IRIS 主攻研究大規模機器人交互智能,隸屬于 SAIL 和ML小組。
除了教授職位之外,Chelsea Finn 在 Google 任職,是 Google Brain 團隊的一員。
此前,Chelsea Finn 在加州大學伯克利分校獲得了計算機科學博士學位,并在麻省理工學院獲得了電子工程和計算機科學學士學位。
項目負責人現身發布翻車視頻:并未做好接管世界的準備!
隨著研究人員將這一項目對外公開,不少網友開始期待:「感覺我以后養老可以靠它了,現在開始攢錢,然后讓機器人給我打工!」
不過,這樣的幻想還沒有持續多久,該項目負責人之一的 Tony Z.Zhao 緊急在 Twitter 上又發布一則視頻,為 Mobile ALOHA 潑了一盆冷水。其表示,“機器人還沒有準備好接管世界!我剛剛制作了一個視頻,記錄了在自主模式下犯下的最愚蠢的錯誤 Mobile ALOHA。我們還計劃在休息后組織一些現場演示。敬請關注!”
在視頻中,Mobile ALOHA 在自主模式下,不僅手抖,將酒杯里的水灑出來了,還讓它自由落體,變成了玻璃渣:
弄翻了鍋,研究員都來不及挽救:
Tony Z.Zhao 對此說道,「老實說,這可能是迄今為止我最喜歡的視頻,當它在你面前失敗時就不那么有趣了」。同時,他還向 2015 年 DARPA 機器人挑戰賽、波士頓機器人失敗的案例致敬。
其實,Tony Z.Zhao在Mobile ALOHA 爆火一天后選擇公布“幕后花絮”,實則也是希望更多的人保持理性,減少炒作。在 AI 快速發展背后,其實也依然存在很多的不足,我們應該正確對待 AI 的發展,也要勇于面對失敗,畢竟失敗是成功非常重要的一個過程。
-
機器人
+關注
關注
213文章
29482瀏覽量
211542 -
AI
+關注
關注
87文章
34197瀏覽量
275353 -
模型
+關注
關注
1文章
3486瀏覽量
49990
原文標題:3.2萬美元造成的斯坦福雙臂機器人爆紅后,項目負責人親自發翻車視頻
文章出處:【微信號:AI科技大本營,微信公眾號:AI科技大本營】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
人型機器人爆火后,復合型機器人該何去何從?
【「# ROS 2智能機器人開發實踐」閱讀體驗】機器人入門的引路書
詳解《斯坦福 AI 報告 2025》:國產模型崛起、清華論文領先

名單公布!【書籍評測活動NO.58】ROS 2智能機器人開發實踐
斯坦福STANFORD FS725銣鐘
樂聚機器人回應華為合作傳聞
樂聚機器人回應與華為合作傳聞:未發布相關信息
三星芯片部門任命新負責人
原小鵬機器人設計負責人孫兆治創業項目獲千萬元天使輪融資
開源項目!用ESP32做一個可愛的無用機器人
OpenAI硬件負責人熱議AI基礎設施擴展與節能方案
這位來自大疆、霍尼韋爾的傳感器專家,創業造機器人了

國產儀器崛起:斯坦福替代方案來了!

評論