其他優(yōu)勝作品包括 AI 驅(qū)動的虛擬試衣應(yīng)用和一款能夠?qū)ふ疫z失物品的機器人等。
YouTube 機器人技術(shù)主播 Dave Niewinski 開發(fā)的機器人五花八門,從可駕駛的“La-Z-Boy”椅子到由 AI 引導(dǎo)的扔沙包機器人、馬車比賽機器人等。
他最近的交互式電子動畫 GLaDOS 項目成為了 Hackster AI 創(chuàng)新挑戰(zhàn)賽的九個優(yōu)勝作品之一。約 100 名參賽者通過創(chuàng)建開源項目、推動 AI 在邊緣計算、機器人和物聯(lián)網(wǎng)領(lǐng)域的應(yīng)用,來角逐由 NVIDIA 與 Sparkfun 提供的獎品。
Niewinski 根據(jù)視頻游戲開發(fā)商 Valve 的第一人稱解謎系列游戲《傳送門》(Portal)中的 GLaDOS 向?qū)ВO(shè)計出了一個創(chuàng)新機器人,該機器人贏得了生成式 AI 應(yīng)用組第一名。
另兩位優(yōu)勝者 Andrei Ciobanu 和 Allen Tao 分別獲得了邊緣生成式 AI 模型和邊緣 AI 應(yīng)用組的一等獎。Ciobanu 利用生成式 AI 幫助實現(xiàn)虛擬試衣,而 Tao 所開發(fā)的基于 ROS 的機器人可通過繪制家庭內(nèi)部地圖來幫助尋找物品。
將 LLM 應(yīng)用于機器人
Niewinski 在其位于加拿大安大略省滑鐵盧的 Armoury Labs 開發(fā)定制化的機器人應(yīng)用。他使用 NVIDIA Jetson 平臺開發(fā)邊緣 AI 和機器人技術(shù),并根據(jù)自己的經(jīng)驗創(chuàng)建開源教程和 YouTube 視頻。
為了給自己配備一名實驗室私人助理,他制作了一個自己的 GLaDOS 交互機器人。該機器人使用基于 Transformer 的語音識別、文本轉(zhuǎn)語音和大語言模型(LLM)處理查詢,這些功能與模型均在 NVIDIA Jetson AGX Orin 上運行,可與機械臂和攝像頭進行交互。
GLaDOS 可以追蹤 Niewinski 在實驗室中的行蹤,能夠朝不同的方向移動來面對他,并對詢問作出快速反應(yīng)。
Niewinski 表示:“我喜歡用機器人做一些出乎人們意料的事情。”
他希望這個助手的聲音能像《傳送門》中的原版 GLaDOS 一樣,并且能夠迅速作出反應(yīng)。幸運的是,游戲公司 Valve 把《傳送門》和《傳送門 2》中的所有語音臺詞都放在了自己的網(wǎng)站上,Niewinski 可以下載該音頻來訓(xùn)練模型。
他提到:“使用 Jetson 的話,一般的問答語音都能快速運行。”
Niewinski 利用 NVIDIA 的開源 NeMo 套件對 GLaDOS 的語音進行了微調(diào),訓(xùn)練出一個名為 FastPitch 的頻譜生成器網(wǎng)絡(luò)和一個名為 HiFiGAN 的聲碼器網(wǎng)絡(luò)來提高音頻質(zhì)量。
這兩個網(wǎng)絡(luò)都被部署到搭載 NVIDIA Riva 的 Orin 上,將語音識別與合成功能的運行速度優(yōu)化到數(shù)倍于語音的實時速度,使其能夠與 LLM 同步運行并保持流暢的交互傳輸。
為了讓 GLaDOS 生成符合現(xiàn)實的回答,Niewinski 使用了一個名為 OpenChat 的本地托管 LLM,該模型在 Docker 中運行,來自 jetson-containers。所有這些 AI 都在 Jetson 模塊上運行,使用的是由 CUDA 和 JetPack 構(gòu)建的最新開源 ML 軟件堆棧。
為了讓 GLaDOS 能夠移動,Niewinski 專門為宇樹科技 Z1 機械臂開發(fā)了交互功能。GLaDOS 可以通過一個立體攝像頭和多個模型來觀察和追蹤人類語言,其機械臂周圍裝上了 3D 打印的 GLaDOS 頭部和身體外殼。
借助生成式 AI 試遍新款服裝
來自羅馬尼亞的 Winner Ciobanu 希望借助生成式 AI 提升虛擬試衣體驗,他的作品 EdgeStyle: Fashion Preview at the Edge 奪得了第一名。
他使用 YOLOv5、SAM、OpenPose 等 AI 模型,從圖像和視頻中提取并完善數(shù)據(jù),然后使用 Stable Diffusion 生成圖像,他表示Stable Diffusion是實現(xiàn)精準虛擬試穿的關(guān)鍵所在。
Ciobanu 提到,這個系統(tǒng)教會了模型如何將衣服“穿”在不同姿勢的人身上,從而增強了試穿的真實感。
“這個系統(tǒng)非常方便,可以讓用戶不用真的去實際試穿,就能看到衣服穿在身上的效果。”
他表示,NVIDIA JetPack SDK 提供了在 Jetson Orin 上順利運行 AI 模型所需的所有工具。
“AI 技術(shù)日新月異,擁有一套穩(wěn)定的工具非常有用。它確實為我們這些開發(fā)者節(jié)約了時間,減少了麻煩,讓我們能夠擺脫技術(shù)問題的困擾,把更多精力放在構(gòu)建很酷的東西上。”
讓機器人幫助尋找遺失物品
加拿大安大略省的獲獎?wù)?Winner Tao 創(chuàng)造的機器人可以幫助人們在家中尋找遺失物品。他的 An Eye for an Item 項目贏得了 Hackster 挑戰(zhàn)賽的第一名。
Tao 提到:“尋找丟失的物品是一件苦差事,而近期零樣本物體檢測和 LLM 領(lǐng)域的最新進展使計算機可以根據(jù)文字或圖片描述為我們檢測任意物體,這帶來了實現(xiàn)自動化的可能性。”
Tao 表示自己需要機器人的計算能力來對任何非結(jié)構(gòu)化環(huán)境中的物體進行分類,比如客廳、大型倉庫等。他還需要機器人執(zhí)行實時計算以進行導(dǎo)航定位,并在更大規(guī)模的物體檢測模型上進行推理。
他表示:“Jetson Orin 是一個絕佳的選擇,它支持從使用 NanoDB 查詢文本和圖像到實時里程反饋等一切功能,包括使用 Isaac ROS 的硬件來加速 AprilTag 檢測進行漂移校正。”
審核編輯:劉清
-
機器人
+關(guān)注
關(guān)注
213文章
29517瀏覽量
211662 -
語音識別
+關(guān)注
關(guān)注
39文章
1774瀏覽量
113943 -
ROS
+關(guān)注
關(guān)注
1文章
285瀏覽量
17575 -
邊緣計算
+關(guān)注
關(guān)注
22文章
3286瀏覽量
50579 -
ai技術(shù)
+關(guān)注
關(guān)注
1文章
1307瀏覽量
25016
原文標題:AI 大顯身手:GLaDOS 交互機器人入選 Hackster.io 挑戰(zhàn)賽 9 個優(yōu)勝作品之一
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
泰科機器人榮獲第二屆特種機器人產(chǎn)業(yè)鏈揭榜推進活動“優(yōu)勝單位”

平頭哥半導(dǎo)體亮相AICAS 2025挑戰(zhàn)賽技術(shù)研討會
探索具身智能邊界,地瓜機器人邀你共戰(zhàn)ICRA 2025 Sim2Real挑戰(zhàn)賽

物理仿真人形機器人的統(tǒng)一全身控制策略

【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人的基礎(chǔ)模塊
【「具身智能機器人系統(tǒng)」閱讀體驗】1.初步理解具身智能
【「具身智能機器人系統(tǒng)」閱讀體驗】1.全書概覽與第一章學(xué)習(xí)
【「具身智能機器人系統(tǒng)」閱讀體驗】+數(shù)據(jù)在具身人工智能中的價值
EDA精英挑戰(zhàn)賽賽果公布!思爾芯“戰(zhàn)隊”薪火相承斬獲“麒麟杯”

2024年ICPC與華為挑戰(zhàn)賽冠軍杯圓滿落幕
開源項目!用ESP32做一個可愛的無用機器人
開源項目!用ESP32做一個可愛的無用機器人
AI4Science黑客松光子計算挑戰(zhàn)賽成功舉辦
思爾芯賽題正式發(fā)布,邀你共戰(zhàn)EDA精英挑戰(zhàn)賽!

評論