淫荡东北女啪啪小说,少妇出轨笔记,婷婷色AⅤ在线观看

作者：嚴(yán)廣宇

沐曦PDE部門

1引言：什么是具身智能？

你有沒有想過，AI 不再只是待在屏幕里回答問題、寫代碼，而是真真正正地走進(jìn)現(xiàn)實(shí)世界，像人一樣感知、決策、行動(dòng)？

想象在一個(gè)智能倉庫，機(jī)器人自主規(guī)劃路徑，把包裹從貨架上取下來打包發(fā)貨。再想象一下家里的掃地機(jī)器人，未來可能不只是掃地，而是能幫你收拾房間、洗碗、開窗通風(fēng)。這一系列動(dòng)作的背后就是具身智能（Embodied AI），它的核心就是：讓 AI 擁有身體，擁有“行動(dòng)的智能”，具備理解環(huán)境、感知人類指令、完成一連串操作的能力。

具體而言，具身智能是人工智能、機(jī)器人學(xué)、認(rèn)知科學(xué)的交叉領(lǐng)域, 主要研究如何使機(jī)器人具備類似人類的感知、規(guī)劃、決策和行為能力[1]。不同于傳統(tǒng)的純計(jì)算智能（如語言模型或圖像識(shí)別），具身智能強(qiáng)調(diào)“身體”與環(huán)境的感知與互動(dòng)，使用物理實(shí)體來感知和建模環(huán)境, 根據(jù)任務(wù)目標(biāo)和實(shí)體能力進(jìn)行規(guī)劃和決策, 最后使用實(shí)體的運(yùn)動(dòng)能力來完成任務(wù)[2]，賦予了AI在現(xiàn)實(shí)場景中執(zhí)行任務(wù)的能力。

具身智能的應(yīng)用場景極其廣泛，在以下領(lǐng)域中都有它的身影：

工業(yè)自動(dòng)化：機(jī)械臂完成精準(zhǔn)抓取、裝配、焊接等任務(wù)，提高生產(chǎn)效率。

家庭服務(wù)：服務(wù)機(jī)器人實(shí)現(xiàn)清掃、送物、協(xié)助老人等功能，改善生活質(zhì)量。

醫(yī)療輔助：手術(shù)機(jī)器人、康復(fù)機(jī)器人幫助醫(yī)生完成復(fù)雜操作或患者康復(fù)訓(xùn)練。

探索與救援：自主機(jī)器人進(jìn)入危險(xiǎn)區(qū)域執(zhí)行探測、救援任務(wù)。

教育與娛樂：教育機(jī)器人輔助教學(xué)，陪伴機(jī)器人提供情感交互。

從“腦力型AI”（如ChatGPT、Copilot）走向“動(dòng)手型AI”（如智能機(jī)械臂、家庭機(jī)器人），這是人工智能發(fā)展的必經(jīng)之路。畢竟，真正聰明的 AI，不該只是“懂”，更應(yīng)該能“做”。未來，隨著硬件成本降低、算法進(jìn)步和數(shù)據(jù)積累，具身智能將成為智能時(shí)代的核心驅(qū)動(dòng)力。

圖 1 具身智能可應(yīng)用于多種形態(tài)的機(jī)器人

來源：https://arxiv.org/pdf/2407.06886.pdf

2具身智能研發(fā)的挑戰(zhàn)

盡管具身智能前景廣闊，但具身智能的研發(fā)仍面臨諸多挑戰(zhàn)，讓機(jī)器人高效學(xué)習(xí)新技能的道路并不平坦。現(xiàn)實(shí)中的具身智能遠(yuǎn)比想象中更復(fù)雜，特別是在控制機(jī)械臂這樣的典型任務(wù)上，哪怕是“開個(gè)門”，對研發(fā)人員來說都是“災(zāi)難三連”：

1搭建場景：在仿真環(huán)境中搭建物理場景，定義門的物理屬性、初始狀態(tài)

2設(shè)計(jì)動(dòng)作：精心設(shè)計(jì)如何移動(dòng)機(jī)械臂，如何抓門、門往哪開

3寫訓(xùn)練代碼：編寫?yīng)剟?lì)函數(shù)，調(diào)節(jié)超參數(shù)，通過強(qiáng)化學(xué)習(xí)方法進(jìn)行大量訓(xùn)練調(diào)優(yōu)

上面每一個(gè)環(huán)節(jié)都高度依賴人工干預(yù)，開發(fā)周期長，效率低。更麻煩的是：每訓(xùn)練一個(gè)新技能，就像從頭造一輛車。比如你希望機(jī)器人學(xué)會(huì)“關(guān)窗”或“遞杯子”，就得重寫仿真環(huán)境、重新配置動(dòng)作參數(shù)，甚至連訓(xùn)練邏輯都得重做。總結(jié)下來，具身智能的研發(fā)過程有三座大山橫在前面：

高人力成本：每個(gè)新技能的開發(fā)都需要專業(yè)團(tuán)隊(duì)投入數(shù)周甚至數(shù)月時(shí)間，涉及仿真設(shè)計(jì)、動(dòng)作規(guī)劃、算法調(diào)試等多個(gè)領(lǐng)域。

低通用性：為特定任務(wù)設(shè)計(jì)的環(huán)境、動(dòng)作和獎(jiǎng)勵(lì)函數(shù)難以復(fù)用到其他任務(wù)。

擴(kuò)展性差：當(dāng)任務(wù)復(fù)雜度增加（如從單一抓取到多物體協(xié)作），開發(fā)難度呈指數(shù)級(jí)上升，難以快速迭代。

所以現(xiàn)實(shí)中很多具身智能研究，只能聚焦于幾個(gè)固定任務(wù)，很難做到快速拓展。

3使用大語言模型，打造“智能技能生成器”

近年來大語言模型（Large Language Model，LLM）以其強(qiáng)大的語言理解、知識(shí)推理和代碼生成能力，在多個(gè)領(lǐng)域展現(xiàn)出革命性潛力[3]。面對上一節(jié)中提到的挑戰(zhàn)，我們思考：能不能把“自然語言+通用智能”的強(qiáng)大能力，用在具身智能開發(fā)上？是否有可能利用AI自身的智能，自動(dòng)化技能開發(fā)流程，從而大幅降低成本、提升效率？

為此，我們參考了多個(gè)使用LLM的優(yōu)秀開源方案[4]，并將其與具身智能的開發(fā)流程相結(jié)合。最終我們推出了：沐曦具身智能仿真生成系統(tǒng)，實(shí)現(xiàn)從任務(wù)描述到技能學(xué)習(xí)的端到端自動(dòng)化。

具體而言，我們使用具備強(qiáng)大語言理解與通用知識(shí)推理能力的 LLM，結(jié)合具身智能中機(jī)械臂任務(wù)的特性，設(shè)計(jì)了一系列高質(zhì)量的提示詞 Prompt 模板，讓它能夠自主生成新技能任務(wù)，理解任務(wù)需求，將自然語言任務(wù)描述轉(zhuǎn)化為可執(zhí)行的仿真任務(wù)，生成任務(wù)所需的全部內(nèi)容，實(shí)現(xiàn)了機(jī)械臂技能開發(fā)流程的高度自動(dòng)化。

簡單來說，它有點(diǎn)像一個(gè)“具身任務(wù)魔法師”——你告訴它要完成什么任務(wù)，它就能自動(dòng)生成整套執(zhí)行方案，從場景到動(dòng)作，從獎(jiǎng)勵(lì)函數(shù)到仿真環(huán)境，全都一步到位，徹底改變了具身智能技能開發(fā)的范式。

本系統(tǒng)能夠自動(dòng)完成以下任務(wù)：

任務(wù)	描述
生成技能任務(wù)描述	根據(jù)目標(biāo)物體，生成多個(gè)機(jī)械臂與之相關(guān)的任務(wù)描述
生成仿真環(huán)境配置	生成目標(biāo)物體在MuJoCo環(huán)境中的位置與屬性
生成任務(wù)操作步驟	根據(jù)任務(wù)技能與目標(biāo)物體，將任務(wù)分解為機(jī)械臂可執(zhí)行的動(dòng)作序列
生成元?jiǎng)幼餍蛄?/td>	將復(fù)雜動(dòng)作拆解為機(jī)械臂的基本動(dòng)作單元
生成獎(jiǎng)勵(lì)函數(shù)代碼	生成強(qiáng)化學(xué)習(xí)所需的獎(jiǎng)勵(lì)函數(shù)邏輯代碼
生成物體初始狀態(tài)	生成物體的初始狀態(tài)（如關(guān)節(jié)角度）

上面整個(gè)過程中不再需要你手動(dòng)寫 MuJoCo仿真平臺(tái)所需的場景XML配置、設(shè)置各種配置參數(shù)、調(diào)整代碼邏輯。你只需要告訴LLM場景中有哪些可操作的物體，系統(tǒng)就能自動(dòng)生成多個(gè)機(jī)械臂操作不同物體的任務(wù)，輸出每個(gè)任務(wù)完整的訓(xùn)練配置，然后調(diào)用 MuJoCo 引擎啟動(dòng)仿真，機(jī)械臂就開始一一學(xué)習(xí)這些技能，是不是有點(diǎn)“AI 的魔法感”？

為了便于演示，本系統(tǒng)以廚房場景來展示整個(gè)的自動(dòng)化執(zhí)行流程，其場景如下圖2所示。

圖 2 廚房虛擬場景樣例圖

本系統(tǒng)整個(gè)流程可以總結(jié)為兩個(gè)階段：任務(wù)生成階段和任務(wù)執(zhí)行階段，具體內(nèi)容如圖3所示。

圖 3 沐曦具身智能仿真生成系統(tǒng)框架

3.1任務(wù)生成階段

在任務(wù)生成階段，本系統(tǒng)會(huì)通過精心設(shè)計(jì)的提示詞，多次調(diào)用大語言模型，逐步生成新技能任務(wù)描述、任務(wù)對應(yīng)的仿真環(huán)境配置、機(jī)械臂執(zhí)行任務(wù)的操作步驟、仿真環(huán)境中物體初始配置參數(shù)等信息。每個(gè)步驟的具體作用如下：

技能任務(wù)描述生成

LLM根據(jù)場景中多個(gè)不同物體的屬性信息，生成多個(gè)機(jī)械臂操作物體的任務(wù)信息描述。任務(wù)描述中包含：任務(wù)名、任務(wù)詳細(xì)描述、機(jī)械臂操作的物體名稱、機(jī)械臂與物體交互的關(guān)節(jié)名等。針對廚房場景，其生成的部分樣例如下：

Task Name: Open Microwave Door
Description: The robotic arm willopenthe microwave door.
Additional Objects: None
Bodies:
- microdoorroot: from the semantics,thisisthe door of the microwave. The robot needs to approachthisdoorinorder toopenit.
Joints:
- microdoorroot_joint: from the articulation tree,thisisthe hinge joint that connects microdoorroot. Therefore, the robot needs to actuatethisjointforopening the door.

仿真環(huán)境配置生成

LLM根據(jù)生成的任務(wù)描述信息、不同物體的屬性信息，生成物體在仿真環(huán)境中的多項(xiàng)配置信息，包括：物體名稱、物體的空間位置、是否可移動(dòng)等。LLM以YAML格式返回生成的配置信息。針對打開微波爐門任務(wù)，其生成樣例如下：

-  center: (0.6, 0.4, 1.6)
  movable:false
  name: microwave
 type: xml
-  center: (0.82, 0.16, 2.3)
  movable:false
  name: slidecabinet
 type: xml
-  center: (0.6, 0.4, 2.141)
  movable:true
  name: mug
 type: xml
-  task_description: The robotic arm will open the microwave door
  task_name: Open Microwave Door

任務(wù)操作步驟生成

LLM根據(jù)生成的任務(wù)描述信息、不同物體的屬性信息、機(jī)械臂具備的元?jiǎng)幼骱瘮?shù)列表、可從仿真環(huán)境中獲取狀態(tài)信息的函數(shù)列表，生成機(jī)械臂完成該任務(wù)所需執(zhí)行的一系列操作步驟。對于每個(gè)步驟，LLM需要判斷該操作的類型，包括：{元?jiǎng)幼鳌?qiáng)化學(xué)習(xí)動(dòng)作}。若為元?jiǎng)幼鳎瑒t生成機(jī)械臂執(zhí)行的元?jiǎng)幼餍蛄校魹閺?qiáng)化學(xué)習(xí)動(dòng)作，則生成使用強(qiáng)化學(xué)習(xí)算法訓(xùn)練學(xué)習(xí)該技能所需獎(jiǎng)勵(lì)函數(shù)Python邏輯代碼。針對打開滑動(dòng)柜門任務(wù)，其生成的工作步驟樣例如下：

substep1: move to the slidecabinet door
substep2: grasp the slidecabinet door
substep3: open the slidecabinet door
substep4: release the slidecabinet door

物體初始狀態(tài)生成

LLM根據(jù)生成的任務(wù)描述信息、不同物體的屬性信息，生成該物體在仿真環(huán)境初始化時(shí)，各關(guān)節(jié)角度的默認(rèn)值。如：開滑動(dòng)柜門任務(wù)中，門的關(guān)節(jié)應(yīng)初始化為關(guān)閉狀態(tài)（0表示關(guān)閉，1表示開啟），其生成樣例如下：

jointvalues
slidedoor_joint:0

3.2任務(wù)執(zhí)行階段

在任務(wù)生成階段完成多項(xiàng)生成任務(wù)后，本系統(tǒng)即可根據(jù)LLM生成環(huán)境配置信息、操作步驟信息、關(guān)節(jié)角度值，調(diào)用MuJoCo仿真引擎構(gòu)建虛擬環(huán)境，按生成步驟控制機(jī)械臂運(yùn)動(dòng)，執(zhí)行任務(wù)并完成強(qiáng)化學(xué)習(xí)訓(xùn)練。其中，包括執(zhí)行元?jiǎng)幼鳎蛘{(diào)用強(qiáng)化學(xué)習(xí)算法進(jìn)行訓(xùn)練與推理。最終系統(tǒng)將整個(gè)任務(wù)的操作過程通過仿真引擎渲染保存為視頻，如下圖4所示。

圖4 機(jī)械臂技能學(xué)習(xí)操作演示

4和傳統(tǒng)開發(fā)比，新方案優(yōu)勢是什么？

與傳統(tǒng)手動(dòng)開發(fā)相比，新方案具有以下多個(gè)突破性優(yōu)勢。這意味著，即便你不是機(jī)器人專家，也能用大語言模型為機(jī)械臂設(shè)計(jì)新任務(wù)；對于專業(yè)團(tuán)隊(duì)而言，也可以極大提升開發(fā)效率，加快原型驗(yàn)證，釋放更多創(chuàng)意空間。

對比維度	傳統(tǒng)流程	自動(dòng)化系統(tǒng)
開發(fā)周期	數(shù)周起步	數(shù)小時(shí)即可構(gòu)建原型
人力需求	多名工程師協(xié)作	單人即可完成
擴(kuò)展任務(wù)	手動(dòng)重復(fù)工作	可快速迭代新任務(wù)
復(fù)用性	低	高度模塊化、結(jié)構(gòu)統(tǒng)一
技術(shù)門檻	專業(yè)背景要求高	語言驅(qū)動(dòng)、門檻低

新方案具備以下技術(shù)亮點(diǎn)：

提示工程：我們設(shè)計(jì)了一套針對具身任務(wù)的高質(zhì)量提示詞模板，確保LLM生成內(nèi)容的準(zhǔn)確性和一致性。例如，提示詞會(huì)引導(dǎo)LLM明確物體屬性（如“關(guān)微波爐門任務(wù)，門應(yīng)該處于開啟狀態(tài)”）和機(jī)械臂動(dòng)作邏輯（如“先靠近門把手，再閉合夾爪”）。

模塊化生成：系統(tǒng)將任務(wù)分解為環(huán)境、動(dòng)作、獎(jiǎng)勵(lì)等模塊，分別生成并整合，既保證了生成內(nèi)容的結(jié)構(gòu)化，又便于調(diào)試和復(fù)用。

與MuJoCo深度集成：系統(tǒng)生成的配置能直接兼容MuJoCo仿真引擎，支持高效的物理仿真和實(shí)時(shí)渲染。

端到端訓(xùn)練：通過生成的獎(jiǎng)勵(lì)函數(shù)和動(dòng)作序列，系統(tǒng)支持強(qiáng)化學(xué)習(xí)的全流程自動(dòng)化，機(jī)器人可在仿真中快速收斂到最優(yōu)策略。

最重要的一點(diǎn)，本系統(tǒng)完美適配沐曦C系列GPU產(chǎn)品，可在曦云C500 GPU上高效進(jìn)行LLM大模型推理、以及多種強(qiáng)化學(xué)習(xí)算法的訓(xùn)練&推理。

5為什么開源？

我們希望更多人一起

創(chuàng)造具身智能！

雖然本系是以廚房場景機(jī)械臂操作物體為例，但參照本系統(tǒng)中方法，可以便捷拓展到輪式機(jī)器人、四足機(jī)器人等人形機(jī)器人，支持更復(fù)雜的多任務(wù)學(xué)習(xí)場景。例如，未來可實(shí)現(xiàn)“機(jī)器人自主整理房間”或“協(xié)作完成生產(chǎn)線裝配”等高級(jí)任務(wù)。

我們相信，具身智能的未來，是“人人可用、人人可創(chuàng)”的智能。

為了推動(dòng)具身智能領(lǐng)域的進(jìn)步，我們已經(jīng)正式開源完整的沐曦具身智能仿真生成系統(tǒng)方案，所有代碼可用，且示例齊全，歡迎所有開發(fā)者、研究者、愛好者嘗試、改進(jìn)、拓展。

開源地址

GitHub：https://github.com/MetaX-MACA/Embodied_AI_Simulation

Gitee：https://gitee.com/metax-maca/Embodied_AI_Simulation

6結(jié)語

過去十年，AI 靠著“認(rèn)字、聽話、寫代碼”帶來了巨大變革；而下一個(gè)十年，AI 將走出屏幕，走入工廠、家庭、醫(yī)院和每一個(gè)現(xiàn)實(shí)場景。具身智能就是連接這兩者的橋梁，它既有 AI 的大腦，也擁有對世界的“動(dòng)手能力”。我們希望這套系統(tǒng)，能讓更多人參與到具身智能的探索中來。不再困在復(fù)雜的開發(fā)流程里，不再被高門檻擋在門外！

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

機(jī)器人

機(jī)器人

+關(guān)注

關(guān)注
212

文章
29354

瀏覽量
211147
AI

AI

+關(guān)注

關(guān)注
87

文章
33789

瀏覽量
274613
人工智能

人工智能

+關(guān)注

關(guān)注
1804

文章
48535

瀏覽量
245518
具身智能

具身智能

+關(guān)注

關(guān)注
0

文章
106

瀏覽量
351

原文標(biāo)題：【智算芯聞】具身智能的新范式：利用AI智能體加速機(jī)器人學(xué)習(xí)技能

文章出處：【微信號(hào)：沐曦MetaX，微信公眾號(hào)：沐曦MetaX】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

搜索歷史

沐曦具身智能仿真生成系統(tǒng)方案

評(píng)論