女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

教機器用計算機視覺閱讀樂高手冊

星星科技指導員 ? 來源:NVIDIA ? 作者:Michelle Horton ? 2022-10-11 09:22 ? 次閱讀

樂高愛好者抓撓他們的頭,閱讀組裝說明,可能很快有助于復雜的建設,感謝一個新的 學習 來自斯坦福大學、麻省理工學院和 Autodesk 。研究人員設計了一個深度學習框架,將 2D 手冊翻譯成機器可以理解的步驟,以構建 3D 樂高套件。這項工作可以推動專注于制造機器的研究,幫助人們組裝物體。

“樂高手冊提供了一個獨立的環境,展示了人類的一項核心技能:在指導下學習完成任務。利用視覺場景解析和程序合成的最新進展,我們旨在構建具有類似技能的機器,從樂高開始,最終以現實世界場景為目標,”該研究資深作者吳家軍說,斯坦福大學計算機科學助理教授。

研究人員表示,用人工智能翻譯 2D 手冊面臨兩大挑戰。首先, AI 必須基于 2D 手動圖像在每個裝配步驟中學習和理解 3D 形狀之間的對應關系。這包括考慮工件的方向和對齊。

它還必須能夠對磚塊進行分類,并在半組裝模型中推斷出磚塊的三維姿態。作為樂高積木制作過程的一部分,小部件被組合成更大的部件,如吉他的頭部、頸部和身體。當這些較大的部分組合在一起時,將創建一個完整的項目。這增加了難度,因為機器必須解析出所有的樂高積木,甚至是那些可能不可見的積木,如樂高釘和反積木。

該團隊致力于創建一個模型,該模型可以將 2D 手冊轉化為機器可執行計劃,以構建定義的對象。雖然目前有兩種執行此任務的方法:基于搜索的方法和基于學習的方法,但都存在局限性。

基于搜索的方法尋找工件和手動圖像的可能三維姿態,尋找正確的姿態。該方法計算量大,速度慢,但精度高。

基于學習的模型依賴于神經網絡來預測部件的 3D 姿態。它們速度快,但精度不高,尤其是在使用看不見的 3D 形狀時。

為了解決這一局限性,研究人員開發了手冊到可執行計劃網絡 ( MEPNet ) ,根據研究,它使用深度學習和 計算機視覺 集成“神經 2D 關鍵點檢測模塊和 2D-3D 投影算法

??根據一系列預測,在每一步,模型都會閱讀手冊,定位要添加的零件,并推導出 3D 定位。在模型預測了每一塊和每一步的姿勢后,它可以從頭開始解析手冊,創建一個機器人可以遵循的建筑計劃來建造樂高對象。

研究人員在研究中寫道:“對于每個步驟,輸入包括 1 )一組在之前的步驟中構建的原始磚塊和零件,以 3D 表示; 2 )一個顯示組件應如何連接的目標 2D 圖像。預期輸出是該步驟中涉及的所有組件的(相對)姿態。”。

他們從一個包含 72 種磚塊的樂高工具包中創建了第一個合成訓練數據,并使用了來自 LPub3D ,一個用于“創建樂高風格的數字建筑說明”的開源應用程序

研究人員總共生成了 8000 份培訓手冊,其中 10 套用于驗證, 20 套用于測試。每個數據集中有大約 200 個單獨的步驟,約占培訓中的 200000 個單獨步驟。

他們在研究中寫道:“我們在綜合生成的數據集上對 MEPNet 進行全面監控,在該數據集中,我們有基本真相關鍵點、掩碼和旋轉信息。”。 MEPNet 模型在四個點上訓練 5 天 NVIDIA Titan RTX GPU 由 NVIDIA 圖靈架構提供支持。

他們還在 Minecraft house 數據集上測試了該模型,該數據集具有與樂高類似的構建風格。

通過將 MEPNet 與現有模型進行比較,研究人員發現,它在現實世界的樂高積木、合成手冊和 Minecraft 示例中的表現優于其他模型。

MEPNet 在姿勢估計方面更準確,甚至在識別不可見片段的構建方面也更好。研究人員還發現,該模型能夠將從合成手冊中獲得的知識應用于現實世界的樂高手冊。

雖然還需要制造一個能夠執行計劃的機器人,但研究人員將這項工作視為一個起點。

“我們的長期目標是制造能夠幫助人類構造和組裝復雜物體的機器。我們正在考慮將我們的方法擴展到其他組裝領域,如宜家家具,”斯坦福大學計算機科學博士生王若成( Ruocheng Wang )說。

關于作者

Michelle Horton 是 NVIDIA 的高級開發人員通信經理,擁有通信經理和科學作家的背景。她在 NVIDIA 為開發者博客撰文,重點介紹了開發者使用 NVIDIA 技術的多種方式。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 計算機
    +關注

    關注

    19

    文章

    7632

    瀏覽量

    90214
  • AI
    AI
    +關注

    關注

    87

    文章

    34274

    瀏覽量

    275463
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    C語言數組應用計算機導論A第6講:數組

    C語言數組應用計算機導論A第6講:數組
    發表于 11-20 15:33 ?0次下載

    【小白入門必看】一文讀懂深度學習計算機視覺技術及學習路線

    一、什么是計算機視覺計算機視覺,其實就是機器怎么像我們人一樣,用攝像頭看看周圍的世界,然后理
    的頭像 發表于 10-31 17:00 ?1104次閱讀
    【小白入門必看】一文讀懂深度學習<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>技術及學習路線

    計算機視覺有哪些優缺點

    計算機視覺作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術的發展不僅推動了多個行業的變革,也帶來了諸多優勢,但同時也伴隨著一些挑戰和局限性。以下是對
    的頭像 發表于 08-14 09:49 ?1848次閱讀

    什么是機器視覺opencv?它有哪些優勢?

    機器視覺(Machine Vision)是一種利用計算機和圖像處理技術來模擬人類視覺系統的功能,實現對圖像的識別、分析和理解的技術。OpenCV(Open Source Compute
    的頭像 發表于 07-16 10:33 ?1265次閱讀

    機器視覺計算機視覺有什么區別

    機器視覺計算機視覺是兩個密切相關但又有所區別的概念。 一、定義 機器視覺
    的頭像 發表于 07-16 10:23 ?1008次閱讀

    計算機視覺的五大技術

    計算機視覺作為深度學習領域最熱門的研究方向之一,其技術涵蓋了多個方面,為人工智能的發展開拓了廣闊的道路。以下是對計算機視覺五大技術的詳細解析,包括圖像分類、對象檢測、目標跟蹤、語義分割
    的頭像 發表于 07-10 18:26 ?2267次閱讀

    計算機視覺機器視覺的區別與聯系

    隨著人工智能技術的飛速發展,計算機視覺機器視覺作為該領域的兩個重要分支,逐漸引起了廣泛關注。盡管兩者在名稱上有所相似,但實際上它們在定義、技術特點、應用領域以及發展前景等方面都存在著
    的頭像 發表于 07-10 18:24 ?2447次閱讀

    計算機視覺的工作原理和應用

    計算機視覺(Computer Vision,簡稱CV)是一門跨學科的研究領域,它利用計算機和數學算法來模擬人類視覺系統對圖像和視頻進行識別、理解、分析和處理。其核心目標在于使
    的頭像 發表于 07-10 18:24 ?3159次閱讀

    機器視覺計算機視覺的區別與聯系

    機器視覺計算機視覺是兩個密切相關但又有所區別的領域。 1. 引言 在當今科技迅猛發展的時代,機器人和
    的頭像 發表于 07-09 09:27 ?1101次閱讀

    計算機視覺與人工智能的關系是什么

    引言 計算機視覺是一門研究如何使計算機能夠理解和解釋視覺信息的學科。它涉及到圖像處理、模式識別、機器學習等多個領域的知識。人工智能則是研究如
    的頭像 發表于 07-09 09:25 ?1215次閱讀

    計算機視覺與智能感知是干嘛的

    引言 計算機視覺(Computer Vision)是一門研究如何使計算機能夠理解和解釋視覺信息的學科。它涉及到圖像處理、模式識別、機器學習等
    的頭像 發表于 07-09 09:23 ?1647次閱讀

    計算機視覺機器視覺區別在哪

    ,旨在實現對圖像和視頻的自動分析和理解。 機器視覺 機器視覺計算機視覺的一個分支,主要應用于工
    的頭像 發表于 07-09 09:22 ?802次閱讀

    計算機視覺和圖像處理的區別和聯系

    計算機視覺和圖像處理是兩個密切相關但又有明顯區別的領域。 1. 基本概念 1.1 計算機視覺 計算機視覺
    的頭像 發表于 07-09 09:16 ?2107次閱讀

    計算機視覺屬于人工智能嗎

    屬于,計算機視覺是人工智能領域的一個重要分支。 引言 計算機視覺是一門研究如何使計算機具有視覺
    的頭像 發表于 07-09 09:11 ?1991次閱讀

    深度學習在計算機視覺領域的應用

    隨著人工智能技術的飛速發展,深度學習作為其中的核心技術之一,已經在計算機視覺領域取得了顯著的成果。計算機視覺,作為計算機科學的一個重要分支,
    的頭像 發表于 07-01 11:38 ?1558次閱讀