女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一個(gè)用于6D姿態(tài)估計(jì)和跟蹤的統(tǒng)一基礎(chǔ)模型

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-12-19 09:58 ? 次閱讀

0. 筆者個(gè)人體會(huì)

今天筆者將為大家分享NVIDIA的最新開源方案FoundationPose,是一個(gè)用于 6D 姿態(tài)估計(jì)和跟蹤的統(tǒng)一基礎(chǔ)模型。只要給出CAD模型或少量參考圖像,F(xiàn)oundationPose就可以在測(cè)試時(shí)立即應(yīng)用于新物體,無需任何微調(diào),關(guān)鍵是各項(xiàng)指標(biāo)明顯優(yōu)于專為每個(gè)任務(wù)設(shè)計(jì)的SOTA方案。

下面一起來閱讀一下這項(xiàng)工作,文末附論文和代碼鏈接~

1. 效果展示

FoundationPose實(shí)現(xiàn)了新物體的6D姿態(tài)估計(jì)和跟蹤,支持基于模型和無模型設(shè)置。在這四個(gè)任務(wù)中的每一個(gè)上,F(xiàn)oundationPose都優(yōu)于專用任務(wù)的SOTA方案。(·表示僅RGB,×表示RGBD)。這里也推薦工坊推出的新課程《單目深度估計(jì)方法:算法梳理與代碼實(shí)現(xiàn)》。

adfd5652-9dfa-11ee-8b88-92fbcf53809c.jpg

2. 具體原理是什么?

為減少大規(guī)模訓(xùn)練的人工工作,F(xiàn)oundationPose利用3D模型數(shù)據(jù)庫(kù)、大型語(yǔ)言模型和擴(kuò)散模型等新技術(shù),開發(fā)了一種新的合成數(shù)據(jù)生成Pipeline。為了彌補(bǔ)無模型和基于模型的設(shè)置之間的差距,F(xiàn)oundationPose利用以對(duì)象為中心的神經(jīng)場(chǎng)來進(jìn)行隨后的渲染和新視圖RGBD渲染。

對(duì)于姿態(tài)估計(jì),首先在物體周圍均勻地初始化全局姿態(tài),然后通過細(xì)化網(wǎng)絡(luò)對(duì)其進(jìn)行細(xì)化。最后將改進(jìn)的位姿轉(zhuǎn)發(fā)給姿態(tài)選擇模塊,預(yù)測(cè)位姿的分?jǐn)?shù),輸出得分最高的位姿。

ae1028e0-9dfa-11ee-8b88-92fbcf53809c.jpg

3. 和其他SOTA方法對(duì)比如何?

YCB-Video數(shù)據(jù)集上Model-free方案的位姿估計(jì)定量結(jié)果對(duì)比。

ae219558-9dfa-11ee-8b88-92fbcf53809c.jpg

YCB-Video數(shù)據(jù)集上位姿跟蹤的定量對(duì)比。這里也推薦工坊推出的新課程《單目深度估計(jì)方法:算法梳理與代碼實(shí)現(xiàn)》。

ae35a2aa-9dfa-11ee-8b88-92fbcf53809c.jpg

對(duì)更多實(shí)驗(yàn)結(jié)果和文章細(xì)節(jié)感興趣的讀者,可以閱讀一下論文原文~

4. 論文信息

標(biāo)題:FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects

作者:Bowen Wen, Wei Yang, Jan Kautz, Stan Birchfield

機(jī)構(gòu):NVIDIA

原文鏈接:https://arxiv.org/abs/2312.08344

代碼鏈接:https://github.com/NVlabs/FoundationPose








審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5241

    瀏覽量

    105768
  • RGB
    RGB
    +關(guān)注

    關(guān)注

    4

    文章

    803

    瀏覽量

    59586

原文標(biāo)題:通用性超強(qiáng)!同時(shí)實(shí)現(xiàn)6D位姿估計(jì)和跟蹤!

文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    商湯科技日日新V6模型斬獲“雙料第項(xiàng)國(guó)內(nèi)榜首,個(gè)全球第

    衛(wèi)冕“雙冠”! 通用語(yǔ)言能力并列國(guó)內(nèi)榜首、多模態(tài)能力全球最強(qiáng),商湯「日日新V6」近期斬獲“雙料第”。 5月28日,權(quán)威大模型測(cè)評(píng)機(jī)構(gòu)SuperCLUE《中文大模型基準(zhǔn)測(cè)評(píng)2025年5
    的頭像 發(fā)表于 05-30 11:13 ?632次閱讀
    商湯科技日日新V<b class='flag-5'>6</b>大<b class='flag-5'>模型</b>斬獲“雙料第<b class='flag-5'>一</b>” <b class='flag-5'>一</b>項(xiàng)國(guó)內(nèi)榜首,<b class='flag-5'>一</b><b class='flag-5'>個(gè)</b>全球第<b class='flag-5'>一</b>

    基于RV1126開發(fā)板的人臉姿態(tài)估計(jì)算法開發(fā)

    人臉姿態(tài)估計(jì)是通過對(duì)張人臉圖像進(jìn)行分析,獲得臉部朝向的角度信息。姿態(tài)估計(jì)是多姿態(tài)問題中較為關(guān)鍵
    的頭像 發(fā)表于 04-14 17:21 ?1411次閱讀
    基于RV1126開發(fā)板的人臉<b class='flag-5'>姿態(tài)</b><b class='flag-5'>估計(jì)</b>算法開發(fā)

    使用人體姿勢(shì)估算-3d-0001模型執(zhí)行human_pose_estimation_demo.exe時(shí)遇到錯(cuò)誤怎么解決?

    已OpenVINO 工具套件 2020.3 安裝。 下載并轉(zhuǎn)換 人體姿勢(shì)估算-3d-0001 模型。 構(gòu)建 人類姿態(tài)估算 C++ 演示 應(yīng)用程序。 運(yùn)行演示時(shí)遇到錯(cuò)誤: [ ERROR ] expected to have 2
    發(fā)表于 03-05 07:45

    M1攜手6D Technologies云原生BSS平臺(tái)實(shí)現(xiàn)轉(zhuǎn)型

    ,M1 Limited的預(yù)付費(fèi)和Maxx服務(wù)已成功遷移至尖端數(shù)字BSS平臺(tái)6D Technologies Canvas。 在15個(gè)月的時(shí)間里,6D Technologies將M1的所有預(yù)付費(fèi)和Maxx
    的頭像 發(fā)表于 01-15 15:42 ?384次閱讀

    Todoist鍵時(shí)間跟蹤

    過三個(gè)簡(jiǎn)單的步驟將您的Todoist工作區(qū)連接到TMetric時(shí)間跟蹤應(yīng)用。通過單擊鼠標(biāo)跟蹤執(zhí)行任務(wù)所花費(fèi)的時(shí)間。為項(xiàng)目獲取廣泛而精確的報(bào)告。 添加計(jì)時(shí)器按鈕到Todoist任務(wù)中 完成這三個(gè)
    的頭像 發(fā)表于 01-03 11:08 ?349次閱讀
    Todoist<b class='flag-5'>一</b>鍵時(shí)間<b class='flag-5'>跟蹤</b>

    KerasHub統(tǒng)一、全面的預(yù)訓(xùn)練模型庫(kù)

    深度學(xué)習(xí)領(lǐng)域正在迅速發(fā)展,在處理各種類型的任務(wù)中,預(yù)訓(xùn)練模型變得越來越重要。Keras 以其用戶友好型 API 和對(duì)易用性的重視而聞名,始終處于這動(dòng)向的前沿。Keras 擁有專用的內(nèi)容庫(kù),如用于
    的頭像 發(fā)表于 12-20 10:32 ?434次閱讀

    CNN, RNN, GNN和Transformer模型統(tǒng)一表示和泛化誤差理論分析

    背景介紹 本文是基于我們之前的 RPN(Reconciled Polynomial Network)研究的后續(xù)工作。在此前的研究中,我們提出了 RPN 這通用模型架構(gòu),其包含三個(gè)組件函數(shù):數(shù)據(jù)擴(kuò)展
    的頭像 發(fā)表于 12-06 11:31 ?1193次閱讀
    CNN, RNN, GNN和Transformer<b class='flag-5'>模型</b>的<b class='flag-5'>統(tǒng)一</b>表示和泛化誤差理論分析

    ov華米聯(lián)手打造OneLink統(tǒng)一鏈接平臺(tái)

    小米應(yīng)用商店近日攜手華為、OPPO、vivo等主流手機(jī)廠商,共同推出了個(gè)名為OneLink的統(tǒng)一鏈接平臺(tái)。這平臺(tái)旨在簡(jiǎn)化開發(fā)者在應(yīng)用分發(fā)和推廣過程中的工作流程,提供更為便捷和
    的頭像 發(fā)表于 11-18 15:01 ?1011次閱讀

    常見人體姿態(tài)評(píng)估顯示方式的兩種方式

    ,基于Deeplabv3+ 與ResNet34構(gòu)建的一個(gè)人體語(yǔ)義分割模型。 火柴人 主要是基于關(guān)鍵點(diǎn)的人體姿態(tài)評(píng)估顯示方式,基于YOLOv8等人體姿態(tài)評(píng)估的關(guān)鍵點(diǎn)
    的頭像 發(fā)表于 11-11 11:21 ?561次閱讀
    常見人體<b class='flag-5'>姿態(tài)</b>評(píng)估顯示方式的兩種方式

    如何利用TPA2012D2的輸出端和阻抗值4OHM的喇叭建個(gè)cadence仿真模型

    最近想用tlv320aic3106加tpa2012d2設(shè)計(jì)個(gè)音頻設(shè)備,但是不太懂各個(gè)傳輸路徑上應(yīng)該加什么樣的濾波電容,想請(qǐng)教下如何利用TPA2012
    發(fā)表于 11-07 07:42

    為THS3001構(gòu)建個(gè)簡(jiǎn)單的SPICE模型

    電子發(fā)燒友網(wǎng)站提供《為THS3001構(gòu)建個(gè)簡(jiǎn)單的SPICE模型.pdf》資料免費(fèi)下載
    發(fā)表于 10-29 10:11 ?1次下載
    為THS3001構(gòu)建<b class='flag-5'>一</b><b class='flag-5'>個(gè)</b>簡(jiǎn)單的SPICE<b class='flag-5'>模型</b>

    光學(xué)跟蹤測(cè)量系統(tǒng)如何工作的

    姿態(tài)等參數(shù),實(shí)現(xiàn)對(duì)目標(biāo)物體的精確跟蹤和測(cè)量。其工作原理主要包括以下幾個(gè)步驟: 光源發(fā)射:光學(xué)跟蹤測(cè)量系統(tǒng)首先需要個(gè)光源,
    的頭像 發(fā)表于 08-29 17:26 ?1356次閱讀

    統(tǒng)一多云管理平臺(tái)怎么用?

     統(tǒng)一多云管理平臺(tái)的使用主要涉及資源納管、費(fèi)用控制和智能運(yùn)維等方面。統(tǒng)一多云管理平臺(tái)是種能夠同時(shí)管理多種公有云、私有云以及傳統(tǒng)IT環(huán)境的資源,并實(shí)現(xiàn)自動(dòng)化和服務(wù)化交付的工具。它為企業(yè)提供了強(qiáng)大
    的頭像 發(fā)表于 08-14 11:28 ?422次閱讀

    意法半導(dǎo)體新款MEMS IMU LSM6DSV32X實(shí)現(xiàn)精確姿態(tài)識(shí)別應(yīng)用

    憑借3核、6軸傳感架構(gòu),意法半導(dǎo)體新款MEMS IMU LSM6DSV32X能夠進(jìn)行卓越的邊緣計(jì)算處理,是智能手機(jī)的高精度感測(cè)和3D地圖、筆記本電腦和平板電腦的情境感知、AR和VR的精確姿態(tài)
    的頭像 發(fā)表于 08-01 10:15 ?1450次閱讀

    在PyTorch中搭建個(gè)最簡(jiǎn)單的模型

    在PyTorch中搭建個(gè)最簡(jiǎn)單的模型通常涉及幾個(gè)關(guān)鍵步驟:定義模型結(jié)構(gòu)、加載數(shù)據(jù)、設(shè)置損失函數(shù)和優(yōu)化器,以及進(jìn)行模型訓(xùn)練和評(píng)估。
    的頭像 發(fā)表于 07-16 18:09 ?2683次閱讀