女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OA-SLAM:在視覺SLAM中利用對(duì)象進(jìn)行相機(jī)重新定位

3D視覺工坊 ? 來源:3D視覺工坊 ? 作者:魚肖濃@知乎 ? 2022-12-20 14:38 ? 次閱讀

Motivations:

用粗略模型(長(zhǎng)方體或橢球體)表示的對(duì)象可能不夠精確,無(wú)法改善相機(jī)的位姿跟蹤。

目前SOTA目標(biāo)檢測(cè)器對(duì)視角和光照變化具有很強(qiáng)的魯棒性,這對(duì)于從大量不同視角恢復(fù)相機(jī)姿態(tài)非常有利。

缺乏用于構(gòu)建面向?qū)ο蟮貓D的全自動(dòng)系統(tǒng),都有著一定的假設(shè)。

Contributions:

結(jié)合對(duì)象和點(diǎn)的優(yōu)點(diǎn),提出了一種改進(jìn)的重定位方法,能夠從大量不同的視角中估計(jì)相機(jī)位姿。

提出了一種全自動(dòng)的SLAM系統(tǒng),能夠在飛行中識(shí)別、跟蹤和重建對(duì)象。

Background and Related Works:

1. 對(duì)象建圖

Crocco使用簡(jiǎn)化相機(jī)模型,提出了一種封閉形式的公式來估計(jì)來自多視圖目標(biāo)檢測(cè)的對(duì)偶二次曲面。Rubino將其拓展到針孔相機(jī)模型。Chen等人解決了前向移動(dòng)中初始化對(duì)象估計(jì)問題。

2. 基于對(duì)象的定位

Weinzaepfel等人利用查詢圖像中出現(xiàn)的對(duì)象與參考圖像中出現(xiàn)的對(duì)象之間的稠密2D-3D對(duì)應(yīng)關(guān)系來計(jì)算相機(jī)的位姿,但該方法僅限于平面對(duì)象。

一些工作使用了更通用的對(duì)象,用橢球表示。然而這些方法僅從對(duì)象估計(jì)相機(jī)姿態(tài),并假設(shè)一個(gè)預(yù)構(gòu)建的對(duì)象地圖。[11]只估計(jì)相機(jī)的位置,假設(shè)方向已知。[38]專注于3D感知橢圓對(duì)象檢測(cè)。

3. 基于對(duì)象的SLAM

Bao等人在定位和建圖中引入了對(duì)象,在一個(gè)SfM框架中識(shí)別和定位對(duì)象。McCormac等人和Sünderhauf等人將RGB-D SLAM和語(yǔ)義分割和對(duì)象檢測(cè)相融合,獲得具有語(yǔ)義注釋的稠密點(diǎn)云。

QuadricSLAM使用對(duì)偶二次曲面作為3D地標(biāo),共同估計(jì)相機(jī)位姿和對(duì)偶二次曲面參數(shù)。EAO-SLAM在半稠密的SLAM中集成對(duì)象,利用不同的統(tǒng)計(jì)信息來提高數(shù)據(jù)關(guān)聯(lián)的魯棒性。Hosseinzadeh將點(diǎn)、平面和二次曲面聯(lián)合為基于因子圖的SLAM。SO-SLAM中,Liao等人使用手工提取的平面為對(duì)象添加支撐約束,以及語(yǔ)義尺度先驗(yàn)和對(duì)象約束。ROSHAN利用邊界框檢測(cè)、圖像紋理、語(yǔ)義知識(shí)和對(duì)象形狀先驗(yàn)來推斷橢球模型,并解決前向平移車輛運(yùn)動(dòng)下的可觀察性問題。CubeSLAM使用長(zhǎng)方體來表示對(duì)象,使用2D邊界框和消失點(diǎn)采樣從單圖中生成對(duì)象候選。Frost等人用球體建模對(duì)象,并使用它們解決SLAM中的尺度不確定和漂移問題。

4. 基于對(duì)象的SLAM重定位

只有Dudek等人利用SLAM中的語(yǔ)義地圖進(jìn)行重定位。Mahattansin等人利用對(duì)象檢測(cè)改進(jìn)了視覺SLAM的重定位,但對(duì)象檢測(cè)知識(shí)用來更好地篩選候選關(guān)鍵幀,相機(jī)位姿仍使用與最相似的關(guān)鍵幀的點(diǎn)匹配估計(jì)得到。

Methodology:

04d6f2e4-7ff2-11ed-8abf-dac502259ad0.png

1. 橢球體對(duì)象表示

9DoF表示,3DoF表示軸長(zhǎng),3DoF表示方向,3DoF表示位置。其方程可以用對(duì)偶空間的封閉形式表示。橢球體定義為4×4矩陣Q*,橢圓定義為3×3矩陣C*。

04fa0f40-7ff2-11ed-8abf-dac502259ad0.png

2. 目標(biāo)檢測(cè)與關(guān)聯(lián)

目標(biāo)檢測(cè)器:YOLO (只考慮評(píng)分高于0.5的檢測(cè))

2.1 基于box的對(duì)象追蹤

在重建之前,基于邊界框重疊和標(biāo)簽一致性在2D幀中跟蹤對(duì)象在兩幀之間的運(yùn)動(dòng)相對(duì)較小和平滑時(shí)短期有效。

考慮3D重建來獲得長(zhǎng)期的跟蹤,將其橢球模型投影到當(dāng)前幀中,并利用該幀中與目標(biāo)檢測(cè)的重疊來尋找關(guān)聯(lián)。

結(jié)合以上兩種情況,使用匈牙利算法找到最優(yōu)關(guān)聯(lián),該最大化匹配總分,以便在N次檢測(cè)和M個(gè)對(duì)象之間找到最佳的可能分配。

0506a606-7ff2-11ed-8abf-dac502259ad0.png

2.2 基于點(diǎn)的對(duì)象追蹤

在相機(jī)位姿估計(jì)過程中,將圖像關(guān)鍵點(diǎn)與地圖地標(biāo)進(jìn)行魯棒匹配,這些匹配可以用于鏈接檢測(cè)框和對(duì)象橢球:

1)在圖像中,如果一個(gè)關(guān)鍵點(diǎn)位于邊界框內(nèi),它就與一個(gè)檢測(cè)相鏈接

2)在地圖中,如果一個(gè)點(diǎn)地標(biāo)位于橢球體內(nèi),則與該對(duì)象相鏈接

如果檢測(cè)和地圖對(duì)象之間至少存在τ個(gè)基于點(diǎn)的匹配,則關(guān)聯(lián)。

3. 初始對(duì)象重建

當(dāng)通過相機(jī)中心的光線與對(duì)象檢測(cè)中心的光線之間的角度變化為10°以上時(shí),創(chuàng)建其3D橢球的初始估計(jì)。為了盡快地獲得對(duì)象的3D估計(jì),對(duì)象最初被重建為球體,然后隨著視角的增加,細(xì)化為橢球體的形式。

球體的位置是從邊界框的中心進(jìn)行三角測(cè)量,半徑被確定為邊界框的平均大小。

05111546-7ff2-11ed-8abf-dac502259ad0.png

其中,為在第i個(gè)相機(jī)坐標(biāo)系中的對(duì)象中心z坐標(biāo),和為第i幀檢測(cè)框的寬度和高度,和為相機(jī)內(nèi)參,n為對(duì)象被追蹤到的幀數(shù)。

然后將該球體細(xì)化為橢球體,更新其軸長(zhǎng)和位姿,以最小化重投影誤差的形式進(jìn)行改進(jìn)。當(dāng)經(jīng)過足夠幀數(shù)(通常為40幀)重構(gòu)和細(xì)化對(duì)象,3D IoU超過閾值時(shí),將對(duì)象集成到地圖中。

4. 局部對(duì)象建圖

4.1 對(duì)象優(yōu)化

與ORB-SLAM2的局部束調(diào)節(jié)類似,對(duì)象模型也會(huì)定期進(jìn)行優(yōu)化,每當(dāng)一個(gè)新的關(guān)鍵幀觀察到地圖中存在的對(duì)象時(shí),就會(huì)通過最小化重投影誤差來優(yōu)化對(duì)象。

05236d68-7ff2-11ed-8abf-dac502259ad0.png

05445960-7ff2-11ed-8abf-dac502259ad0.png

0559f072-7ff2-11ed-8abf-dac502259ad0.png

其中,為第j次檢測(cè)框的內(nèi)切橢圓, 為第i個(gè)對(duì)象的對(duì)偶矩陣,為第j個(gè)關(guān)鍵幀的投影矩陣,為第j個(gè)關(guān)鍵幀的目標(biāo)檢測(cè)評(píng)分,N為對(duì)象觀測(cè)數(shù)量。

4.2 對(duì)象合并

系統(tǒng)定期檢查重復(fù)的對(duì)象,如果它們的3D IoU超過0.2,并且一個(gè)橢球體的中心位于另一個(gè)橢球體的內(nèi)部或者共享超過 個(gè)3D點(diǎn),則合并這兩個(gè)對(duì)象。

對(duì)關(guān)鍵幀中的兩個(gè)對(duì)象跟蹤的檢測(cè)框進(jìn)行組合,并初始化一個(gè)新的橢球。

5. 使用對(duì)象重定位

當(dāng)重構(gòu)地圖上的點(diǎn)與關(guān)鍵幀顯著不同時(shí),基于BoW的方法經(jīng)常失敗。因此采用基于對(duì)象的方法增強(qiáng)重定位,對(duì)視角改變更加魯棒。

由于PnP計(jì)算出的位姿比從對(duì)象對(duì)應(yīng)關(guān)系中得到的位姿更準(zhǔn)確,主要思想是引導(dǎo)點(diǎn)與從對(duì)象對(duì)應(yīng)關(guān)系中計(jì)算出的姿態(tài)進(jìn)行匹配。然后采用點(diǎn)對(duì)應(yīng)關(guān)系使用PnP進(jìn)行定位。

基于對(duì)象的方法:根據(jù)橢圓-橢球的類別建立了橢圓-橢球?qū)Γ看蔚辽龠x擇三對(duì)組合,在中心使用P3P算法計(jì)算相機(jī)位姿。對(duì)于P3P解出的四種解,橢球體被投影并且基于重疊關(guān)聯(lián)檢測(cè),代價(jià)計(jì)算為每個(gè)關(guān)聯(lián)對(duì)的(1-IoU)之和,選擇四種解中代價(jià)最小的相機(jī)位姿。

然后將基于對(duì)象方法得到的位姿通過ORB-SLAM2的局部匹配步驟來識(shí)別關(guān)鍵點(diǎn)-地標(biāo)對(duì)應(yīng)關(guān)系,選擇最小代價(jià)且超過30個(gè)關(guān)鍵點(diǎn)-地標(biāo)匹配的位姿,在點(diǎn)上進(jìn)行優(yōu)化。

Experiments:

1. 對(duì)象建圖

056424fc-7ff2-11ed-8abf-dac502259ad0.png

059eba0e-7ff2-11ed-8abf-dac502259ad0.png

與EAO-SLAM的對(duì)比

05c731aa-7ff2-11ed-8abf-dac502259ad0.png

2. 對(duì)象vs點(diǎn)

2.1 重定位

05e1cdda-7ff2-11ed-8abf-dac502259ad0.png

061b9934-7ff2-11ed-8abf-dac502259ad0.png

06494b68-7ff2-11ed-8abf-dac502259ad0.png

2.2 在束調(diào)整中集成對(duì)象

066630ca-7ff2-11ed-8abf-dac502259ad0.png

069430e2-7ff2-11ed-8abf-dac502259ad0.png

3. AR應(yīng)用

3.1 重新初始化3D追蹤

06b46218-7ff2-11ed-8abf-dac502259ad0.png

06e1915c-7ff2-11ed-8abf-dac502259ad0.png

3.2 SLAM恢復(fù)

071124ee-7ff2-11ed-8abf-dac502259ad0.png

1-4)在3D中跟蹤相機(jī),并建立點(diǎn)和對(duì)象的地圖

5-6)由于相機(jī)的突然運(yùn)動(dòng),跟蹤丟失了

7-9)當(dāng)重構(gòu)的場(chǎng)景再次可見時(shí),重定位模塊從對(duì)象中估計(jì)相機(jī)姿態(tài),建立點(diǎn)匹配,并使跟蹤和建圖繼續(xù)進(jìn)行。

4. 按部分建模

074ce042-7ff2-11ed-8abf-dac502259ad0.png

相機(jī)重定位需要足夠數(shù)量的對(duì)象(3),當(dāng)相機(jī)靠近時(shí),可能只有一到兩個(gè)對(duì)象可見。解決方法:微調(diào)檢測(cè)器網(wǎng)絡(luò),以檢測(cè)對(duì)象的可區(qū)分部分。

近距離情況下,雕像的部分(頭、肩膀和底部)被用于重新定位,當(dāng)遠(yuǎn)距離情況下,只使用完整的對(duì)象檢測(cè)。

Discussion and Future work:

考慮將基于對(duì)象的推理與靜態(tài)/動(dòng)態(tài)識(shí)別相結(jié)合。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 檢測(cè)器
    +關(guān)注

    關(guān)注

    1

    文章

    887

    瀏覽量

    48428
  • 相機(jī)
    +關(guān)注

    關(guān)注

    4

    文章

    1434

    瀏覽量

    54486
  • SLAM
    +關(guān)注

    關(guān)注

    24

    文章

    435

    瀏覽量

    32323

原文標(biāo)題:OA-SLAM:在視覺SLAM中利用對(duì)象進(jìn)行相機(jī)重新定位

文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    三維高斯?jié)姙R大規(guī)模視覺SLAM系統(tǒng)解析

    仍未得到探索。本文提出一種基于立體相機(jī)的三維高斯?jié)姙R大規(guī)模視覺SLAM系統(tǒng)LSG-SLAM。通過EuRoC數(shù)據(jù)集上的廣泛評(píng)估,LSG-
    的頭像 發(fā)表于 05-27 14:13 ?128次閱讀
    三維高斯?jié)姙R大規(guī)模<b class='flag-5'>視覺</b><b class='flag-5'>SLAM</b>系統(tǒng)解析

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】視覺實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    相機(jī)標(biāo)定是視覺系統(tǒng)的基石,直接影響后續(xù)圖像處理的精度。書中詳細(xì)介紹了單目和雙目相機(jī)的標(biāo)定流程,包括標(biāo)定板的使用、參數(shù)優(yōu)化以及標(biāo)定文件的應(yīng)用。 實(shí)際應(yīng)用,標(biāo)定誤差可能導(dǎo)致機(jī)器人
    發(fā)表于 05-03 19:41

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】+ROS2應(yīng)用案例

    SLAM(Simultaneous Localization and Mapping)技術(shù)是地圖構(gòu)建中的核心,它允許機(jī)器人在未知環(huán)境構(gòu)建地圖的同時(shí)進(jìn)行自我定位。書中詳細(xì)介紹了
    發(fā)表于 04-27 11:42

    一種基于點(diǎn)、線和消失點(diǎn)特征的單目SLAM系統(tǒng)設(shè)計(jì)

    本文提出了一種穩(wěn)健的單目視覺SLAM系統(tǒng),該系統(tǒng)同時(shí)利用點(diǎn)、線和消失點(diǎn)特征來進(jìn)行精確的相機(jī)位姿估計(jì)和地圖構(gòu)建,有效解決了傳統(tǒng)基于點(diǎn)特征的
    的頭像 發(fā)表于 03-21 17:07 ?380次閱讀
    一種基于點(diǎn)、線和消失點(diǎn)特征的單目<b class='flag-5'>SLAM</b>系統(tǒng)設(shè)計(jì)

    一種基于MASt3R的實(shí)時(shí)稠密SLAM系統(tǒng)

    本文提出了一種即插即用的單目SLAM系統(tǒng),能夠15FPS的幀率下生成全局一致的位姿和稠密幾何圖形。 01 ? 本文核心內(nèi)容 視覺SLAM乃是當(dāng)今機(jī)器人技術(shù)與增強(qiáng)現(xiàn)實(shí)產(chǎn)品的基礎(chǔ)性構(gòu)建模
    的頭像 發(fā)表于 12-27 15:25 ?1248次閱讀

    用于任意排列多相機(jī)的通用視覺里程計(jì)系統(tǒng)

    如何讓多相機(jī)視覺SLAM系統(tǒng)更易于部署且對(duì)環(huán)境更具魯棒性?本文提出了一種適用于任意排列多相機(jī)的通用視覺里程計(jì)系統(tǒng)。
    的頭像 發(fā)表于 12-13 11:22 ?665次閱讀
    用于任意排列多<b class='flag-5'>相機(jī)</b>的通用<b class='flag-5'>視覺</b>里程計(jì)系統(tǒng)

    利用VLM和MLLMs實(shí)現(xiàn)SLAM語(yǔ)義增強(qiáng)

    語(yǔ)義同步定位與建圖(SLAM)系統(tǒng)在對(duì)鄰近的語(yǔ)義相似物體進(jìn)行建圖時(shí)面臨困境,特別是復(fù)雜的室內(nèi)環(huán)境。本文提出了一種面向
    的頭像 發(fā)表于 12-05 10:00 ?1142次閱讀
    <b class='flag-5'>利用</b>VLM和MLLMs實(shí)現(xiàn)<b class='flag-5'>SLAM</b>語(yǔ)義增強(qiáng)

    激光雷達(dá)SLAM:全面掌握同步定位與地圖構(gòu)建指南

    來估計(jì)機(jī)器人的軌跡和環(huán)境地標(biāo)的位置來實(shí)現(xiàn)的。 SLAM 算法通常由兩個(gè)主要部分組成:預(yù)測(cè)步驟和校正步驟。預(yù)測(cè)步驟也稱為運(yùn)動(dòng)或里程計(jì)更新,根據(jù)傳感器提供的機(jī)器人先前的位置和運(yùn)動(dòng)信息來估計(jì)機(jī)器人的新位置。校正步驟也稱為觀察或傳感器
    的頭像 發(fā)表于 11-16 10:57 ?2039次閱讀

    最新圖優(yōu)化框架,全面提升SLAM定位精度

    的類別進(jìn)行分類,如視覺SLAM、激光SLAM、慣性SLAM等。 解決SLAM問題的經(jīng)典方法
    的頭像 發(fā)表于 11-12 11:26 ?1140次閱讀
    最新圖優(yōu)化框架,全面提升<b class='flag-5'>SLAM</b><b class='flag-5'>定位</b>精度

    激光雷達(dá)SLAM算法的應(yīng)用綜述

    一、文章概述 1.1 摘 要 即時(shí)定位與地圖構(gòu)建(simultaneous localization and mapping,SLAM)是自主移動(dòng)機(jī)器人和自動(dòng)駕駛的關(guān)鍵 技術(shù)之一,而激光雷達(dá)則是支撐
    的頭像 發(fā)表于 11-12 10:30 ?2311次閱讀
    激光雷達(dá)<b class='flag-5'>在</b><b class='flag-5'>SLAM</b>算法<b class='flag-5'>中</b>的應(yīng)用綜述

    MG-SLAM:融合結(jié)構(gòu)化線特征優(yōu)化高斯SLAM算法

    同步定位與地圖構(gòu)建 (SLAM) 是計(jì)算機(jī)視覺的一個(gè)基本問題,旨在在同時(shí)跟蹤相機(jī)姿勢(shì)的同時(shí)對(duì)環(huán)境進(jìn)行
    的頭像 發(fā)表于 11-11 16:17 ?796次閱讀
    MG-<b class='flag-5'>SLAM</b>:融合結(jié)構(gòu)化線特征優(yōu)化高斯<b class='flag-5'>SLAM</b>算法

    從算法角度看 SLAM(第 2 部分)

    作者: Aswin S Babu 正如我們[第 1 部分]中所討論的,SLAM 是指在無(wú)地圖區(qū)域中估計(jì)機(jī)器人車輛的位置,同時(shí)逐步繪制該區(qū)域地圖的過程。根據(jù)使用的主要技術(shù),SLAM 算法可分為三種
    的頭像 發(fā)表于 10-02 16:39 ?725次閱讀
    從算法角度看 <b class='flag-5'>SLAM</b>(第 2 部分)

    一種半動(dòng)態(tài)環(huán)境定位方法

    非靜態(tài)環(huán)境中進(jìn)行地圖繪制和定位是機(jī)器人學(xué)的基本問題。之前的方法大多關(guān)注靜態(tài)和高度動(dòng)態(tài)的物體,但在半動(dòng)態(tài)環(huán)境,如果不考慮低動(dòng)態(tài)物體(如停放的汽車和行人),可能會(huì)導(dǎo)致
    的頭像 發(fā)表于 09-30 14:40 ?506次閱讀
    一種半動(dòng)態(tài)環(huán)境<b class='flag-5'>中</b>的<b class='flag-5'>定位</b>方法

    一種適用于動(dòng)態(tài)環(huán)境的實(shí)時(shí)視覺SLAM系統(tǒng)

    既能保證效率和精度,又無(wú)需GPU,行業(yè)第一個(gè)達(dá)到此目標(biāo)的視覺動(dòng)態(tài)SLAM系統(tǒng)。
    的頭像 發(fā)表于 09-30 14:35 ?1102次閱讀
    一種適用于動(dòng)態(tài)環(huán)境的實(shí)時(shí)<b class='flag-5'>視覺</b><b class='flag-5'>SLAM</b>系統(tǒng)