女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大疆、港科大聯手!雙目3D目標檢測實驗效果大放送

電子工程師 ? 來源:lp ? 2019-03-12 09:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

CVPR 2019的文章出來了,今天聊聊雙目的 3D object detection。這是一篇來自 DJI (大疆)與港科大合作的文章《Stereo R-CNN based 3D Object Detection for Autonomous Driving》,作者分別是 Peiliang Li,陳曉智(DJI,MV3D的作者)和港科大的 Shaojie Shen 老師。

論文鏈接,文中稱代碼將開源

https://arxiv.org/abs/1902.09738

1. Introduction

2018 年在 3D 檢測方面的文章層出不窮,也是各個公司無人駕駛或者機器人學部門關注的重點,包含了點云,點云圖像融合,以及單目 3D 檢測,但是在雙目視覺方面的貢獻還是比較少,自從 3DOP 之后。

總體來說,圖像的檢測距離、圖像的 density 以及 context 信息,在 3D檢測中是不可或缺的一部分,因此作者在這篇文章中挖掘了雙目視覺做 3D檢測的的潛力。

2.Network Structure

整個網絡結構分為以下的幾個部分。

1). RPN部分,作者將左右目的圖像通過stereoRPN產生相應的proposal。具體來說stereo RPN是在FPN的基礎上,將每個FPN的scale上的feature map的進行concat的結構。

2). Stereo Regression,在RPN之后,通過RoiAlign的操作,得到each FPN scale下的left and right Roi features,然后concat相應的特征,經過fc層得到object class, stereo bounding boxes dimension還有viewpoint angle(下圖所示) 的值。這里解釋一下viewpoint,根據Figure3.,假定物

3). keypoint的檢測。這里采用的是類似于mask rcnn的結構進行關鍵點的預測。文章定義了4個3D semantic keypoint,即車輛底部的3D corner point,同時將這4個點投影到圖像,得到4個perspective keypoint,這4個點在3D bbox regression起到一定的作用,我們在下一部分再介紹。

在keypoint檢測任務中,作者利用RoiAlign得到的14*14feature map,經過conv,deconv最后得到6 * 28 * 28的feature map,注意到只有keypoint的u坐標會提供2D Box以外的信息,因此,處于減少計算量的目的,作者aggregate每一列的feature,得到6 * 28的output,其中,前4個channel代表4個keypoint被投影到相應的u坐標的概率,后面兩個channel代表是left or right boundary上的keypoint的概率。

3. 3D Box Estimation

通過網絡回歸得到的 2D box 的 dimension,viewpoint,還有 keypoint,我們可以通過一定的方式得到3D box的位置。定義 3D box 的狀態x = [x, y, z, θ]。

Figure 5,給出了一些稀疏的約束。包含了特征點的映射過程。這里也體現了keypoint的用處。

上述公式即為約束方程,因此可以通過高斯牛頓的方法直接求解。具體可以參考論文的引文17。這里我們簡單證明一下第一個公式。注意,這里的假設都是u,v坐標都已經經過相機內參的歸一化了。

4. Dense 3D Box Alignment

這里就回到shenshaojie老師比較熟悉的BA的過程了,由于part 3僅僅只是一個object level的深度,這里文章利用最小化左右視圖的RGB的值,得到一個更加refine的過程。定義如下的誤差函數

求解可以利用G20或者ceres也可以完成。整個alignment過程其實相對于深度的直接預測是更加robust的,因為這種預測方法,避免了全局的depth estimation中的一些invalid的pixel引起的ill problem的問題。

5. experiment

作者在實驗這塊達到了雙目視覺的state-of-the-art,同時對于各個module也做了很充足的實驗(這塊請查看原論文)。

下面是圖a、b、c為處理結果示例,每幅圖像內部上中下三部分,分別為左眼圖像檢測結果、右眼圖像檢測結果、鳥瞰視圖檢測結果。

圖a

圖b

圖c

6. Insight

最后談談文章給我的一些 insights,首先,整個文章將傳統的 detection 的任務,結合了 geometry constraint 優化的方式,做到了3D位置的估計,想法其實在不少文章sfm-learner之類的文章已經有體現過了,不過用在3Ddetection上面還是比較新穎,避免了做雙目匹配估計深度的過程。也屬于slam跟深度學習結合的一篇文章,感興趣的朋友可以繼續看看(下面鏈接)相關文章

arxiv.org/abs/1802.0552

談幾點我個人意義上的不足吧,首先耗時過程 0.28s 的 inference time,不過可能作者的重點也不在這個方面,特征的利用上可以更加有效率,在實現上。其次,能不能采用deep3dbox的方式預測dimension,然后添加入優化項呢...總體來說,是一篇不錯的值得一讀的文章!

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    213

    文章

    29709

    瀏覽量

    212710
  • 3D
    3D
    +關注

    關注

    9

    文章

    2959

    瀏覽量

    110684
  • 圖像檢測
    +關注

    關注

    0

    文章

    35

    瀏覽量

    12046

原文標題:大疆、港科大聯手!雙目3D目標檢測實驗效果大放送 | CVPR 2019

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    人形機器人 3D 視覺路線之爭:激光雷達、雙目3D - ToF 誰更勝一籌?

    電子發燒友網報道(文 / 吳子鵬)在人形機器人的設計方案中,3D 視覺技術是實現環境感知與智能化決策的核心支撐之一。它能夠助力人形機器人完成環境感知與建模、動態目標檢測與跟蹤、物體操作與精細控制等
    的頭像 發表于 04-15 00:14 ?2676次閱讀

    海伯森3D閃測傳感器,工業檢測領域的高精度利器

    隨著信息技術的飛速進步,第四次視覺革命深度融合“人”“機”“物”,基于光學原理的3D視覺檢測技術迎來爆發式發展,成為工業生產中更高效的檢測利器。3D視覺技術通過非接觸性、高速性、數據完
    的頭像 發表于 06-20 17:46 ?837次閱讀
    海伯森<b class='flag-5'>3D</b>閃測傳感器,工業<b class='flag-5'>檢測</b>領域的高精度利器

    3D AD庫文件

    3D庫文件
    發表于 05-28 13:57 ?5次下載

    奧比中光發布新一代雙目3D相機Gemini 435Le

    近日,奧比中光在美國底特律舉辦的Automate 2025展會上發布Gemini 435Le,獲得眾多機器人專業人士的關注。作為最新一代工業級雙目視覺解決方案,Gemini 435Le雙目3D相機在前作基礎上針對智能機器人的工業
    的頭像 發表于 05-14 17:15 ?450次閱讀

    HT 可視化監控頁面的 2D3D 連線效果

    HT 是一個靈活多變的前端組件庫,具備豐富的功能和效果,滿足多種開發需求。讓我們將其效果化整為零,逐一拆解具體案例,幫助你更好地理解其實現方案。 此篇文章中,讓我們一起深入探討 2D3D
    的頭像 發表于 04-09 11:28 ?524次閱讀
    HT 可視化監控頁面的 2<b class='flag-5'>D</b> 與 <b class='flag-5'>3D</b> 連線<b class='flag-5'>效果</b>

    3D閃存的制造工藝與挑戰

    3D閃存有著更大容量、更低成本和更高性能的優勢,本文介紹了3D閃存的制造工藝與挑戰。
    的頭像 發表于 04-08 14:38 ?1015次閱讀
    <b class='flag-5'>3D</b>閃存的制造工藝與挑戰

    3D打印中XPR技術對于打印效果的影響?

    我是3D打印設備的制造商,我想具體了解下3D打印中XPR技術對于打印效果的影響? 或者是否能提供對應的專利信息以備查閱
    發表于 02-18 07:59

    TAS3103 EVM用于具有3D效果的數字音頻處理器

    電子發燒友網站提供《TAS3103 EVM用于具有3D效果的數字音頻處理器.pdf》資料免費下載
    發表于 12-06 14:01 ?0次下載
    TAS3103 EVM用于具有<b class='flag-5'>3D</b><b class='flag-5'>效果</b>的數字音頻處理器

    在不用miniDSP的情況下,使用信號處理模塊時,aic3254怎么配置DAC的3D效果

    請問,在不用miniDSP的情況下,使用信號處理模塊時,怎么配置DAC的3D效果?找了很多資料,沒有關于這個方面的介紹,可以提供一下這方面的資料嗎?謝謝
    發表于 11-08 07:34

    透明塑料件噴粉3D掃描CAV全尺寸檢測逆向3D建模設計服務-CASAIM

    3D建模
    中科院廣州電子
    發布于 :2024年08月30日 10:04:53

    安寶特產品 安寶特3D Analyzer:智能的3D CAD高級分析工具

    安寶特3D Analyzer包含多種實用的3D CAD高級分析工具,包括自動比對模型、碰撞檢測、間隙檢查、壁厚檢查,以及拔模和底切分析,能夠有效提升3D CAD模型
    的頭像 發表于 08-07 10:13 ?764次閱讀
    安寶特產品  安寶特<b class='flag-5'>3D</b> Analyzer:智能的<b class='flag-5'>3D</b> CAD高級分析工具

    可存儲500張人臉的雙目3D人臉識別模塊

    。HLK-FM888是一款紅外+可見光雙目人臉識別算法模組,內嵌雙目3D活體檢測算法和基于大數據訓練的深度神經網絡動態可見光識別算法,搭載高像素的攝像頭,在增強對環境光線的適應性和
    的頭像 發表于 07-28 08:39 ?1720次閱讀
    可存儲500張人臉的<b class='flag-5'>雙目</b><b class='flag-5'>3D</b>人臉識別模塊

    原理圖及PCB Checklist大放送~

    我們一、原理圖繪制及檢查流程階段流程原理圖繪制根據已有原理圖或資料(數據手冊、方案書)繪制原理圖DRC檢查EDA的DRC自檢,初步找出繪制不合理部分根據CheckList自檢根據CheckList進行原理圖及PCB詳檢二、原理圖檢查清單細則原理圖CheckList電源電路自檢確認項目確認結果備注應用設計模擬部分數字部分是否隔離每個IC的電源引腳是否都有一個去
    的頭像 發表于 07-24 08:11 ?1998次閱讀
    原理圖及PCB Checklist<b class='flag-5'>大放送</b>~

    廣東3D掃描鈑金件外觀尺寸測量3D偏差檢測對比解決方案CASAIM

    3D掃描
    中科院廣州電子
    發布于 :2024年07月22日 16:13:45

    裸眼3D筆記本電腦——先進的光場裸眼3D技術

    效果的用戶,這款筆記本電腦都能滿足你的需求。 一、卓越的3D模型設計能力 英倫科技裸眼3D筆記本電腦采用最新的光場裸眼3D技術,使用戶無需佩戴3D
    的頭像 發表于 07-16 10:04 ?1037次閱讀