女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

浙大團隊研發基于單目視頻的三維場景重建框架NeuralRecon

hl5C_deeptechch ? 來源:DeepTech深科技 ? 作者:DeepTech深科技 ? 2021-05-11 10:37 ? 次閱讀

最近,iPadiPhone 上的 LiDAR 有了新玩法,Apple Clips 應用程序中更新了基于三維重建的 AR 空間特效。通過 Clips 3.1 的 AR 空間功能,用戶只需用帶有 LiDAR 傳感器的 iPad Pro 或 iPhone Pro 在房間中進行掃描和重建,就能為拍攝的視頻中添加絢麗的 AR 效果。

比如跟著 AR 投射出來的燈光跳舞;

再比如用 Star Walk 2 的 AR 功能,足不出戶在房間屋頂上觀看星座。

不過要實現上述視頻中的效果,需要 iPad 和 iPhone 高端型號上配備的 LiDAR 深度傳感器,而使用浙江大學-商湯三維視覺聯合實驗室所提出的方法,希望能讓普通手機的單目攝像頭也可實現上述效果。

實驗室成員周曉巍接受了我們的采訪。他是國內計算機視覺領域青年學者、也是浙江大學計算機輔助設計與圖形學國家重點實驗室的“百人計劃” 研究員和博士生導師。幾年前,在結束美國賓夕法尼亞大學 GRASP 機器人實驗室的博士后研究后,回到母校任教。他告訴 DeepTech:“目前我們跟商湯、華為都有非常緊密的合作,通過這種產學研的結合,我們的研究成果既有對學術前沿的探索,又能根據實際需求去攻克一些技術瓶頸。與此同時,國內的 3D 視覺領域還處于新興發展階段,也需要我們回來一起把這個方向給發展壯大起來,不斷縮短與國際領先水平之間的差距。”

周曉巍所在的團隊提出了一種基于單目視頻的三維場景重建框架 NeuralRecon。在實時 (25 FPS) 的速度下,使用該方法可高質量地重建三維場景。對比結果顯示,在 ScanNet、7-Scenes 等數據集上,NeuralRecon 的速度和精度均大幅領先以往方法。該工作將發表于今年的計算機視覺頂級會議 CVPR,并錄用為口頭報告。

據其表示,NeuralRecon 提出了用神經網絡、直接回歸基于 TSDF 表示的局部三維表面,并能使用基于 GRU 的 TSDF 融合模塊,來融合歷史局部表面的特征。這樣設計的好處是,網絡不僅能直接學習到三維表面的局部光滑性先驗并借此實現準確且一致的重建,還可以減少以往方法中重復冗余的計算量,在保持質量的前提下實現實時的重建。據該團隊所知,這是首個基于深度學習方法、并能實時重建稠密且一致三維表面的系統。

問題和挑戰:基于圖像的實時場景的三維重建依然任重道遠

一直以來,稠密場景重建都是三維視覺的核心問題,在增強現實(AR)等應用中,扮演著重要角色。在 AR 應用中,要想實現真實、沉浸式的虛實融合體驗,就需要正確處理真實場景和虛擬的AR物體之間的遮擋關系,并對陰影等效果做出正確的渲染,如此才能實現合理的虛擬內容放置、以及它和與真實場景的交互。概括來說,要想實現這些效果,都得對場景進行實時且精確的三維重建。

三維重建需要依賴精確的六自由度相機位姿估計。最近幾年,視覺慣性 SLAM 逐漸成熟,且已得到大范圍的落地應用。ARKit 和 ARCore 等 AR 框架的出現,讓多數智能手機都能準確跟蹤其自身六自由度的姿態。

然而,基于圖像的實時場景的三維重建依然任重道遠。目前常用的三維重建方案如 KinectFusion、BundleFusion 等,非常依賴深度傳感器提供的深度測量。但是,由于深度傳感器價格昂貴、功耗也比較高,因此其普及程度依然較低,通常只有少數高端型號的移動設備才舍得配備。因此,使用單目多視角圖像去實現實時三維重建,具有非常大的應用前景。在不增加傳感器的前提下,它可直接用在現有智能設備中。

而在基于多視角圖像的三維重建方法中,基于深度圖融合的方法非常流行。可是,這種方法存在兩個問題:

第一,其中有大量重復計算,從相鄰幀之間,可以看到相鄰區域中有大面積的重合,同一區域的深度則會被計算多次,這會帶來計算量上的冗余;第二,即便相鄰兩幀能看到的區域有較大重合,每一幀深度圖的計算卻都得重新開始,而非基于之前相鄰幀的深度預測結果。

如下圖所示,這會導致計算出來的相鄰兩幀的深度圖不一致,重建的結果也因此常會非常分散,甚至會產生分層。

5f90f53a-b178-11eb-bf61-12bb97331649.png

圖 | 基于深度圖融合方法的重建效果

NeuralRecon:新型三維場景重建框架

為解決上述痛點,該團隊提出這一新型三維場景重建框架 NeuralRecon,下圖展示了它的算法流程。這是一個輕量級的實時端到端系統,可直接從已知相機位姿的多視角圖像中,重建基于稀疏 TSDF 表示的三維場景幾何信息。

NeuralRecon 主要有如下兩個步驟,第一步是關鍵幀的選擇。

關鍵幀選擇的目的,是為了在提供足夠運動視差的同時,還能保持多視角的共視關系,因此所選關鍵幀之間的距離,不能太近也不能太遠。具體來說, 假如一個新傳入的幀和上一個關鍵幀的相對平移大于 t [max],并且相對旋轉角度大于 R [max],那么就可選擇該幀作為關鍵幀。而具備 N 個關鍵幀的窗口,可被定義為一個片段。

第二步是聯合片段重建和融合,其中涉及三個分步驟。

第一個分步驟是圖片特征提取和反投影,這里指的是某個視頻片段中的 N 張圖片,最初會通過一個 CNN 網絡來提取多個分辨率下的圖像深度特征。而圖片特征會反投影到三維空間中,得到三維特征體。

第二個分步驟是從粗到細的三維場景重建。采取從粗到細的方式,分階段地預測并細化場景的幾何信息。在每個階段中,稀疏三維卷積神經網絡會被用來處理三維特征體,最終通過一個多層感知機 (MLP),獲悉占有分數 (Occupancy score) 和 TSDF 值。

其中,占有分數代表著三維特征體中體素在 TSDF 截斷距離之內的概率。在每個階段的最后,占有分數小于閾值的體素,都會被定為空、并會被除掉。而在稀疏化之后,稀疏三維特征體會被上采樣。下圖是稀疏 TSDF 表示的可視化。

圖 | 稀疏 TSDF 表示示意圖

第三個分步驟是基于 GRU 的融合,這一步的目的,在于讓片段的重建之間得以保持一致,希望當前片段的重建可建立在歷史片段重建結果的基礎上。

具體來說,該方法提出了一個基于 GRU 的聯合重建與融合模塊。在每個階段,三維特征體都會首先通過一個三維稀疏卷積,并進行三維幾何特征提取。然后,三維幾何特征會被輸入進 GRU 聯合重建與融合模塊。該模塊會將三維幾何特征與在歷史片段重建中獲得的隱變量進行融合,并通過一個全局感知機回歸 TSDF 和占有分數。

直觀地說,這里的 GRU 作為一種基于學習的選擇性注意機制,可取代傳統 TSDF 融合中的線性操作。在后續的步驟中,因為GRU 進行了聯合重建與融合的操作,所以會直接將回歸的 TSDF 替換對應區域的全局 TSDF,最終的重建結果可以從更新后的全局 TSDF 中通過 Marching Cubes 算法獲得。

兩大優勢:重建結果具有一致性、重建過程用時更短

根據實驗結果,作者們做出了可視效果的對比圖。

對比可知,相比較傳統的基于深度圖的方法,NeuralRecon 主要有兩方面優勢:

其一,重建結果具有一致性;其二,重建過程用時更短。

作者們在 ScanNet 數據集上,將本次方法和當前最好的方法做定量對比。對比發現,本次方法在 F-score 上和速度上,都能超過此前方法,并能做到實時且精確的估計。

與此前最快的方法 MVDepthNet 比較,本次方法不僅速度略有領先,F-score 也從 0.329 提到了 0.562。相比此前精度最高的方法 COLMAP,本次方法在精度稍勝一籌的情況下,處理每個關鍵幀所需時間也從 2076ms 降至 30ms。

結語:NeuralRecon 為基于深度學習的三維感知系統打開新的可能性

概括來說,NeuralRecon 的核心思想,在于對每個視頻片段的可視區域進行增量式的聯合重建和聯合融合。這個設計讓 NeuralRecon 能實時輸出精確、且具有一致性的三維表面。

展望未來,使用 NeuralRecon 重建的稀疏 TSDF 表示能直接用于三維語義分割、三維目標檢測和可微渲染等下游任務。借助與下游任務的端到端聯合訓練,NeuralRecon 可為基于深度學習的三維感知系統提供出新的可能性。

原文標題:浙大團隊研發新型三維重建框架NeuralRecon,是首個基于深度學習的實時單目三維場景重建系統 | 專訪

文章出處:【微信公眾號:DeepTech深科技】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Ar
    Ar
    +關注

    關注

    25

    文章

    5147

    瀏覽量

    172185
  • 深度學習
    +關注

    關注

    73

    文章

    5557

    瀏覽量

    122569

原文標題:浙大團隊研發新型三維重建框架NeuralRecon,是首個基于深度學習的實時單目三維場景重建系統 | 專訪

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    使用DLP LightCrafter4500投影結構光進行三維重建遇到的疑問求解

    使用DLP LightCrafter4500 投影結構光進行三維重建,遇到以下問題: (1)投影自己的圖片,如何使投影出的圖片和原圖片的亮度一致。它是可以設定LED的亮度,我投影出來的圖片亮度很
    發表于 03-03 06:29

    三維測量在醫療領域的應用

    三維測量在醫療領域的應用十分廣泛,為醫療診斷、治療及手術規劃等提供了重要的技術支持。以下是對三維測量在醫療領域應用的分析: 一、醫學影像的三維重建與分析 CT、MRI等影像的三維重建
    的頭像 發表于 12-30 15:21 ?620次閱讀

    三維測量技術在工業中的應用

    中不可或缺的一部分。 一、三維測量技術的工作原理 三維測量技術,也稱為三維掃描技術,是一種通過捕捉物體表面點的三維坐標信息來重建物體
    的頭像 發表于 12-30 15:01 ?601次閱讀

    三維掃描與建模的區別 三維掃描在工業中的應用

    三維掃描與建模的區別 三維掃描與建模是兩種不同的技術,它們在操作過程、輸出結果及應用領域上存在顯著的區別。 操作過程 : 三維掃描 :主要通過激光或光學掃描設備,獲取實物表面的形狀、紋理信息等
    的頭像 發表于 12-19 14:55 ?1019次閱讀

    CASAIM與東北大學達成合作,三維掃描技術助力異形建材模型重建及尺寸精準分析

    近期,CASAIM與東北大學攜手合作,以三維掃描技術為核心,為異形建材模型重建及尺寸精準分析提供有力支持,共同推進異形建材領域的應用與發展。
    的頭像 發表于 11-13 15:11 ?435次閱讀
    CASAIM與東北大學達成合作,<b class='flag-5'>三維</b>掃描技術助力異形建材模型<b class='flag-5'>重建</b>及尺寸精準分析

    CASAIM與邁普醫學達成合作,三維掃描技術助力醫療輔具實現高精度三維建模和偏差比對

    近期,CASAIM與廣州邁普再生醫學科技股份有限公司(簡稱:邁普醫學)合作,基于CT數據三維重建和設計,在醫療輔具研究開發中實現高精度三維建模和偏差比對,實現與缺損區域的精確匹配。
    的頭像 發表于 11-12 14:48 ?481次閱讀

    建筑物邊緣感知和邊緣融合的多視圖立體三維重建方法

    航空建筑深度估計是三維數字城市重建中的一項重要任務,基于深度學習的多視圖立體(MVS)方法在該領域取得了較好的成果。目前的主要方法通過修改MVS 框架實現建筑物的深度估計,缺乏對建筑物內在結構的考慮,易導致精度不足等問題。
    的頭像 發表于 11-07 10:16 ?839次閱讀
    建筑物邊緣感知和邊緣融合的多視圖立體<b class='flag-5'>三維重建</b>方法

    數字孿生三維可視化場景如何搭建?

    數字孿生 三維可視化 場景是一種強大的工具,能夠幫助我們模擬和展示現實世界中的復雜環境和系統。從數據采集到交互設計,通過一系列步驟,可以有效地搭建出逼真動態的數字孿生三維場景。 數據采
    的頭像 發表于 11-06 14:40 ?550次閱讀

    中國研發出新型三維電壓成像新技術

    10月29日,中國科學院腦科學與智能技術卓越創新中心的王凱研究團隊宣布了一項重大突破:他們成功研發出一種新型三維電壓成像技術,顯著提升了電壓成像的通量,使得在清醒動物體內對三維神經網絡
    的頭像 發表于 10-29 14:34 ?571次閱讀

    3D ToF三維場景距離(景深)測量系統簡介

    電子發燒友網站提供《3D ToF三維場景距離(景深)測量系統簡介.pdf》資料免費下載
    發表于 09-29 10:55 ?0次下載
    3D ToF<b class='flag-5'>三維</b><b class='flag-5'>場景</b>距離(景深)測量系統簡介

    留形科技借助NVIDIA平臺提供高效精確的三維重建解決方案

    本案例中,留形科技借助 NVIDIA Jetson 和 Omniverse 平臺,實現邊緣設備上的實時、全彩、無損三維重建,從而在建筑細節捕捉、大型基礎設施的數字孿生等應用中,大幅提升三維數據采集與處理的效率與精度。
    的頭像 發表于 09-09 09:42 ?950次閱讀

    泰來三維|三維掃描技術在虛擬博物館建設中的應用

    模型修復與著色:基于三維掃描數據,使用3D建模軟件進行模型的修復、細化,并添加真實的紋理和顏色,使模型更加逼真。場景構建:根據歷史資料和考古發現,構建古代遺址、宮殿、城市等場景三維
    的頭像 發表于 07-31 11:00 ?807次閱讀

    基于大模型的仿真系統研究一——三維重建大模型

    問題,賽目推出了基于大模型的仿真系統,利用機器學習、深度學習等人工智能技術,不僅推出自動標注大模型、多模態檢測大模型和場景生成大模型等模塊,并且引入三維重建大模型加強渲染畫面真實性。 ? ?通過上述模塊,賽目的路采
    的頭像 發表于 07-30 14:51 ?2541次閱讀
    基于大模型的仿真系統研究一——<b class='flag-5'>三維重建</b>大模型

    泰來三維 三維掃描在文物保護中的應用場景

    文物保護在多個方面都有應用場景,包括利用先進三維掃描技術手段進行文物展示和保護,通過專業教育和培訓培養文物保護人才,以及在實際保護工作中遵循一系列重要的原則和方法,結合現代科技,不僅能夠提升觀眾的參觀體驗,還能有效地保護文物,傳承歷史文化遺產,泰來
    的頭像 發表于 07-24 10:37 ?674次閱讀
    泰來<b class='flag-5'>三維</b> <b class='flag-5'>三維</b>掃描在文物保護中的應用<b class='flag-5'>場景</b>

    起點,經過點,終點,點xyz,畫三維圓弧。

    大家好!已知,起點,經過點,終點,點xyz,畫三維圓弧。在三維圖片框里面畫。該如何實現?甚至三維點,直線,圓弧,圓。都可以畫。
    發表于 07-17 21:33