女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

牛津博士論文學習重建和分割3D物體,突破AI和機器理解的界限

工程師鄧生 ? 來源:機器之心Pro ? 作者:Bo Yang ? 2020-11-26 18:11 ? 次閱讀

讓機器擁有像人類一樣感知 3D 物體和環境的能力,是人工智能領域的一項重要課題。牛津大學計算機科學系博士生 Bo Yang 在其畢業論文中詳細解讀了如何重建和分割 3D 物體,進而賦予機器感知 3D 環境的能力,突破了人工智能和機器理解的界限。

賦予機器像人類一樣感知三維真實世界的能力,這是人工智能領域的一個根本且長期存在的主題。考慮到視覺輸入具有不同類型,如二維或三維傳感器獲取的圖像或點云,該領域研究中一個重要的目標是理解三維環境的幾何結構和語義。

傳統方法通常利用手工構建的特征來估計物體或場景的形狀和語義。但是,這些方法難以泛化至新物體和新場景,也很難克服視覺遮擋的關鍵問題。

今年九月畢業于牛津大學計算機科學系的博士生 Bo Yang 在其畢業論文《Learning to Reconstruct and Segment 3D Objects》中對這一主題展開了研究。與傳統方法不同,作者通過在大規模真實世界的三維數據上訓練的深度神經網絡來學習通用和魯棒表示,進而理解場景以及場景中的物體。

總體而言,本文開發了一系列新型數據驅動算法,以實現機器感知到真實世界三維環境的目的。作者表示:「本文可以說是突破了人工智能和機器理解的界限。」

這篇博士論文有 143 頁,共六章。機器之心對該論文的核心內容進行了簡要介紹,感興趣的讀者可以閱讀論文原文。

論文地址:https://arxiv.org/pdf/2010.09582.pdf

論文概述

作者在第 2 章首先回顧了以往 3D 物體重建和分割方面的研究工作,包括單視圖和多視圖 3D 物體重建、3D 點云分割、對抗生成網絡(GAN)、注意力機制以及集合上的深度學習。此外,本章最后還介紹了在單視圖 / 多視圖 3D 重建和 3D 點云分割方面,該研究相較于 SOTA 方法的新穎之處。

基于單視圖的 3D 物體重建

在第 3 章,作者提出以一種基于 GAN 的深度神經架構來從單一的深度視圖學習物體的密集 3D 形狀。作者將這種簡單但有效的模型稱為 3D-RecGAN++,它將殘差連接(skip-connected)的 3D 編碼器 - 解碼器和對抗學習結合,以生成單一 2.5D 視圖條件下的完整細粒度 3D 結構。該模型網絡架構的訓練和測試流程如下圖所示:

接著,作者利用條件對抗訓練來細化編碼器 - 解碼器估計的 3D 形狀,其中用于 3D 形狀細化的判別器結構示意圖如下:

最后,作者將提出的 3D-RecGAN++ 與 SOTA 方法做了對比,并進行了控制變量研究。在合成和真實數據集上的大量實驗結果表明,該模型性能良好。

基于多視圖的 3D 物體重建

在第 4 章,作者提出以一種新的基于注意力機制的神經模塊來從多視圖中推理出更好的 3D 物體形狀。這種簡單但高效的注意力聚合模塊被稱為 AttSets,其結構如下圖所示。與現有方法相比,這種方法可以學習從不同圖像中聚合有用信息。

此外,研究者還引入了兩階段訓練算法,以確保在給出一定數量輸入圖像的情況下,預估的 3D 形狀具有魯棒性。研究者在多個數據集上進行了實驗,證明該方法能夠精確地恢復物體的 3D 形狀。

從點云中學習分割 3D 物體

在第五章中,研究者提出了一個新的框架來識別大規模 3D 場景中的所有單個 3D 物體。與現有的研究相比,該研究的框架能夠直接并且同時進行檢測、分割和識別所有的目標實例,而無需任何繁瑣的前 / 后處理步驟。研究者在多個大型實際數據集上展現了該方法相對于基線的性能提升。

作者介紹

本文作者 Bo Yang 現為香港理工大學計算機系助理教授。他本科和碩士分別畢業于北京郵電大學和香港大學,然后進入牛津大學計算機科學系攻讀博士學位,其導師為 Niki Trigoni 和 Andrew Markham 教授。

Bo Yang 作為一作以及合著的論文曾被《計算機視覺國際期刊》(IJCV)以及 NeurIPS 和 CVPR 等學術會議接收,谷歌學術主頁上顯示他共著有 22 篇論文,被引用數超過 400。

論文目錄如下:

責任編輯:PSY

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    34201

    瀏覽量

    275364
  • 機器學習
    +關注

    關注

    66

    文章

    8492

    瀏覽量

    134087
  • 3D物體識別
    +關注

    關注

    0

    文章

    3

    瀏覽量

    6364
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    人形機器3D 視覺路線之爭:激光雷達、雙目和 3D - ToF 誰更勝一籌?

    電子發燒友網報道(文 / 吳子鵬)在人形機器人的設計方案中,3D 視覺技術是實現環境感知與智能化決策的核心支撐之一。它能夠助力人形機器人完成環境感知與建模、動態目標檢測與跟蹤、物體操作
    的頭像 發表于 04-15 00:14 ?2373次閱讀

    NVIDIA助力影眸科技3D生成工具Rodin升級

    AI、計算機視覺技術在大眾娛樂市場的推廣應用,其 3D 生成工具 Rodin(Hyper3d.ai)去年 6 月發布后迅速突破了百萬用戶量級,背后技術
    的頭像 發表于 04-27 15:09 ?320次閱讀

    將應用程序工具套件集成到Unity 3D OpenVINO?過程中遇到\"DLLNotFound異常\"錯誤怎么解決?

    。 在機器上設置所有環境路徑,并且可以全局訪問每個依賴關系/dll。 Unity 3D 編輯器無法找到任何依賴關系,并引發DLLNotFound Exception。 項目可以獨立構建和運行。
    發表于 03-05 06:22

    騰訊混元3D AI創作引擎正式發布

    近日,騰訊公司宣布其自主研發的混元3D AI創作引擎已正式上線。這一創新性的創作工具將為用戶帶來前所未有的3D內容創作體驗,標志著騰訊在AI技術領域的又一重大
    的頭像 發表于 01-23 10:33 ?503次閱讀

    騰訊混元3D AI創作引擎正式上線

    近日,騰訊公司宣布其自主研發的混元3D AI創作引擎已正式上線。這一創新性的創作工具,標志著騰訊在3D內容生成領域邁出了重要一步。 混元3D AI
    的頭像 發表于 01-22 10:26 ?478次閱讀

    3D打印技術在材料、工藝方面的突破

    2024年3D打印技術領域在新材料、新工藝和新應用方面繼續取得突破,并呈現出多樣的發展態勢。工藝方面,行業更加關注極限制造能力,從2023年的無支撐3D打印到2024年的點熔化、鍛打印、光束整形、多
    的頭像 發表于 01-13 18:11 ?820次閱讀
    <b class='flag-5'>3D</b>打印技術在材料、工藝方面的<b class='flag-5'>突破</b>

    中興通訊攜手中國移動推出AI裸眼3D創新產品

    產品憑借Neovision 3D Anytime突破性的2D3D技術,以及5G與AI的深度融合,為消費者帶來更加沉浸、更為豐富的裸眼
    的頭像 發表于 10-15 10:05 ?1340次閱讀

    中興通訊全場景AI終端應用與裸眼3D新品亮相

    ”的產品戰略與理念,終端業務六大AI主題展示吸引了眾多關注,內容覆蓋全球領先的AI裸眼3DAI同聲傳譯和方言互譯、AI安全反詐、
    的頭像 發表于 10-15 10:00 ?1385次閱讀

    3d打印機器人外殼模型ABS材料3D打印噴漆服務-CASAIM

    隨著科技的不斷發展,3D打印技術作為一種創新性的制造方式,正在改變我們的生活和制造業。它是一種通過逐層添加材料來構建物體的制造方法。該技術允許我們通過CAD(計算機輔助設計)軟件將數字模型轉換成實體物體
    的頭像 發表于 07-21 15:10 ?535次閱讀

    紫光展銳助力全球首款AI裸眼3D手機發布

    1.4億臺,展示了該技術巨大的市場潛力和增長空間。近日,全球首款AI裸眼3D手機——中興遠航3D重磅上市。憑借微米級3D光柵技術、Neovision
    的頭像 發表于 07-15 16:00 ?958次閱讀

    機器學習中的數據分割方法

    機器學習中,數據分割是一項至關重要的任務,它直接影響到模型的訓練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細探討機器學習中數據
    的頭像 發表于 07-10 16:10 ?2954次閱讀

    Meta推出革命性3D Gen AI模型:1分鐘內生成高質量3D內容

    在科技日新月異的今天,Meta再次引領創新潮流,宣布了一項令人矚目的技術突破——3D Gen AI模型的誕生。這款先進的模型以其前所未有的高效性與卓越品質,重新定義了3D內容創作的邊界
    的頭像 發表于 07-04 18:12 ?1234次閱讀

    機器人視覺技術中圖像分割方法有哪些

    機器人視覺技術是人工智能領域的一個重要分支,它涉及到圖像處理、模式識別、機器學習等多個學科。圖像分割機器人視覺技術中的一個重要環節,它的目
    的頭像 發表于 07-04 11:34 ?1557次閱讀

    中興通訊與中國移動發布全球首創AI裸眼3D新品,引領3D科技新浪潮

    在科技飛速發展的今天,裸眼3D技術以其獨特的沉浸式體驗,正逐漸成為科技領域的新寵。近日,全球領先的通訊科技企業中興通訊攜手中國移動,在備受矚目的2024MWC上海展上,發布了兩款全球首創的AI裸眼
    的頭像 發表于 06-28 15:32 ?1308次閱讀

    3D建模的重要內容和應用

    3D建模是一種技術,通過計算機軟件創建虛擬三維模型,模擬現實世界中的物體或場景。這項技術廣泛應用于建筑設計、電影制作、游戲開發、工程仿真等領域。下面古河云科技將介紹一些與3D建模相關的重要內容
    的頭像 發表于 06-21 14:48 ?1180次閱讀