女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

三維智能視覺研究現(xiàn)狀及前景展望

DPVg_AI_era ? 來源:lp ? 2019-04-08 10:53 ? 次閱讀

人類不僅可以通過眼睛“看清”周圍環(huán)境中的東西,還能“識別并理解”這些東西,對這些東西形成“認(rèn)知和決策”。現(xiàn)在,研究人員正努力讓AI也做到這一點(diǎn)。北京大學(xué)博雅特聘教授、前沿計算研究中心執(zhí)行主任陳寶權(quán)的這篇精彩演講,對當(dāng)前國內(nèi)三維視覺智能領(lǐng)域研究概況、技術(shù)應(yīng)用方向和未來前景做了精彩分析。

眾所周知,人工智能模擬人類智能的技術(shù),實現(xiàn)對人類智能的完全再現(xiàn),是人工智能的終極目標(biāo)。而人類智能是從人類的感官和認(rèn)知開始的。所以,人類的感官往往成為研究人工智能的入手點(diǎn),比如視覺。

對于人類而言,不僅可以通過眼睛“看清”周圍環(huán)境中的東西,還能“識別并理解”這些東西,對這些東西形成“認(rèn)知和決策”。現(xiàn)在,越來越多的AI領(lǐng)域的研究人員正努力讓AI同樣做到這一點(diǎn)。從人類的三維視覺出發(fā),三維視覺智能已成為人工智能研究和應(yīng)用的熱門領(lǐng)域。

在今年3月27日新智元舉辦的“智能云·新世界”AI技術(shù)峰會上,北京大學(xué)博雅特聘教授、前沿計算研究中心執(zhí)行主任陳寶權(quán)發(fā)表了題為《三維視覺智能及應(yīng)用》的演講,從研究人員的視角,對當(dāng)前國內(nèi)三維視覺智能領(lǐng)域研究概況、技術(shù)應(yīng)用方向和未來前景做了精彩的分析。

以下為新智元整理的演講內(nèi)容:

北京大學(xué)博雅特聘教授、前沿計算研究中心執(zhí)行主任陳寶權(quán)

今天很高興有機(jī)會能夠在這里發(fā)表演講!今天下午的講者主要來自于企業(yè),我就從學(xué)術(shù)研究的角度,對現(xiàn)在非常流行的人工智能技術(shù)的重要分支——視覺智能來做下介紹。

說到視覺智能,大家都不陌生,人工智能的很多技術(shù)是基于人的各種感觀的,其中視覺感觀就是非常重要的一環(huán)。在視覺智能方面的很多技術(shù)已經(jīng)在工業(yè)界得到非常好的應(yīng)用。隨著應(yīng)用的深入,越來越多的視覺智能技術(shù)進(jìn)入“三維視覺智能”階段。也就是說,我們的眼睛不僅要看清某個東西,認(rèn)識某個東西,還要走到這個場景里面去,在三維世界里真實地感受場景,如同身臨其境。

這就需要具有三維空間感知與認(rèn)知能力的智能,即三維視覺智能。任何一個新的研究方向的出現(xiàn)都不是憑空而來,而是和許多其他學(xué)科交叉而來的。三維視覺智能的研究就是集合計算機(jī)圖形學(xué)、計算機(jī)視覺等領(lǐng)域的技術(shù)與傳統(tǒng)的人工智能、學(xué)習(xí)、大數(shù)據(jù)等很好地交叉融合。

三維視覺技術(shù)的發(fā)展得益于視覺傳感器的快速發(fā)展,已經(jīng)在推動很多應(yīng)用,比較有代表性的包括無人車、機(jī)器人,以及娛樂、影視等其它領(lǐng)域的應(yīng)用。

三維視覺研究什么?總結(jié)起來有幾大主要方向:

首先是三維感知,也就是感知三維空間,獲取和處理三維深度等;然后是位置感知,比如感知相機(jī)的位置等;第三是三維建模,不僅對場景有基本的深度感知,還要獲得關(guān)于場景完整幾何模型的描述。最重要的就是三維理解,對場景和其中的物體從三維空間來進(jìn)行理解。

三維視覺的發(fā)展得益于視覺傳感器的發(fā)展,而傳感器大致可以分為兩類,一類是被動傳感器,現(xiàn)在我們用的各種相機(jī)就是被動傳感器。另一類就是主動傳感器,比如激光掃描,以及各類以主動發(fā)射信號為主導(dǎo)進(jìn)行測量的傳感器。大家知道,隨著手機(jī)的快速發(fā)展,未來的手機(jī)會同時配備兩類傳感器,也就是深度傳感器和傳統(tǒng)的顏色傳感器。

下面簡要介紹一下我們在這方面的一些探索性工作。2009年,當(dāng)時大疆無人機(jī)還做定制化產(chǎn)品,我們請大疆做了一臺定制化無人機(jī),目的用它來做傾斜角航拍,利用無人機(jī)從空中得到航拍影像,經(jīng)過三維重建計算以后得到三維影像數(shù)據(jù)(注意,還不是完整的三維模型),有了三維描述就可以從任意視角自由地漫游場景。可以看到,盡管用的只是二維傳感器,依然可以通過視覺計算得到三維數(shù)據(jù)的描述。

隱式三維感知:動態(tài)相機(jī)實現(xiàn)視頻無縫接合

在我講如何利用主動式傳感器直接獲得三維場景幾何模型之前,我想先介紹一下,其實對于影像的三維感知不一定要以顯式的方式表示出來,可以通過隱式的方法獲得一定程度的三維感知,也能實現(xiàn)一些類比于直接采用三維信息才能實現(xiàn)的功能。

這個好比人的視覺感知,我們雖然對視覺的認(rèn)知是三維的,但也不是一切基于精確的三維測量。這里舉幾個例子。比如,上面是電影里的一個片斷,我們可以把其中的人物和表演放到一個新的場景里去,因為相機(jī)是動態(tài)的,這里就需要有一個隱式的相機(jī)三維位置恢復(fù),才能把一個動態(tài)的前景和一個動態(tài)的視頻背景無縫融合在一起。

上面是一段表演視頻,我們可以提取它的一部分三維骨架信息,驅(qū)動一個不會跳舞的人來跳舞。左邊的這個人假設(shè)不會跳舞,她只是做幾個動作,右邊大圖里面左上角是真正會跳舞的舞者,我們用她的專業(yè)動作來驅(qū)動不會跳舞的人來跳舞。就是通過對“驅(qū)動”視頻進(jìn)行三維理解并“遷移”三維動作到參考視頻中的人物而并合成新的視頻,于是在右邊大圖里,這位女士也會跳舞了。

我們不僅可以把一個人的動作遷移到另外一位骨架類似的人身上,也可以把小孩的動作遷移到大人身上,甚至可以把動物的動作遷移到人的身上。這就需要具備一定的三維骨架重定向的能力。

比如,下面的動圖中有兩個人在跳舞,但是每個人的動作方向、臉部朝向、身高都有所不同。像這樣一個運(yùn)動的定向差值,都是通過隱式三維理解和編碼實現(xiàn)的。

下面講主動傳感器的使用,近年來主動式傳感的發(fā)展非常非常快。特別是無人車技術(shù)的發(fā)展要求,進(jìn)一步推動了傳感技術(shù)的飛速發(fā)展。早在無人車火爆之前,我們就于2009年開始采用車載移動激光掃描器來進(jìn)行城市級別的大場景三維掃描,構(gòu)建城市場景的三維模型。

我們通過車載三維傳感技術(shù)得到了大量點(diǎn)云數(shù)據(jù),并利用這些數(shù)據(jù)進(jìn)行幾何建模,得到了非常精細(xì)的三維模型。我們對城市場景里各種類別的復(fù)雜物體進(jìn)行建模,例如對樹木等目標(biāo)進(jìn)行三維識別,識別出不同類型的樹,再針對不同樹木的幾何特征,對樹木進(jìn)行高精細(xì)化的三維建模。

中央電視臺曾經(jīng)對我們做過一期專門報道——《把城市搬到電腦里》。當(dāng)時我們對深圳一個片區(qū)進(jìn)行了完整的三維建模。這之后我們接到了很多電話,問我們:用你們的車開過一遍是不是就能獲得我們城市的三維模型?實際上我們做不到,原因不是因為數(shù)據(jù)處理的問題,而在于前端的數(shù)據(jù)獲取。

我們的城市綠化做得太好了,車開過去只能掃描到樹,掃描不到建筑。如果要真正解決這個問題,就要把解決方案移到前端,想辦法能夠完整地獲取數(shù)據(jù)。

因此,我們開始提出利用機(jī)器人獲取數(shù)據(jù),來進(jìn)一步解決這個問題。機(jī)器人在現(xiàn)場采集數(shù)據(jù)的同時進(jìn)行數(shù)據(jù)分析,看看數(shù)據(jù)是不是有缺失,如果有缺失就要走到相應(yīng)地點(diǎn)去獲取所需信息,從而形成一個數(shù)據(jù)獲取與處理的閉環(huán)。

讓機(jī)器人不僅看得見,還要看得懂

首先從單個物體的實驗開始,機(jī)器人手持Kinect(一種利用結(jié)構(gòu)光獲取三維模型信息的主動式傳感器)掃描一個物體,例如一個3D打印的玩具,能獲取目標(biāo)物體全方位的三維數(shù)據(jù)。機(jī)器人自己規(guī)劃掃描路徑,直到最后獲得一個完整的三維模型。

接著實驗的是場景認(rèn)知問題。不僅要獲得場景的完整三維數(shù)據(jù),而且還要認(rèn)識每個物體到底是什么,要去理解場景里的每個物體,獲取物體的語義信息。同樣的道理,認(rèn)知的過程必須形成一個閉環(huán),機(jī)器人的實時決策能不能根據(jù)現(xiàn)有的三維數(shù)據(jù)對這個物體進(jìn)行識別。如果不可以,就要走到新的角度去獲取數(shù)據(jù)。

進(jìn)一步,我們的算法就可以拓展到一個更大的室內(nèi)場景中。這種情況下,只有一個機(jī)器人是不夠的,我們可以利用多個機(jī)器人。這些機(jī)器人要實現(xiàn)協(xié)作,需要一個實時的協(xié)同工作算法。在室內(nèi)環(huán)境下,我們已經(jīng)有了非常好的機(jī)器人協(xié)同方案。

機(jī)器人不僅可以在三維空間導(dǎo)航行走,還應(yīng)該成為真實世界的一員。實現(xiàn)這一點(diǎn)就要讓機(jī)器人和現(xiàn)實場景打交道,比如讓機(jī)器人拿起一個杯子,打開一扇門,甚至和人握手等。這種直接的三維交互非常重要。這需要對機(jī)器人空間定位和路徑規(guī)劃進(jìn)行更多的研究,這方面我們近期做了一些工作。

讓機(jī)器人具備決策和執(zhí)行力,替人類完成更多工作

我們沿著這個技術(shù)路線探索,思路也變得愈發(fā)清晰。通過三維視覺與人工智能技術(shù)的結(jié)合,我們讓機(jī)器人更加智能化與功能化,讓機(jī)器人做更多人在現(xiàn)實生活中能夠做的事。機(jī)器人具備現(xiàn)場自主決策和執(zhí)行的能力,比如在工業(yè)流水線上可以幫助組裝配件,物流場景中搬箱子等。這樣的應(yīng)用,涉及到非常精細(xì)化的技術(shù),比如準(zhǔn)確高效的運(yùn)動規(guī)劃,還有各種各樣的控制,智能的執(zhí)行等。我們在這方面也有了些探索性的工作。

隨著三維傳感器的普及,三維數(shù)據(jù)越來越多,如何實現(xiàn)對三維場景的精細(xì)化理解變得非常重要。理解場景很重要也很有效的一個方法就是深度學(xué)習(xí)。最早所有的深度學(xué)習(xí)都是針對二維影像。卷積神經(jīng)網(wǎng)絡(luò)面向的是二維影像,而對于三維場景,輸入數(shù)據(jù)是三維的點(diǎn)云。

因為沒有卷積神經(jīng)網(wǎng)絡(luò)能夠天然地處理非結(jié)構(gòu)化的三維點(diǎn)云,我們針對這個問題設(shè)計了PointCNN卷積神經(jīng)網(wǎng)絡(luò),它的性能是相當(dāng)好的,我們也很高興看到有很多公司在使用我們的網(wǎng)絡(luò)。

面向物流領(lǐng)域的應(yīng)用,我們還嘗試了一個機(jī)器人搬箱子的測試。在去年京東“雙11”期間進(jìn)行了10天的壓力測試,機(jī)器人在現(xiàn)場代替一組人(兩人一組)去識別箱子、搬箱子,并把大大小小不同的箱子搬到傳送帶上。這是我們的技術(shù)第一次從學(xué)校的實驗室走進(jìn)現(xiàn)實場景中。但是我們也感受到,越走近現(xiàn)實場景,問題就會越復(fù)雜。在座有很多企業(yè)界的人,歡迎各位能過來跟我們交流合作。

三維視覺智能的研究與應(yīng)用如此重要,但國內(nèi)還沒有一個基于三維視覺的社區(qū)。去年底,由本人召集在中國圖像圖形學(xué)會旗下成立了三維視覺專業(yè)委員會,目的是把學(xué)術(shù)界和企業(yè)界的相關(guān)人士聯(lián)合在一起。歡迎更多相關(guān)企業(yè)加入進(jìn)來,一起推動三維視覺技術(shù)的發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    34146

    瀏覽量

    275271
  • 人工智能
    +關(guān)注

    關(guān)注

    1804

    文章

    48677

    瀏覽量

    246290
  • 智能視覺
    +關(guān)注

    關(guān)注

    0

    文章

    111

    瀏覽量

    9432

原文標(biāo)題:北大教授陳寶權(quán):AI+三維視覺,讓機(jī)器人具備決策和執(zhí)行力

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    索尼FCB-ER8530:三維建模與視覺感知的跨界融合

    在數(shù)字化浪潮中,三維建模技術(shù)正重塑工業(yè)設(shè)計、文化遺產(chǎn)保護(hù)與智慧城市管理等領(lǐng)域,而索尼FCB-ER8530一體化攝像機(jī)模組憑借其4K超高清成像與智能感知能力,成為這一進(jìn)程中的關(guān)鍵硬件支撐。 三維建模
    的頭像 發(fā)表于 05-19 17:30 ?120次閱讀

    奧比中光亮相第四屆中國三維視覺大會

    近日,奧比中光攜最新技術(shù)成果亮相第四屆中國三維視覺大會(China3DV 2025)。作為國內(nèi)三維視覺領(lǐng)域最高規(guī)格的學(xué)術(shù)研討盛會,本屆中國三維
    的頭像 發(fā)表于 04-15 09:18 ?342次閱讀

    工業(yè)電機(jī)行業(yè)現(xiàn)狀及未來發(fā)展趨勢分析

    過大數(shù)據(jù)分析的部分觀點(diǎn),可能對您的企業(yè)規(guī)劃有一定的參考價值。點(diǎn)擊附件查看全文*附件:工業(yè)電機(jī)行業(yè)現(xiàn)狀及未來發(fā)展趨勢分析.doc 本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請第一時間告知,刪除內(nèi)容!
    發(fā)表于 03-31 14:35

    三維測量在醫(yī)療領(lǐng)域的應(yīng)用

    技術(shù)可以對CT(計算機(jī)斷層掃描)、MRI(磁共振成像)等醫(yī)學(xué)影像進(jìn)行三維重建,生成病灶或器官的三維模型。 這些模型為醫(yī)生提供了更為直觀、立體的視覺信息,有助于醫(yī)生更準(zhǔn)確地了解患者的解剖結(jié)構(gòu)和病變情況。 醫(yī)學(xué)影像分析 : 通過
    的頭像 發(fā)表于 12-30 15:21 ?574次閱讀

    三維測量軟件的使用技巧

    在現(xiàn)代工業(yè)和科研領(lǐng)域,三維測量技術(shù)已經(jīng)成為不可或缺的一部分。它能夠提供精確的空間數(shù)據(jù),幫助工程師和研究人員更好地理解和設(shè)計復(fù)雜的三維結(jié)構(gòu)。 選擇合適的三維測量軟件 功能需求分析 :根據(jù)
    的頭像 發(fā)表于 12-30 15:05 ?663次閱讀

    三維掃描與建模的區(qū)別 三維掃描在工業(yè)中的應(yīng)用

    三維掃描與建模的區(qū)別 三維掃描與建模是兩種不同的技術(shù),它們在操作過程、輸出結(jié)果及應(yīng)用領(lǐng)域上存在顯著的區(qū)別。 操作過程 : 三維掃描 :主要通過激光或光學(xué)掃描設(shè)備,獲取實物表面的形狀、紋理信息等
    的頭像 發(fā)表于 12-19 14:55 ?901次閱讀

    生成式AI在制造業(yè)的應(yīng)用現(xiàn)狀前景展望

    在上一期《IBM 企業(yè)級 AI 為跨國制造業(yè)智能化注入新動力》的文章中,我們重點(diǎn)分享了 IBM 企業(yè)級AI驅(qū)動智能制造升級的若干場景,視覺檢測技術(shù)及知識庫平臺的應(yīng)用案例;接下來,我們將從技術(shù)層面,聚焦傳統(tǒng)機(jī)器學(xué)習(xí)及最新的生成式
    的頭像 發(fā)表于 11-06 17:06 ?1274次閱讀

    南方智能推出三維地理實體生產(chǎn)軟件

    新型基礎(chǔ)測繪與實景三維中國建設(shè)持續(xù)推進(jìn),南方智能深度聚焦,基于自主研發(fā)的SmartGIS平臺,打造以地理實體數(shù)據(jù)為核心的“生產(chǎn)、處理、質(zhì)檢、管理、可視化分析”實景三維系列軟件,提供全流程、按需定制的服務(wù)方案。
    的頭像 發(fā)表于 11-06 10:26 ?780次閱讀

    三維可視化技術(shù)的應(yīng)用現(xiàn)狀和發(fā)展前景

    三維可視化 技術(shù)的應(yīng)用現(xiàn)狀 工程建模 在工程領(lǐng)域,三維可視化技術(shù)被廣泛應(yīng)用于建筑設(shè)計、城市規(guī)劃和工業(yè)制造等方面。通過三維建模軟件,工程師可以創(chuàng)建逼真的模型,進(jìn)行設(shè)計評估、碰撞檢測和動態(tài)
    的頭像 發(fā)表于 09-30 17:57 ?667次閱讀

    三維觸摸面板-運(yùn)用觸感功能

    觸摸面板可以用于控制機(jī)器人、機(jī)床等設(shè)備的運(yùn)行。操作人員可以通過觸摸和按壓面板來發(fā)送指令,實現(xiàn)設(shè)備的啟動、停止、調(diào)速等操作,提高生產(chǎn)效率和質(zhì)量。 智能倉儲 :在智能倉儲系統(tǒng)中,三維觸摸面板可以用于操作叉車
    發(fā)表于 09-18 13:55

    泰來三維 新智驅(qū)動力:三維掃描技術(shù)助力博物館教育創(chuàng)新

    全新的視角和工具,以深入探索和分析文化遺產(chǎn)。通過高精度的掃描和建模,研究人員可以創(chuàng)建出文物和遺址的詳細(xì)三維模型,這些模型不僅有助于記錄和分析文物的現(xiàn)狀,還能在無法接觸原件的情況下進(jìn)行研究
    的頭像 發(fā)表于 08-30 14:10 ?484次閱讀
    泰來<b class='flag-5'>三維</b> 新智驅(qū)動力:<b class='flag-5'>三維</b>掃描技術(shù)助力博物館教育創(chuàng)新

    友思特方案 基于三維點(diǎn)云實現(xiàn)PCB裝配螺絲視覺檢測

    三維點(diǎn)云是完成精密化 PCB 檢測的最新視覺技術(shù)。友思特 Saccde Vision 視覺掃描系統(tǒng),采用先進(jìn)的三維成像技術(shù)和算法輸出直觀點(diǎn)云圖,進(jìn)一步確保了PCB生產(chǎn)的可靠性與穩(wěn)定性能
    的頭像 發(fā)表于 08-28 16:35 ?524次閱讀
    友思特方案  基于<b class='flag-5'>三維</b>點(diǎn)云實現(xiàn)PCB裝配螺絲<b class='flag-5'>視覺</b>檢測

    起點(diǎn),經(jīng)過點(diǎn),終點(diǎn),點(diǎn)xyz,畫三維圓弧。

    大家好!已知,起點(diǎn),經(jīng)過點(diǎn),終點(diǎn),點(diǎn)xyz,畫三維圓弧。在三維圖片框里面畫。該如何實現(xiàn)?甚至三維點(diǎn),直線,圓弧,圓。都可以畫。
    發(fā)表于 07-17 21:33

    思看科技三維視覺數(shù)字化技術(shù),加速形成新質(zhì)生產(chǎn)力的全新引擎!

    在這個日新月異的數(shù)字化時代,三維視覺數(shù)字化技術(shù)正改變著智能制造產(chǎn)業(yè)的生產(chǎn)效率和質(zhì)量,將各行業(yè)的生產(chǎn)力提升到了全新的高度,引領(lǐng)制造產(chǎn)業(yè)向新質(zhì)生產(chǎn)力轉(zhuǎn)變。 思看科技作為專業(yè)的三維
    的頭像 發(fā)表于 06-13 16:06 ?597次閱讀
    思看科技<b class='flag-5'>三維</b><b class='flag-5'>視覺</b>數(shù)字化技術(shù),加速形成新質(zhì)生產(chǎn)力的全新引擎!

    三維可視:展現(xiàn)未來的視覺盛宴

    帶你了解這一領(lǐng)域的種種奇跡。 一、三維可視化技術(shù)的定義 三維可視化技術(shù)是基于計算機(jī)圖形學(xué)和計算機(jī)視覺的一種技術(shù),用于創(chuàng)建和呈現(xiàn)逼真的三維場景。通過使用復(fù)雜的算法和圖像處理技術(shù),它能夠模
    的頭像 發(fā)表于 06-05 15:48 ?534次閱讀