女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何利用NVIDIA中的單視角3D追蹤功能減輕視覺感知中的遮擋現(xiàn)象?

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2024-05-17 10:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

說到智能視頻分析(IVA)應(yīng)用(如交通監(jiān)控、倉庫安全和零售消費者分析)的感知,最大的挑戰(zhàn)之一就是遮擋。例如,人們可能會移動到結(jié)構(gòu)性障礙物后面,零售消費者可能由于貨架而無法被完全看到,汽車可能會被隱藏在大型卡車后面。

本文將介紹如何利用NVIDIA DeepStream SDK中全新的單視角 3D 追蹤功能,來解決現(xiàn)實生活中 IVA 部署常見的視覺感知遮擋問題。

視覺感知中的視角和投影

在我們的物理世界中,通過相機鏡頭觀察到的一些物體的運動可能看起來并不穩(wěn)定,這是由于相機對 3D 世界的 2D 呈現(xiàn)所造成的。

水星和火星等行星的逆行就是一個例子,這讓古希臘天文學(xué)家感到困惑。他們無法解釋為什么行星有時看起來會向后移動(圖 1)。

之所以會出現(xiàn)明顯退行,是由于恒星和行星在夜空中的軌跡所造成的。這些是宇宙 3D 空間中軌道運動在夜空2D畫布上的投影,如果古代天文學(xué)家知道3D空間的運動模式,他們就可以預(yù)測這些行星在2D夜空中的出現(xiàn)。

8712583e-1380-11ef-b74b-92fbcf53809c.png

圖 1. 2014 年(左)和 2016 年(右)

火星在夜空中的逆行運動軌跡(圖片來源:NASA)

交通監(jiān)控攝像頭提供了類似的例子。這些攝像頭通常用于監(jiān)測一個大面積的區(qū)域,在這個區(qū)域里,車輛在近場和遠場的運動動態(tài)可能截然不同。

在視頻 1 中,遠處的車輛看起來較小且移動緩慢。當(dāng)車輛靠近攝像頭并轉(zhuǎn)彎時,可以觀察到物體運動的突然變化。這些變化使得我們在 2D 攝像機視圖中很難找到常見的模式,因此也很難預(yù)測車輛未來可能移動的位置。

視頻 1. 近場車輛似乎移動得很快,

而遠場車輛則移動得較慢

物體跟蹤本質(zhì)上是對物體物理狀態(tài)的連續(xù)估計,同時隨著時間的推移來識別其獨特身份。該過程通常包括對物體運動動態(tài)進行建模和預(yù)測,以抑制測量(檢測)中的固有干擾。從所提供的示例來看,直接在原生3D空間中對物體狀態(tài)進行估計和預(yù)測顯然比在投影的2D 攝像頭圖像平面中效果更好,這是因為物體存在于3D空間中。

使用 NVIDIA DeepStream進行單視角 3D 跟蹤

NVIDIA DeepStream SDK 是一個基于 GStreamer 的完整流媒體分析工具包,可用于基于 AI 的多傳感器處理,視頻、音頻和圖像理解。DeepStream 6.4 版本引入了一種名為單視角 3D 跟蹤(SV3DT)的新功能,該功能能夠在單攝像頭視圖內(nèi)估計 3D 物理世界中的物體狀態(tài)。

這一過程包括使用每個攝像頭的 3×4 投影矩陣或攝像頭矩陣,將 2D 攝像頭圖像平面上的觀測測量轉(zhuǎn)換為 3D 世界坐標(biāo)系。物體在3D世界地平面中的位置表示為物體底部的中心,因此,行人被建模為一個立在世界地面平面上的圓柱體(具有高度和半徑),圓柱體模型底部的中心是行人的腳部位置(圖 2)。

87335f5c-1380-11ef-b74b-92fbcf53809c.png

圖 2. 每個圓柱形模型的底部中心表示

每個行人在 3D 世界地平面上的位置(用綠點標(biāo)記)

使用 3×4 投影矩陣和圓柱形人體模型,可以估算出針對檢測到物體的 3D 人體模型在 3D 世界地平面上的位置,從而使投影在 2D 攝像頭圖像平面上的 3D 人體模型,與檢測到的物體的邊界框相吻合。

例如,在圖 3(左)中,灰色邊界框表示對象檢測器使用NVIDIA TAO PeopleNet模型檢測到的物體,紫色和黃色圓柱體代表從 3D 世界地平面上的估計位置投影到 2D 攝像頭圖像平面的相應(yīng)的 3D 人體模型,投影的 3D 人體模型底部的綠點代表預(yù)估的腳部位置。盡管攝像頭視圖有透視和旋轉(zhuǎn),但這些位置與實際腳部位置非常吻合。

8897f42a-1380-11ef-b74b-92fbcf53809c.png

圖 3. SV3DT 有助于跟蹤零售消費者準確的腳部位置,

即使存在遮擋也不影響

新推出的 DeepStream SV3DT 功能的一個重要優(yōu)勢是,即使存在明顯的局部遮擋,也可以準確地找到物體的 2D 和 3D 腳部位置,而這是現(xiàn)實世界 IVA 應(yīng)用中最具挑戰(zhàn)性的問題之一。

例如,圖 3(右)顯示了一個人在狹窄的過道里購物,攝像頭只能看到其上半身的一小部分,這將導(dǎo)致物體邊界框較小,只能捕獲頭部和肩部區(qū)域。在這種情況下,要在全局商店地圖上對此人進行定位就變得極具挑戰(zhàn)性,至少可以說,估計腳部位置是一項非同小可的任務(wù)。

使用邊界框的底部中心作為對象位置的代表會為軌跡估計帶來很大的誤差。即使使用攝像頭校準信息將 2D 點轉(zhuǎn)換為 3D 點情況也是如此,尤其是當(dāng)攝像頭透視和旋轉(zhuǎn)較大時。

DeepStream SDK 中的多目標(biāo)跟蹤器模塊中的 SV3DT 算法,在假設(shè)攝像頭安裝在頭部上方的情況下,通過利用 3D 人體建模信息來解決這個問題。大多數(shù)部署在智能空間中的大型攝像頭網(wǎng)絡(luò)系統(tǒng)通常都是這種情況。有了這個假設(shè),在估算相應(yīng)的 3D 人體模型位置時,就可以使用頭部作為錨點。如圖 3 顯示,即使在人被嚴重遮擋的情況下,SV3DT 算法也可以成功地找到匹配的 3D 人體模型位置。

視頻 2 顯示了在一家便利店中對消費者進行跟蹤的情況。需要注意的是,所使用的 3×4 投影矩陣沒有考慮鏡頭失真,盡管特定的攝像頭有一定的鏡頭失真,正如您所看到的,水平線有點彎曲而不是直線。這會導(dǎo)致 3D 人體模型位置估計更加不準確,尤其是當(dāng)人位于視頻幀的邊緣時。

盡管如此,人們在便利店的 2D 和 3D 腳部位置(用綠點表示)還是被準確而穩(wěn)健地追蹤到了,這也提高了隊列長度監(jiān)控和占用率地圖等其他分析的準確性。

圖 4 顯示了如何在合成數(shù)據(jù)集中穩(wěn)健地追蹤每個行人的腳部位置,即使下半身的大部分被貨架等大型物體遮擋。

88ba9430-1380-11ef-b74b-92fbcf53809c.gif

圖 4. 基于合成數(shù)據(jù)集的嚴重顆粒遮擋情況下的SV3DT 行人位置跟蹤

我們相信,解決部分遮擋問題將為現(xiàn)實應(yīng)用帶來許多可能性。SV3DT 目前處于 Alpha 模式,因為其對象類型支持有限(僅限站立的人),其他情況(如人們坐著和躺著)或其他對象類型可能會在未來的版本中得到支持。

DeepStream SV3DT 用例

該 DeepStream SV3DT 用例演示了如何在本文介紹的零售商店視頻上啟用單視角 3D 跟蹤,并從管道中保存 3D 元數(shù)據(jù)。如圖 4 和視頻 2 所示,用戶可以從數(shù)據(jù)中可視化凸起的船體和腳部位置。README 還介紹了如何在定制視頻上運行該算法。

總結(jié)

NVIDIA DeepStream SDK 中的單視角 3D 跟蹤有助于緩解現(xiàn)實生活中 IVA 應(yīng)用程序和部署的部分遮擋問題。該功能在 6.4 版本中首次推出,并在 7.0 版本中進行了增強。具體而言,SV3DT 能夠在局部遮擋的情況下估計腳部位置,并能夠進行更穩(wěn)健和準確的對象追蹤,從而實現(xiàn) 3D 地平面中的準確定位。依賴或利用地理空間分析的企業(yè)有望從這項技術(shù)中受益。

審核編輯:劉清
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2564

    文章

    52804

    瀏覽量

    765526
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5282

    瀏覽量

    106075
  • 攝像頭
    +關(guān)注

    關(guān)注

    61

    文章

    4965

    瀏覽量

    98002

原文標(biāo)題:利用 NVIDIA DeepStream 中的單視角 3D 跟蹤技術(shù)減輕視覺感知中的遮擋現(xiàn)象

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    人形機器人 3D 視覺路線之爭:激光雷達、雙目和 3D - ToF 誰更勝一籌?

    電子發(fā)燒友網(wǎng)報道(文 / 吳子鵬)在人形機器人的設(shè)計方案3D 視覺技術(shù)是實現(xiàn)環(huán)境感知與智能化決策的核心支撐之一。它能夠助力人形機器人完成環(huán)境感知
    的頭像 發(fā)表于 04-15 00:14 ?2579次閱讀

    VirtualLab Fusion應(yīng)用:光學(xué)系統(tǒng)的3D可視化

    Results Profile提供有關(guān)傳播光線的信 息,而后者只顯示組件和探測器。 在接下來的使用案例,我們將重點介紹 System:3D視圖。 系統(tǒng):Ray Results Profile的3D視圖
    發(fā)表于 04-02 08:42

    NVIDIA Omniverse Kit 107的安裝部署步驟

    NVIDIA Omniverse 是一個模塊化平臺,使用高級 API 和微服務(wù)來構(gòu)建由 OpenUSD 和 NVIDIA RTX 提供支持的 3D 應(yīng)用。OpenUSD 功能強大的
    的頭像 發(fā)表于 03-28 10:37 ?418次閱讀
    <b class='flag-5'>NVIDIA</b> Omniverse Kit 107的安裝部署步驟

    一種以圖像為中心的3D感知模型BIP3D

    在具身智能系統(tǒng)3D感知算法是一個關(guān)鍵組件,它在端側(cè)幫助可以幫助智能體理解環(huán)境信息,在云端可以用來輔助生成3D場景和3D標(biāo)簽,具備重要的研
    的頭像 發(fā)表于 03-17 13:44 ?421次閱讀
    一種以圖像為中心的<b class='flag-5'>3D</b><b class='flag-5'>感知</b>模型BIP<b class='flag-5'>3D</b>

    3D打印XPR技術(shù)對于打印效果的影響?

    我是3D打印設(shè)備的制造商,我想具體了解下3D打印XPR技術(shù)對于打印效果的影響? 或者是否能提供對應(yīng)的專利信息以備查閱
    發(fā)表于 02-18 07:59

    機器人3D視覺傳感器需求爆發(fā)!英特爾、奧比光領(lǐng)跑,百億市場爭奪戰(zhàn)開啟

    光均在機器人領(lǐng)域?qū)崿F(xiàn)了產(chǎn)品布局。 ? 視覺傳感器主要是利用機器來執(zhí)行視覺識別和判斷任務(wù)。目前,主流人形機器人視覺方案包括
    的頭像 發(fā)表于 02-12 00:12 ?2150次閱讀

    多維精密測量:半導(dǎo)體微型器件的2D&amp;3D視覺方案

    精密視覺檢測技術(shù)有效提升了半導(dǎo)體行業(yè)的生產(chǎn)效率和質(zhì)量保障。友思特自研推出基于深度學(xué)習(xí)平臺和視覺掃描系統(tǒng)的2D3D視覺檢測方案,通過9種深度
    的頭像 發(fā)表于 01-10 13:54 ?651次閱讀
    多維精密測量:半導(dǎo)體微型器件的2<b class='flag-5'>D</b>&amp;<b class='flag-5'>3D</b><b class='flag-5'>視覺</b>方案

    光學(xué)系統(tǒng)的3D可視化

    Results Profile提供有關(guān)傳播光線的信 息,而后者只顯示組件和探測器。 在接下來的使用案例,我們將重點介紹 System:3D視圖。 系統(tǒng):Ray Results Profile的3D
    發(fā)表于 01-06 08:53

    TechWiz LCD 3D應(yīng)用:賓主液晶

    近年來,賓主液晶在汽車顯示CDD的視角控制方面被經(jīng)常研究。 使用賓主液晶功能,用戶可以模擬與二色性染料混合的液晶。 1. 建模任務(wù) 1.1對比不同電壓(寬/窄視角模式)下亮度的分布
    發(fā)表于 12-30 08:54

    3D打印在制造業(yè)的應(yīng)用

    我們最近介紹了3D打印在制造業(yè)的好處,概述了在當(dāng)今快節(jié)奏的制造環(huán)境,運營效率和適應(yīng)性比以往任何時候都更加重要。
    的頭像 發(fā)表于 12-25 10:13 ?786次閱讀

    探索3D視覺技術(shù)在活塞桿自動化抓取的應(yīng)用

    隨著工業(yè)4.0時代的到來,智能制造成為工業(yè)發(fā)展的重要趨勢。作為智能制造的關(guān)鍵技術(shù)之一,3D視覺技術(shù)在活塞桿抓取領(lǐng)域的應(yīng)用前景十分廣闊。
    的頭像 發(fā)表于 09-07 15:38 ?455次閱讀

    使用NVIDIA Edify助力的服務(wù)創(chuàng)建3D資產(chǎn)和虛擬環(huán)境照明

    使用 NVIDIA Edify 助力的服務(wù)創(chuàng)建 3D 資產(chǎn)和虛擬環(huán)境照明,或是減半生成圖像時間。
    的頭像 發(fā)表于 08-02 15:22 ?975次閱讀

    3D視覺技術(shù)廣闊的應(yīng)用前景

    隨著工業(yè)自動化領(lǐng)域的迅猛進步,對制造過程抓取作業(yè)的精度與效率提出了更為嚴苛的要求。作為機械構(gòu)造的核心組件,活塞桿的精準抓取成為了保障產(chǎn)品質(zhì)量、提升生產(chǎn)效率的關(guān)鍵環(huán)節(jié)。在此背景下,3D視覺
    的頭像 發(fā)表于 07-29 15:56 ?626次閱讀
    <b class='flag-5'>3D</b><b class='flag-5'>視覺</b>技術(shù)廣闊的應(yīng)用前景

    裸眼3D筆記本電腦——先進的光場裸眼3D技術(shù)

    隨著科技的不斷進步,裸眼3D技術(shù)已經(jīng)不再是科幻電影的幻想。如今,英倫科技裸眼3D筆記本電腦將這一前沿科技帶到了我們的日常生活。無論你是專業(yè)的3D
    的頭像 發(fā)表于 07-16 10:04 ?994次閱讀

    3D視覺引導(dǎo)的多SKU紙箱拆解

    在物流和包裝行業(yè),處理多種SKU紙箱的拆解是一個常見的操作難題。傳統(tǒng)方法往往因為紙箱的尺寸、形狀和重量多樣性而遇到困難。為了解決這個問題,富唯智能提出了一種基于3D視覺引導(dǎo)的SKU紙箱拆解解決方案,幫助企業(yè)克服生產(chǎn)中的拆解難題
    的頭像 發(fā)表于 07-05 18:11 ?925次閱讀
    <b class='flag-5'>3D</b><b class='flag-5'>視覺</b>引導(dǎo)的多SKU紙箱拆解