女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

無需微調(diào),即插即用的占據(jù)預測模型—FlashOcc介紹

jf_pmFSk4VX ? 來源:GiantPandaCV ? 2024-01-05 11:36 ? 次閱讀

1. 本文簡介

占據(jù)預測是指在自動駕駛系統(tǒng)中,根據(jù)傳感器的輸入,預測三維空間中的每個體素是否被物體占據(jù)。占據(jù)預測可以有效地解決三維物體檢測中的長尾問題和復雜形狀的缺失問題。然而,占據(jù)預測也面臨著一個挑戰(zhàn),即如何在保證準確性的同時,提高速度和降低內(nèi)存消耗。現(xiàn)有的占據(jù)預測方法通常使用三維卷積來處理體素級別的特征,這會導致大量的計算和存儲開銷,不利于部署到不同的芯片上。為了解決這個問題,文章提出了一種快速和節(jié)省內(nèi)存的占據(jù)預測方法,稱為FlashOcc。FlashOcc的核心思想是利用一個通道到高度的變換,將二維的鳥瞰圖特征轉(zhuǎn)換為三維的占據(jù)概率,從而避免了使用三維卷積。FlashOcc的優(yōu)點是,它可以作為一個插件,直接應用到現(xiàn)有的占據(jù)預測方法上,無需額外的訓練或微調(diào)。文章在Occ3D-nuScenes數(shù)據(jù)集上進行了實驗,證明了FlashOcc的有效性和高效性,在保持高精度的同時,顯著提高了速度和降低了內(nèi)存消耗,展示了其在自動駕駛場景中的潛力。

cfa73842-a082-11ee-8b88-92fbcf53809c.png

圖1.(a) 說明了我們的FlashOcc如何以插即用的方式實現(xiàn)。當代方法使用由3D卷積處理的體素級特征預測占據(jù)情況。與之形成對比,我們的插件模型通過(1)用2D卷積替換3D卷積。(2)用通道與高度變換的BEV級特征替換3D卷積派生的占據(jù)logits,實現(xiàn)了快速和內(nèi)存高效的占據(jù)預測。(b) 插件替代與原始方法之間在精度及速度、內(nèi)存消耗和訓練時間等因素上的權(quán)衡。

2. 原文摘要

由于具有減輕數(shù)據(jù)集長尾效應和復雜形狀缺失的作用,占據(jù)預測已經(jīng)成為自動駕駛系統(tǒng)中的重要組成部分。然而,使用三維體素級表示不可避免地導致了巨大的內(nèi)存和計算開銷,這限制了占據(jù)預測方法的部署。與當前使模型更大更復雜的趨勢相反,我們認為理想的框架應該既能適應各種芯片以便部署,又能保持高精度。為此,我們提出了一個即插即用的范式,即FlashOCC,以實現(xiàn)快速和內(nèi)存高效的占據(jù)預測,同時保持高精度。具體來說,我們的FlashOCC在現(xiàn)有的體素級占據(jù)預測方法的基礎(chǔ)上做了兩點改進。第一,特征保留在俯視圖中,以利用高效的2D卷積層進行特征提取。第二,引入了一種通道與高度的變換,以將輸出結(jié)果從俯視圖映射到三維空間。我們在具有挑戰(zhàn)性的Occ3D-nuScenes基準測試上將FlashOCC應用于不同的占據(jù)預測基線,并進行了廣泛的實驗來驗證其有效性。結(jié)果表明,我們的即插即用范式在精度、運行時效率和內(nèi)存成本方面都優(yōu)于之前的最先進的方法,顯示了其部署的潛力。代碼將會開源。

cfbfc36c-a082-11ee-8b88-92fbcf53809c.png

圖2. 我們的FlashOcc的總體架構(gòu)。虛線框標識的區(qū)域表示可替換模塊。每個可替換模塊的特征形狀按圖1和圖2中的說明表示。淺藍色區(qū)域?qū)蛇x的時序融合模塊,其使用取決于紅色開關(guān)的激活。

3. 方法詳解

FlashOcc系統(tǒng)框架如圖2所示。輸入數(shù)據(jù)為環(huán)視圖像,輸出為密集的占據(jù)預測結(jié)果。它包括五個基本模塊:(1)二維圖像編碼器;(2)視角變換模塊;(3)BEV編碼器;(4)占據(jù)預測模塊;(5)時序融合模塊(可選)。

3.1 圖像編碼器

圖像編碼器使用backbone網(wǎng)絡提取輸入圖像的高層語義特征,然后饋入neck模塊進行融合,從而充分利用不同粒度的語義信息。常用的backbone網(wǎng)絡有經(jīng)典的ResNet和強大的Swin Transformer。neck模塊選擇簡潔的FPN-LSS,它將細粒度特征與直接上采樣的粗粒度特征集成。

3.2 視角變換

視角變換模塊的作用是將二維感知視角特征映射到BEV表示中。Lift-splat-shot (LSS)和Lidar Structure (LS)被廣泛使用。LSS利用像素級密集深度預測和相機內(nèi)在外參將圖像特征投影到預定義的三維網(wǎng)格體素上。然后沿垂直維度(高度)應用匯聚操作以獲得扁平的BEV表示。然而,LS依賴均勻分布的深度進行特征轉(zhuǎn)換,這會導致沿相機光線方向的特征錯配和后續(xù)的錯誤檢測,盡管計算復雜度有所降低。

3.3 BEV編碼器

BEV編碼器通過視角變換獲得的粗糙BEV特征,輸出更詳細的三維表示。其結(jié)構(gòu)與圖像編碼器類似,包括backbone和neck。正如第3.1節(jié)所概述的,我們采用相同的設(shè)置。經(jīng)過若干層后,特征擴散用于改善中心特征丟失的問題。如圖2所示,兩個不同尺度的特征被集成以增強表示質(zhì)量。

3.4 占據(jù)預測頭部

wKgZomWXebSAEnrwAACfHZ88-mw515.jpg

3.5 時序融合組件

時序融合組件通過整合歷史信息來增強動態(tài)物體或?qū)傩缘母兄K瑑蓚€主要組件:空間-時序?qū)R模塊和特征融合模塊。對齊模塊使用自身信息將歷史BEV特征與當前激光雷達系統(tǒng)對齊。這種對齊過程確保歷史特征得以正確插值和與當前感知系統(tǒng)同步。一旦完成對齊,對齊的BEV特征被傳遞到特征融合模塊。該模塊考慮它們的時序上下文,集成對齊特征以生成動態(tài)物體或?qū)傩缘娜姹硎尽H诤线^程組合相關(guān)的歷史特征和當前感知輸入的信息,以提高整體感知精度和可靠性。

4. 實驗結(jié)果

我們對Talk2BEV在Talk2BEV-Bench上的問題進行了定量評估。我們報告了不同LVLM在不同任務子集和不同類型問題上的性能,以及它們的平均性能。MiniGPT-4在所有類型問題上都取得了最佳的平均性能。BEV中的誤差對性能的影響較小,這表明隨著更高性能的LVLM的出現(xiàn),Talk2BEV的性能有望進一步提高。表II展示了Talk2BEV使用不同LVLM構(gòu)建的語言增強地圖(BLIP-2、InstructBLIP-2、MiniGPT-4)和BEV變體(LSS和GT)在多項選擇問題(MCQs)上的性能。表III評估了空間操作符對系統(tǒng)性能的影響,顯示了集成空間操作符帶來的顯著改進。此外,表IV報告了不同對象類別的性能,突出了車輛類別之間的性能差異。

cfe766c4-a082-11ee-8b88-92fbcf53809c.png

表1. Occ3D-nuScenes驗證集上的三維占據(jù)預測性能。

cff7df0e-a082-11ee-8b88-92fbcf53809c.png

表2. 各種方法的詳細設(shè)置。

d0119e08-a082-11ee-8b88-92fbcf53809c.png

圖3. Occ3D-nuScenes上的定性結(jié)果。

d0199a86-a082-11ee-8b88-92fbcf53809c.png

表3. 在各種流行的基于體素的占據(jù)方法論上普適性demonstration的FlashOcc。

d02e7032-a082-11ee-8b88-92fbcf53809c.png

表4. 時序融合中的持續(xù)改進demonstration。

d03f83ea-a082-11ee-8b88-92fbcf53809c.png

表5. 訓練和部署期間的資源消耗分析。

5. 總結(jié)

在本文中,我們介紹了一種即插即用的方法,稱為FlashOCC,它旨在實現(xiàn)快速和節(jié)省內(nèi)存的占據(jù)預測。它直接用二維卷積替換了基于體素的占據(jù)方法中的三維卷積,并引入了通道到高度的變換,將扁平化的BEV特征重塑為占據(jù)logits。FlashOCC的有效性和泛化性已經(jīng)在多種體素級占據(jù)預測方法上得到了驗證。廣泛的實驗表明,該方法在精度、時間消耗、內(nèi)存效率和部署友好性方面優(yōu)于以前的最先進的方法。據(jù)我們所知,我們是第一個將子像素范式(通道到高度)應用于占據(jù)任務的工作,它僅利用BEV級特征,完全避免了使用計算復雜的三維(可變形)卷積或變換器模塊。并且,可視化結(jié)果令人信服地證明了FlashOcc成功地保留了高度信息。在我們的未來工作中,我們將探索將我們的FlashOcc集成到自動駕駛的感知流程中,旨在實現(xiàn)高效的片上部署。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 傳感器
    +關(guān)注

    關(guān)注

    2562

    文章

    52507

    瀏覽量

    763305
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3770

    瀏覽量

    137050
  • 變換器
    +關(guān)注

    關(guān)注

    17

    文章

    2129

    瀏覽量

    110363
  • 自動駕駛系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    67

    瀏覽量

    7073
  • LSS
    LSS
    +關(guān)注

    關(guān)注

    0

    文章

    8

    瀏覽量

    2053

原文標題:FlashOcc:無需微調(diào),即插即用的占據(jù)預測模型!

文章出處:【微信號:GiantPandaCV,微信公眾號:GiantPandaCV】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    即插即用和熱插拔的區(qū)別

    關(guān)系。即插即用是要重啟機器才能認出來的熱插拔立刻就能認出來 支持即插即用是一種使您可以快速簡易安裝某硬件設(shè)備而無需安裝設(shè)備驅(qū)動程序或重新配置系統(tǒng)的標準。即插即用需要硬件和軟件兩方面支
    發(fā)表于 10-23 10:26

    ————即插即用無需組網(wǎng)協(xié)議wifi模塊————

    即插即用wifi模塊,無需寫組網(wǎng)協(xié)議,多種接口。 Wifi模塊 EC32L13 EC19DEC32L13模塊的規(guī)格————特點;功耗低,尺寸小,穩(wěn)定l2.4GHz IEEE 802.11b/g/nl
    發(fā)表于 03-25 15:48

    即插即用移動電源管理芯片

    即插即用移動電源管理芯片
    發(fā)表于 11-25 10:35

    多片段時序數(shù)據(jù)建模預測實踐資料分享

    數(shù)據(jù)集進行模型的構(gòu)建與預測分析的,但是在實際的工程使用中會有一種特殊的情況就是:我們通過實驗所采集到的數(shù)據(jù)集往往不是絕對連續(xù)的而是多“片段”的。何為 “片段”?以我之前的時序建模相關(guān)的文章來講,諸如:氣象數(shù)據(jù)預測、風力發(fā)電數(shù)
    發(fā)表于 06-30 07:52

    模型預測控制介紹

    這篇主要講一下模型預測控制,如果對PID控制了解的同學,那效果更好。如果不了解PID控制,還是熟悉下比較好。模型預測控制,顧名思義,基于模型
    發(fā)表于 08-18 06:21

    PCI與即插即用

    PCI與即插即用 即插即用 是從英文“Plug and Play”翻譯過來的,縮寫為 PnP 。即插即用功能只有在同時具備了符合以下4個條件時才可以:即插即
    發(fā)表于 12-09 13:51 ?2211次閱讀

    什么是即插即用

    什么是即插即用              支持即插即用是一種使您可以快速簡易安裝某硬件設(shè)備而無需安裝設(shè)備驅(qū)動程序或重新
    發(fā)表于 12-28 11:17 ?2382次閱讀

    數(shù)據(jù)預測分析方法

    數(shù)據(jù)預測分析方法,有需要的朋友下來看看。
    發(fā)表于 01-15 15:07 ?0次下載

    基于通用即插即用協(xié)議服務系統(tǒng)模型

    在智能家居網(wǎng)絡設(shè)備自動發(fā)現(xiàn)過程中,網(wǎng)絡設(shè)備端隨機獨立地選擇延時發(fā)送服務響應消息,通常出現(xiàn)嚴重的消息擁塞現(xiàn)象。為解決智能家居網(wǎng)絡中服務響應消息擁塞問題,以智能家居標準協(xié)議通用即插即用( UPnP)進行
    發(fā)表于 12-21 11:25 ?0次下載
    基于通用<b class='flag-5'>即插即用</b>協(xié)議服務系統(tǒng)<b class='flag-5'>模型</b>

    詳細剖析OPC和即插即用技術(shù)

    介紹OPC和即插即用技術(shù),重點對OPC實際應用標準的發(fā)展、技術(shù)、特點及適用范圍與接口應用作分折說明。
    的頭像 發(fā)表于 01-26 15:18 ?6409次閱讀
    詳細剖析OPC和<b class='flag-5'>即插即用</b>技術(shù)

    神經(jīng)網(wǎng)絡在數(shù)據(jù)預測有怎么樣的應用

    本文檔的主要內(nèi)容詳細介紹的是神經(jīng)網(wǎng)絡在數(shù)據(jù)預測有怎么樣的應用。
    發(fā)表于 02-29 08:00 ?0次下載

    季節(jié)性時空數(shù)據(jù)預測模型在城市中的應用

    季節(jié)性時空數(shù)據(jù)預測模型在城市中的應用
    發(fā)表于 06-07 16:16 ?2次下載

    索引即插即用主板REV001

    電子發(fā)燒友網(wǎng)站提供《索引即插即用主板REV001.zip》資料免費下載
    發(fā)表于 07-18 17:09 ?3次下載
    索引<b class='flag-5'>即插即用</b>主板REV001

    索引即插即用主板REV000

    電子發(fā)燒友網(wǎng)站提供《索引即插即用主板REV000.zip》資料免費下載
    發(fā)表于 07-27 11:27 ?4次下載
    索引<b class='flag-5'>即插即用</b>主板REV000

    電源系統(tǒng)設(shè)計:非完全“即插即用

    電源系統(tǒng)設(shè)計:非完全“即插即用
    發(fā)表于 11-07 08:07 ?1次下載
    電源系統(tǒng)設(shè)計:非完全“<b class='flag-5'>即插即用</b>”