女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

TransGeo:第一種用于交叉視圖圖像地理定位的純Transformer方法

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-01-16 11:02 ? 次閱讀

主要內容:

提出了第一種用于交叉視圖圖像地理定位的純Transformer方法,在對齊和未對齊的數據集上都實現了最先進的結果,與基于CNN的方法相比,計算成本更低,所提出的方法不依賴于極坐標變換和數據增強,具有通用性和靈活性。

論文出發點:

基于CNN的交叉視圖圖像地理定位主要依賴于極坐標變換,無法對全局相關性進行建模,為了解決這些限制,論文提出的算法利用Transformer在全局信息建模和顯式位置信息編碼方面的優勢,還進一步利用Transformer輸入的靈活性,提出了一種注意力引導的非均勻裁剪方法去除無信息的圖像塊,性能下降可以忽略不計,從而降低了計算成本,節省下來的計算可以重新分配來提高信息patch的分辨率,從而在不增加額外計算成本的情況下提高性能。

這種“關注并放大”策略與觀察圖像時的人類行為高度相似。

圖像地理定位(名詞解釋):

基于圖像的地理定位旨在通過檢索GPS標記的參考數據庫中最相似的圖像來確定查詢圖像的位置,其應用在大城市環境中改善具有大的噪聲GPS和導航,在Transformer出現之前,通常使用度量學習損失來訓練雙通道CNN框架,但是這樣交叉視圖檢索系統在街道視圖和鳥瞰視圖之間存在很大的領域差距,因為CNN不能明確編碼每個視圖的位置信息,之后為了改善域間隙,算法在鳥瞰圖像上應用預定義的極坐標變換,變換后的航空圖像具有與街景查詢圖像相似的幾何布局,然而極坐標變換依賴于與兩個視圖相對應的幾何體的先驗知識,并且當街道查詢在空間上未在航空圖像的中心對齊時,極坐標轉換可能會失敗。

Contribution:

提出了第一種基于Transformer的方法用于交叉視圖圖像地理定位,無需依賴極坐標變換或數據增強。

提出了一種注意力引導的非均勻裁剪策略,去除參考航空圖像中的大量非信息補丁以減少計算量,性能下降可忽略不計,通過將省下來的計算資源重新分配到信息patch的更高圖像分辨率進一步提高了性能。

與基于CNN的方法相比,在數據集上的最先進性能具有更低的計算成本、GPU內存消耗和推理時間。

網絡架構:

251123c0-952a-11ed-bfe3-dac502259ad0.png

25375ea0-952a-11ed-bfe3-dac502259ad0.png

Patch Embedding:

256d4ab0-952a-11ed-bfe3-dac502259ad0.png

Class Token:

最后一層輸出的類token被送到一個MLP頭以生成最終的分類向量,使用最終輸出向量作為嵌入特征,并使用上面說的損失對其進行訓練。

可學習的位置嵌入:

位置嵌入被添加到每個token以保持位置信息,采用了可學習的位置嵌入,這是包括class token在內的所有(N+1)token的可學習矩陣,可學習的位置嵌入使雙通道Transformer能夠學習每個視圖的最佳位置編碼,而無需任何關于幾何對應的先驗知識,因此比基于CNN的方法更通用和靈活。

多頭注意力:

Transformer編碼器內部架構是L個級聯的基本Transformer,關鍵組成部分是多頭注意力塊,它首先使用三個可學習的線性投影將輸入轉換為查詢、鍵和值,表示為Q、K、V,維度為D,然后將注意力輸出計算為

258decca-952a-11ed-bfe3-dac502259ad0.png

,一個k-head注意力塊用k個不同的head對Q、k、V進行線性投影,然后對所有k個head并行執行attention,輸出被連接并投影回模型維度D,多頭注意力可以模擬從第一層開始的任意兩個標記之間的強全局相關性,這在CNN中是不可能學習的,因為卷積的接受域有限。

Attention引導的非均勻裁剪:

當尋找圖像匹配的線索時,人類通常會第一眼找到最重要的區域,然后只關注重要的區域并放大以找到高分辨率的更多細節,把“關注并放大”的思想用在交叉圖像地理定位中可能更有益,因為兩個視圖只共享少量可見區域,一個視圖中的大量區域,例如鳥瞰圖中的高樓屋頂,在另一個視圖可能看不見,這些區域對最終相似性的貢獻微不足道,可以去除這些區域以減少計算和存儲成本,然而重要的區域通常分散在圖像上,因此CNN中的均勻裁剪不能去除分散的區域,因此提出了注意力引導的非均勻裁剪

25af1c06-952a-11ed-bfe3-dac502259ad0.png

在鳥瞰分支的最后一個transformer編碼器中使用注意力圖,它代表了每個token對最終輸出的貢獻,由于只有class token對應的輸出與MLP head連接,因此選擇class token與所有其他patch token之間的相關性作為注意力圖,并將其重塑為原始圖像形狀。

模型優化:

為了在沒有數據增強的情況下訓練Transformer模型,采用了正則化/泛化技術ASAM。在優化損失時使用ASAM來最小化損失landscape的自適應銳度使得該模型以平滑的損失曲率收斂以實現強大的泛化能力。

25e54cd6-952a-11ed-bfe3-dac502259ad0.png

通過同時最小化的損失和自適應銳度,能夠在不使用任何數據增強的情況下克服過擬合問題

實驗:

在兩個城市規模的數據集上進行了實驗,即CVUSA和VIGOR,分別代表了空間對齊和非對齊設置

評估度量:在top-k召回準確率,表示為“R@k”,基于每個查詢的余弦相似度檢索嵌入空間中的k個最近參考鄰居,如果地面真實參考圖像出現在前k個檢索圖像中,則認為其正確。

預測GPS位置和地面真實GPS位置之間的真實世界距離作為VIGOR數據集上的米級別的評估。

命中率,即覆蓋查詢圖像(包括地面真相)的前1個檢索參考圖像的百分比

2600fff8-952a-11ed-bfe3-dac502259ad0.png

26217bf2-952a-11ed-bfe3-dac502259ad0.png

264e90e2-952a-11ed-bfe3-dac502259ad0.png

和之前SOTA方法SAFA在計算代價上的比較

26602d3e-952a-11ed-bfe3-dac502259ad0.png

總結:

提出了第一種用于交叉視圖圖像地理定位的純Transformer方法,在對齊和未對齊的數據集上都實現了最先進的結果,與基于CNN的方法相比,計算成本更低。

缺點是使用兩個管道,且patch選擇簡單地使用不可通過參數學習的注意力圖。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像
    +關注

    關注

    2

    文章

    1092

    瀏覽量

    41038
  • 數據集
    +關注

    關注

    4

    文章

    1223

    瀏覽量

    25284
  • cnn
    cnn
    +關注

    關注

    3

    文章

    354

    瀏覽量

    22647

原文標題:CVPR 2022 | TransGeo:第一種用于交叉視圖圖像地理定位的純Transformer方法

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    電源效率測量方法

    本課程講義用于將向大家介紹測量開關電源 轉換效率的兩不同方法第一種方法使用個瓦特表和兩個萬用表; 第二
    發表于 05-12 16:13

    Wi-Fi 定位服務

    Wi-Fi 是一種著名的無線網絡技術,用于設備的局域網和互聯網接入。Wi-Fi 通過 Wi-Fi 網絡為家庭、辦公室和學校等環境提供便捷的無線互聯網接入服務。 Wi-Fi 定位一種地理定位
    發表于 04-17 15:01

    AI驅動的板載地理定位-由瑞蘇盈科FPGA SoM加速!

    在當今數字化與智能化深度融合的時代,地理定位技術作為連接虛擬數字世界與現實物理空間的關鍵紐帶,其重要性與日俱增。從人們日常使用的出行導航APP,到關乎國家安全的軍事國防應用,從商業領域精準的市場營銷
    的頭像 發表于 04-11 09:04 ?170次閱讀
    AI驅動的板載<b class='flag-5'>地理定位</b>-由瑞蘇盈科FPGA SoM加速!

    一種永磁電機用轉子組件制作方法

    。 本文著重闡述了這種電機轉子使用膠粘劑對磁鋼和芯軸直接粘接的制造方法,不需要進行同軸度機加工,并為這種制造方法提供了一種自動調心定位機構;并研究了磁鋼零件的同軸度與產品最終裝配后組件
    發表于 03-25 15:20

    transformer專用ASIC芯片Sohu說明

    2022年,我們打賭說transformer會統治世界。 我們花了兩年時間打造Sohu,這是世界上第一用于transformer(ChatGPT中的“T”)的專用芯片。 將
    的頭像 發表于 01-06 09:13 ?983次閱讀
    <b class='flag-5'>transformer</b>專用ASIC芯片Sohu說明

    Mamba入局圖像復原,達成新SOTA

    圖像復原又來新突破了!還記得性能超越SwinIR(基于Transformer)的MambaIR嗎?一種基于Mamba的圖像復原基準模型,登上ECCV 2024。最近原作者又開發了新版本
    的頭像 發表于 12-30 18:09 ?700次閱讀
    Mamba入局<b class='flag-5'>圖像</b>復原,達成新SOTA

    全球地理定位技術的發展歷程

    根據 Google 提供的數據,目前有 5,465 顆衛星在環繞地球軌道運行,其中有 154 顆衛星主要用于導航。
    的頭像 發表于 12-16 11:37 ?995次閱讀

    如何使用圖像采集卡

    圖像進行處理和存儲。本文旨在詳細探討圖像采集卡的定義、功能、安裝和使用方法,以幫助讀者更好地理解和利用這設備。
    的頭像 發表于 12-13 15:03 ?710次閱讀
    如何使用<b class='flag-5'>圖像</b>采集卡

    自動駕駛中直說的BEV+Transformer到底是個啥?

    (Bird’s Eye View)+Transformer”是兩個方向的技術,BEV是一種全新的3D坐標系,而Transformer則是一種深度學習神經網絡模型,BEV+
    的頭像 發表于 11-07 11:19 ?1237次閱讀
    自動駕駛中<b class='flag-5'>一</b>直說的BEV+<b class='flag-5'>Transformer</b>到底是個啥?

    SegVG視覺定位方法的各個組件

    視覺定位(Visual Grounding)旨在基于自由形式的自然語言文本表達定位圖像中的目標物體。隨著多模態推理系 統的普及,如視覺問答和圖像描述,視覺定位的重要性愈加凸顯。已有的研
    的頭像 發表于 10-28 13:59 ?834次閱讀
    SegVG視覺<b class='flag-5'>定位</b><b class='flag-5'>方法</b>的各個組件

    一種將NeRFs應用于視覺定位任務的新方法

    視覺定位旨在估計在已知環境中捕獲的給定圖像的旋轉和位置,大致可以分為絕對姿態回歸(APR),場景坐標回歸(SCR)和分層方法(HM)。
    的頭像 發表于 10-28 10:03 ?506次閱讀
    <b class='flag-5'>一種</b>將NeRFs應<b class='flag-5'>用于</b>視覺<b class='flag-5'>定位</b>任務的新<b class='flag-5'>方法</b>

    一種半動態環境中的定位方法

    和終身定位方法,以識別非靜態環境中的半動態物體,并提出了個通用框架,將主流物體檢測算法與建圖和定位算法集成在起。建圖
    的頭像 發表于 09-30 14:40 ?508次閱讀
    <b class='flag-5'>一種</b>半動態環境中的<b class='flag-5'>定位</b><b class='flag-5'>方法</b>

    一種無透鏡成像的新方法

    透鏡成像形式,它使用掃描光束收集散射光進行圖像重建,面臨著周期性樣品的挑戰。為了研究微電子或光子元件中的納米級圖案,一種基于無透鏡成像的新方法可以實現近乎完美的高分辨率顯微鏡。這在波長短于紫外線時尤為重要,其成像空間分辨率高于
    的頭像 發表于 07-19 06:20 ?695次閱讀
    <b class='flag-5'>一種</b>無透鏡成像的新<b class='flag-5'>方法</b>

    機器學習中的交叉驗證方法

    在機器學習中,交叉驗證(Cross-Validation)是一種重要的評估方法,它通過將數據集分割成多個部分來評估模型的性能,從而避免過擬合或欠擬合問題,并幫助選擇最優的超參數。本文將詳細探討幾種
    的頭像 發表于 07-10 16:08 ?2616次閱讀

    地下金屬電纜故障定位儀的管線探測方法——每日了解電力知識

    法和夾鉗法三信號施加模式,適合不同場合需要。 2、 接收機功能: 用于對地下電纜的位置、走向、埋深及電流測量。 3、左右定位箭頭指示目標管線位置,定位快速、精確;前后箭頭和dB值指示
    的頭像 發表于 07-08 09:04 ?1085次閱讀
    地下金屬電纜故障<b class='flag-5'>定位</b>儀的管線探測<b class='flag-5'>方法</b>——每日了解電力知識