女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一個集檢測與檢索與一身的作品

gVTR_Unf ? 來源:AI人工智能初學者 ? 作者:ChaucerG ? 2020-09-28 16:09 ? 次閱讀

本文轉載自 AI人工智能初學者,作者ChaucerG

傳統的目標檢索任務旨在學習具有內部相似度和內部相異度的區分特征表示,它假設圖像中的對象是手動或自動精確裁剪的。但是,在許多現實世界中的搜索場景(例如,視頻監視)中,很少準確地檢測或標注對象(例如,人、車輛等)。因此,在沒有邊界框注釋的情況下,物體級檢索變得很棘手,這導致了一個新的但具有挑戰性的主題,即圖像搜索。

1、簡介

行人搜索是圖像搜索問題的第一個嘗試。在此之前,雖然對人的檢測和重識別做了大量的努力,但大多數都是獨立處理這兩個問題的。也就是說,傳統方法將行人搜索任務劃分為兩個獨立的子任務。

首先,利用行人檢測器從圖像中預測人物的邊界盒,然后根據預測的邊界盒的坐標對被檢測人物的矩形區域進行裁剪。其次,提取檢測框內行人的特征用于重新識別人物。

在一般的行人重識別(Re-ID)任務中,對行人圖像進行人工注釋和裁剪,然后用于訓練的鑒別特征表示網絡。一方面是因為在真實的視頻監控任務中,大多數檢測器不可避免地會出現誤檢和框選不準的情況,在一定程度上可能會導致ReID精度的性能顯著下降。另一方面,這兩個獨立的子任務似乎對實際應用程序中的最終Re-ID不太友好。

圖1 傳統ReID+檢索的過程和本文所提方法的對比圖

在本文中,為了解決圖像搜索問題,我們首先介紹一個端到端集成網(I-Net),它具有三個優點:

1)通過設計Siamese架構來進行在線匹配相似和不相似樣本對。

2)引入了新穎的在線配對(OLP)損失和動態特征字典,該字典通過自動生成多個負數對來限制正數,從而減輕了多任務訓練停滯問題。

3)提出了一種Hard example priority(HEP)的softmax損失,以通過選擇Hard類別來提高分類任務的魯棒性。

借助分而治之的理念,文章進一步提出了一種改進的I-Net,稱為DC-I-Net,它做出了兩個新的貢獻:

1)量身定制了兩個模塊以在集成框架中分別處理不同的任務,從而使任務規格得到保證。

2)提出了通過利用memory的類中心進行類中心指導的HEP Loss(),從而可以捕獲內部相似度和內部相似度以進行最終檢索。

在著名的面向圖像級搜索的基準數據集上的大量實驗表明,所提出的DC-I-Net優于最新的tasks-integrated和tasks-separated的圖像搜索模型。

2、本文方法

這篇論文是I-Net的一個實質性擴展,在網絡架構和損失函數方面做出了以下新貢獻:

2.1、I-Net

為了實現更好的圖像搜索任務,I-Net(Siamese I-Net)將行人檢測和行人重識別設計為端到端(End-to-End)的框架,如下圖:

對于每一次迭代,包含相同身份id的圖像對將被輸入到Siamese I-Net中。利用骨干網絡進行初步特征的提取。然后,通過兩個RPN結構得到候選區域。再然后將這些候選區域特征輸入到ROIPooling中并輸出的特征圖,最后是兩個全連接層分別用于檢測任務和檢索檢索(即ReID)任務。同時該結構的提出的同時也提出了兩個損失函數,即OLP Loss和HEPLoss,用于學習與ReID相關的有效特征。

通過兩個RPN生成的候選區域,ROI池化層被集成到I-Net中。然后,兩個Stream匯集的特征被輸入到有4096個神經元的兩個FC中。為了消除行人候選區域的假陽性使用二值交叉熵損失區分訓練。(注意,對于一般的圖像搜索任務都會使用softmax分類器來進行目標檢測);除此之外L1損失用來約束候選框的位置,同時會有一對256-D的特征用通過OLP Loss和HEP Loss來訓練ReID Branch的模型。

2.2、On-line Pairing Loss (OLP Loss)

設計OLP損失函數主要從以下幾個角度考慮的:

1 減小類內差距、增加類間差距

2 由于輸入的圖像數量不足,且每幅圖像中目標的鎖定,容易出現容易對多而身份少的情況,會導致傳統度量損失(如Triplet Loss)的停滯問題,嚴重阻礙了模型的有效訓練。

OLP Loss的設計形式如下:

OLP損失可以按照如下步驟進行復現:

1.收集兩幅相同身份輸入圖像的特性,并構造成正樣本對。

2.為每個正樣本對特征中的和被設置為Anchor。負樣本特征存儲在特征字典中,與Anchor對配對,構建負樣本對。

3.計算OLP損失,然后計算OLP梯度,進行梯度反向傳播優化。

4.存儲輸入的特征,逐步更新特征字典。

2.3、Hard Example Priority Loss (HEP Loss)

OLP損失函數使正樣本對的余弦距離更小,負樣本對的余弦距離更大,這并不能直接對損失函數中的id標簽進行回歸。另外,傳統的基于softmax的分類器交叉損失訓練方法沒有考慮樣本在數據中的難易程度。基于上述考慮,提出了HEP Loss,目的是回歸具有高優先級的身份標簽。

在圖4中,Hard Example的選擇如下:

首先確定每個有身份的輸入圖像對的標簽索引,以確保groundtruth類。

對于每個子組,將距離最大的最上面r個負樣本的標簽索引存儲在優先級類池P中,使難例的優先級類得到集中。

如果池P的大小仍然小于預設的T,便隨機選擇幾個類填充池。

最后,利用傳統的基于softmax的交叉熵損失和選擇的優先級類,將提出的HEP損失函數表示為:

其中,表示分類器給出的第i個proposal的分數,j表示第j個類。在損失函數中,只使用選定的類別進行損失計算,進而使得損失函數集中在硬類別上。

2.4、Overall Loss of I-Net

I-Net是一種將檢測和重識別結合起來進行訓練的端到端模型。因此損失由兩部分組成:檢測損失()和重識別損失(和),表示如下:

2.5、DC-I-NET

相較于I-Net,DC-I-NET:

1.通過使用來自不同層的特征,很好地考慮了檢測和重新識別的任務專注度;

2.利用ROI-Align模塊生成2級檢測器來提取refined目標以用于訓練度量損失;

3.提出了class-center引導困難樣本優先的()損失,用于訓練的id的分類損失。

Detector:在DC-I-Net中,檢測任務和行人重識別任務的特征是從不同網絡層次中提取的。經過分類損失和回歸損失監督的兩階段檢測,完成準確Bounding Boxes(即目標行人)的檢測。

Re-identifier:經過兩階段檢測后,將refined bounding Boxes的坐標輸入ROIAlign層,計算refined目標建議的特征,用于行人重識別。對于ReID任務,匯集的feature map的大小為7x14,其寬高比與person的邊框相似。然后將特征圖輸入全連通層,學習用于行人重識別的特征向量表示。最后,通過全連通層生成目標方案的256-D的經過L2歸一化后特征,并將其輸入到和中進行重識別模塊的訓練。

損失函數定義如下:

DC-I-Net總損失為:

3、實驗結果

原文標題:【檢測+檢索】一個模型讓你不僅看得見也可以找得到,集檢測與檢索與一身的作品

文章出處:【微信公眾號:機器視覺CV】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像采集
    +關注

    關注

    2

    文章

    306

    瀏覽量

    41564
  • AI
    AI
    +關注

    關注

    87

    文章

    34146

    瀏覽量

    275309

原文標題:【檢測+檢索】一個模型讓你不僅看得見也可以找得到,集檢測與檢索與一身的作品

文章出處:【微信號:Unfinished_coder,微信公眾號:機器視覺CV】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    芯盾時代助力中建科技統一身份認證項目圓滿結項

    近日,芯盾時代承建的中建科技集團有限公司(簡稱“中建科技”)統一身份認證期項目已圓滿結項,并成功進入二期建設階段。 自項目啟動以來,芯盾時代憑借其專業的技術實力和豐富的項目經驗,為中建科技量身定制
    的頭像 發表于 01-07 15:02 ?452次閱讀

    芯盾時代繼續深化中建科技統一身份認證平臺建設

    芯盾時代承建的中建科技集團有限公司(簡稱“中建科技”)統一身份認證期項目圓滿結項,目前平臺運行情況良好,獲得客戶的高度認可。目前雙方已開展二期建設,芯盾時代將持續優化中建科技統一身份認證平臺。
    的頭像 發表于 01-07 11:23 ?504次閱讀

    【「具智能機器人系統」閱讀體驗】2.具智能機器人的基礎模塊

    目前高速發展的大模型能給具智能帶來些突破性的進展。 對于感知系統,要做的主要任務是物體檢測,語義分割,立體視覺,鳥瞰視角感知。 有很多算法都可以實現物體檢測,比如文章提到的HOG
    發表于 01-04 19:22

    十堰新批智慧路燈投用,多種功能于一身 智慧路燈案例分享

    十堰新批智慧路燈投用,多種功能于一身 智慧路燈案例分享
    的頭像 發表于 01-03 10:39 ?301次閱讀
    十堰新<b class='flag-5'>一</b>批智慧路燈投用,<b class='flag-5'>集</b>多種功能于<b class='flag-5'>一身</b> 智慧路燈案例分享

    【「具智能機器人系統」閱讀體驗】1.初步理解具智能

    的各個方面。 第5部分(第14章)通過實際案例的應用研究對本書提到的概念進行總結,作者實際構建了智能機器人計算系統,用于室內倉儲
    發表于 12-28 21:12

    【「具智能機器人系統」閱讀體驗】1.全書概覽與第章學習

    講解如何構造具智能基礎模型的方法和步驟,包括數據采集、預處理、模型訓練和評估等。 在第四部分,介紹了具智能機器人的計算挑戰,包括計算加速、算法安全性和系統可靠性等內容。 最后,在第五部分介紹了
    發表于 12-27 14:50

    【「具智能機器人系統」閱讀體驗】+初品的體驗

    Intelligence,EAI)是多學科技術與理論于體的研究領域,旨在探討智能如何在智能體與其環境的互動中展現。 與傳統的人工智能不同,具
    發表于 12-20 19:17

    ADS1230本的data ready信號是100ms周期,為什么中間會有段不是100ms為周期?

    圖中綠色的是dout波形,黃色為sclk波形 1.ADS1230本的data ready信號是100ms周期,為什么中間會有段不是100ms為周期,即畫紅線部分的data r
    發表于 12-20 07:18

    性能與成本于一身的IMU,讓無人機飛行更穩定

    無人機在進行任何形式的飛行時,必須了解空中平臺的方向、其運動的性質以及飛行方向。通常用于測量此運動的是IMU,IMU提供與無人機三軸向的加速度和角速度數據,以及有關無人機在橫滾、俯仰和偏航方面的測量數據。常見應用包括控制和穩定、制導和校正、測量和測試。
    的頭像 發表于 12-19 15:45 ?842次閱讀
    <b class='flag-5'>集</b>性能與成本于<b class='flag-5'>一身</b>的IMU,讓無人機飛行更穩定

    手持多參數速測記錄儀:多種測量功能于

    速測記錄儀的顯著特點便是能夠多種測量功能于一身,廣泛涵蓋了眾多關鍵參數的檢測。在水質分析領域,它可以精確測量酸堿度(pH),實時反映水體的酸堿性程度,這對于判斷水質是否適宜水生生物生存以及評估水體受污染狀況至
    的頭像 發表于 12-17 11:13 ?375次閱讀

    醫療電子血壓檢測儀的語音芯片應該怎么挑選才最合適

    語音芯片在醫療血壓儀中關鍵,挑選需考慮性能、功耗、集成性、合規性、語音質量、可擴展性及售后。NV400F芯片優點于一身,確保清晰播報、穩定工作、低功耗及合規安全,是醫療血壓儀的理想選擇。
    的頭像 發表于 12-09 11:42 ?366次閱讀

    名單公布!【書籍評測活動NO.51】具智能機器人系統 | 了解AI的下一個浪潮!

    Intelligence,EAI)是多學科技術與理論于體的研究領域,旨在探討智能如何在智能體與其環境的互動中展現。 與傳統的人工智能不同,具
    發表于 11-11 10:20

    天合光能榮獲日本G-mark設計獎

    近日,天合光能至尊N型小金剛黑色透明組件,經多國評委兩輪評審,于全球五千余作品的激烈角逐中,憑借其獨特設計與卓越性能脫穎而出,榮獲日本G-mark設計獎(Good Design Award),至今,已成為德國設計獎、國IDE
    的頭像 發表于 10-18 13:57 ?726次閱讀

    什么是超聲波體氣象儀?

    超聲波體式氣象儀是將多種氣象測量功能集成于體且基于超聲波技術的儀器。它超聲波風速風向測量功能于一身,同時可能還集成了溫度、濕度、氣壓等其他氣象參數的測量模塊。其主要特點有:高度集
    的頭像 發表于 09-18 10:52 ?444次閱讀
    什么是超聲波<b class='flag-5'>一</b>體氣象儀?

    軟件系統的數據檢索設計

    軟件系統的數據檢索設計 隨著業務量加大,數據檢索量也會日益增多,為了減輕數據庫壓力,本系統采用ElasticSearch來實現數據檢索功能。 簡單來說,Elasticsearch 是
    的頭像 發表于 08-22 14:08 ?440次閱讀
    軟件系統的數據<b class='flag-5'>檢索</b>設計