女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

計算機視覺任務里常常會碰到類別不平衡的問題

新機器視覺 ? 來源:機器學習AI算法工程 ? 作者:機器學習AI算法工 ? 2022-06-13 11:14 ? 次閱讀

計算機視覺(CV)任務里常常會碰到類別不平衡的問題, 例如:

1. 圖片分類任務,有的類別圖片多,有的類別圖片少

2. 檢測任務。現在的檢測方法如SSD和RCNN系列,都使用anchor機制。訓練時正負anchor的比例很懸殊。

3. 分割任務, 背景像素數量通常遠大于前景像素。

從實質上來講, 它們可以歸類成分類問題中的類別不平衡問題:對圖片/anchor/像素的分類。

再者,除了類不平衡問題, 還有easy sample overwhelming的問題。easy sample如果太多,可能會將有效梯度稀釋掉。

這兩個問題通常都會一起出現。如果不處理, 可能會對模型性能造成很大傷害。用Focal Loss里的話說,就是訓練不給力, 且會造成模型退化:

(1) training is inefficient as most locations are easy negatives…

(2) the easy negatives can overwhelming training and lead to degenerate models.

如果要處理,那么該怎么處理呢?在CV領域里, 若不考慮修改模型本身, 通常會在loss上做文章, 確切地說,是在樣本選擇或loss weight上做文章。

常見的解決辦法介紹

常見的方法有online的, 也有非online的;有只處理類間不平衡的,有只處理easy example的, 也有同時處理兩者的。

Hard Negative Mining, 非online的mining/boosting方法, 以‘古老’的RCNN(2014)為代表, 但在CV里現在應該沒有人使用了(吧?)。若感興趣,推薦去看看OHEM論文里的related work部分。

Mini-batch Sampling,以Fast R-CNN(2015)和Faster R-CNN(2016)為代表。Fast RCNN在訓練分類器, Faster R-CNN在訓練RPN時,都會從N = 1或2張圖片上隨機選取mini_batch_size/2個RoI或anchor, 使用正負樣本的比例為1:1。若正樣本數量不足就用負樣本填充。使用這種方法的人應該也很少了。從這個方法開始, 包括后面列出的都是online的方法。

Online Hard Example Mining, OHEM(2016)。將所有sample根據當前loss排序,選出loss最大的N個,其余的拋棄。這個方法就只處理了easy sample的問題。

Oline Hard Negative Mining, OHNM, SSD(2016)里使用的一個OHEM變種, 在Focal Loss里代號為OHEM 1:3。在計算loss時, 使用所有的positive anchor, 使用OHEM選擇3倍于positive anchor的negative anchor。同時考慮了類間平衡與easy sample。

Class Balanced Loss。計算loss時,正負樣本上的loss分別計算, 然后通過權重來平衡兩者。暫時沒找到是在哪提出來的,反正就這么被用起來了。它只考慮了類間平衡。

Focal Loss(2017), 最近提出來的。不會像OHEM那樣拋棄一部分樣本, 而是和Class Balance一樣考慮了每個樣本, 不同的是難易樣本上的loss權重是根據樣本難度計算出來的。

從更廣義的角度來看,這些方法都是在計算loss時通過給樣本加權重來解決不平衡與easy example的問題。不同的是,OHEM使用了hard weight(只有0或1),而Focal Loss使用了soft weight(0到1之間)。

現在依然常用的方法特性比較如下:

458cebe2-ea59-11ec-ba43-dac502259ad0.png

接下來, 通過修改過的Cifar數據集來比較這幾種方法在分類任務上的表現,當然, 主要還是期待Focal Loss的表現。

實驗數據

實驗數據集

Cifar-10, Cifar-100。使用Cifar的原因沒有別的, 就因為窮,畢竟要像Focal Loss論文里那樣跑那么多的大實驗對大部分學校和企業來說是不現實的。

處理數據得到類間不平衡

將多分類任務轉換成二分類:

new_label = label == 1

原始Cifar-10和100里有很多類別,每類圖片的數量基本一樣。按照這種方式轉變后,多分類變成了二分類, 且正負樣本比例相差懸殊:9倍和99倍。

實驗模型

一個5層的CNN,完成一個不平衡的二分類任務。使用Cross Entropy Loss,按照不同的方法使用不同的權值方案。以不加任何權重的CE Loss作為baseline。

衡量方式

在這種不平衡的二分類問題里, 準確率已經不適合用來衡量模型的好與壞了。此處使用F-Score作標準。

實現細節

CE(Cross Entroy Loss)

45ba2f1c-ea59-11ec-ba43-dac502259ad0.png

OHEM

分為以下三步:

1. 計算ce_loss, 同CE

2. 根據ce_loss排序, 選出top N 個sample:

45f341c6-ea59-11ec-ba43-dac502259ad0.png

4656a9a0-ea59-11ec-ba43-dac502259ad0.png

Class Balance CE

形式多種多樣,我個人最喜歡使用:

4692d3a8-ea59-11ec-ba43-dac502259ad0.png

46c6a868-ea59-11ec-ba43-dac502259ad0.png

46f254d6-ea59-11ec-ba43-dac502259ad0.png

優化方法

最簡單的SGD, 初始lr=0.1, 每200,000步衰減一次, 衰減系數為0.1。Cifar-100上focal_loss的初始lr=0.01。

batch_size = 128.

實驗結果

CIFAR-10:

473441d4-ea59-11ec-ba43-dac502259ad0.png

47621ea6-ea59-11ec-ba43-dac502259ad0.png

Focal Loss的一個補丁

對于CIFAR-100,batch_size=128時, 一個batch內可能會一個positive sample都沒有, 即n_pos == 0, 這時,paper里用n_pos來normalize loss 的方式就不可行了。測試過兩種簡單的選擇:一是用所有weight之和來normalize, 二是直接不normalize。前者很難訓練甚至訓練不出來, 后者可用。所以上面的Focal loss計算代碼應該補充為:

478de338-ea59-11ec-ba43-dac502259ad0.png

經驗總結

47e05fc8-ea59-11ec-ba43-dac502259ad0.png

Code Available On Github

https://github.com/dengdan/test_tf_models

Branch:focal_loss

References Focal Loss for Dense Object Detection, https://arxiv.org/pdf/1708.02002.pdf

RCNN, https://arxiv.org/abs/1311.2524

Fast RCNN, http://arxiv.org/abs/1504.08083

Faster-RCNN, http://arxiv.org/abs/1506.01497

Training Region-based Object Detectors with Online Hard Example Mining, https://arxiv.org/abs/1604.03540

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • CV
    CV
    +關注

    關注

    0

    文章

    53

    瀏覽量

    17061
  • 計算機視覺
    +關注

    關注

    9

    文章

    1706

    瀏覽量

    46563
  • 檢測方法
    +關注

    關注

    0

    文章

    50

    瀏覽量

    9930

原文標題:視覺分類任務中處理不平衡問題的loss比較

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    B0430J50100AHF超小型不平衡平衡變壓器

    B0430J50100AHF超小型不平衡平衡變壓器B0430J50100AHF是Anaren推出的一款超小型、低成本且低輪廓的不平衡平衡變壓器,專為滿足新一代A/D和D/A轉換器I
    發表于 02-08 09:26

    平衡電阻器可以改為不平衡

    在電子電路中,平衡電阻器與不平衡電阻器各自扮演著重要的角色。平衡電阻器主要用于實現電路的平衡和穩定性,減少噪音和干擾,提高信號質量。而不平衡
    的頭像 發表于 01-30 14:31 ?1037次閱讀

    電容器不平衡保護動作原因分析

    電容器不平衡保護動作的原因多種多樣,主要包括以下幾個方面: 1. 電容器組內部故障 電容量不平衡 :電容器組中的電容器由于老化、損壞或制造差異,可能導致三相電容量不平衡。當三相之間電容值差異較大
    的頭像 發表于 09-20 15:43 ?2307次閱讀

    LCR測試儀如何測量不平衡度?

    在電路設計和維修中,了解電路元件的特性是非常重要的。LCR測試儀就是一種常用的檢測儀器,它可以測量電感(L)、電容(C)和電阻(R)的參數。其中,測量不平衡度是LCR測試儀的一項重要功能。那么
    的頭像 發表于 08-26 16:49 ?874次閱讀
    LCR測試儀如何測量<b class='flag-5'>不平衡</b>度?

    三相電流不平衡對電壓影響大嗎

    在現代電力系統中,三相交流電是最常見的供電方式。三相電流平衡是保證電力系統穩定運行的關鍵因素之一。然而,由于多種原因,三相電流可能會出現不平衡現象,這對電力系統的電壓穩定性和設備的正常運行
    的頭像 發表于 07-25 16:28 ?2369次閱讀

    不平衡電流和零序電流的區別是什么

    在電力系統中,電流的平衡不平衡是影響電力系統穩定性和安全性的重要因素。不平衡電流和零序電流是兩種常見的電流類型,它們在電力系統中扮演著不同的角色。 一、定義 不平衡電流 是指三相電力
    的頭像 發表于 07-25 16:24 ?3501次閱讀

    機器視覺計算機視覺有什么區別

    。機器視覺的研究目標是讓機器具有類似人類的視覺能力,能夠自動、準確地完成各種視覺任務計算機視覺
    的頭像 發表于 07-16 10:23 ?974次閱讀

    計算機視覺與人工智能的關系是什么

    引言 計算機視覺是一門研究如何使計算機能夠理解和解釋視覺信息的學科。它涉及到圖像處理、模式識別、機器學習等多個領域的知識。人工智能則是研究如何使計算
    的頭像 發表于 07-09 09:25 ?1174次閱讀

    計算機視覺和機器視覺區別在哪

    計算機視覺和機器視覺是兩個密切相關但又有明顯區別的領域。 一、定義 計算機視覺 計算機
    的頭像 發表于 07-09 09:22 ?784次閱讀

    計算機視覺屬于人工智能嗎

    屬于,計算機視覺是人工智能領域的一個重要分支。 引言 計算機視覺是一門研究如何使計算機具有視覺
    的頭像 發表于 07-09 09:11 ?1960次閱讀

    計算機視覺怎么給圖像分類

    圖像分類是計算機視覺領域中的一項核心任務,其目標是將輸入的圖像自動分配到預定義的類別集合中。這一過程涉及圖像的特征提取、特征表示以及分類器的設計與訓練。隨著深度學習技術的飛速發展,圖像
    的頭像 發表于 07-08 17:06 ?1530次閱讀

    軟啟動三相不平衡的解決辦法有哪些

    軟啟動三相不平衡是指在軟啟動過程中,三相電動機的電流不平衡,導致電動機的運行效率降低,甚至可能引發電動機的損壞。針對這個問題,我們可以從多個方面進行解決。 一、軟啟動三相不平衡的原因分析 電源電壓
    的頭像 發表于 07-02 09:40 ?4785次閱讀

    深度學習在計算機視覺領域的應用

    深度學習技術的引入,極大地推動了計算機視覺領域的發展,使其能夠處理更加復雜和多樣化的視覺任務。本文將詳細介紹深度學習在計算機
    的頭像 發表于 07-01 11:38 ?1528次閱讀

    軟啟動報三相電流不平衡怎么處理

    軟啟動器是一種用于電動機啟動的電氣設備,它可以有效地降低電動機啟動時的電流沖擊,減少對電網和電動機的影響。然而,在實際應用中,軟啟動器有時會出現三相電流不平衡的問題,這會對電動機的正常運行和軟啟動
    的頭像 發表于 06-18 11:44 ?6584次閱讀

    計算機視覺的主要研究方向

    計算機視覺(Computer Vision, CV)作為人工智能領域的一個重要分支,致力于使計算機能夠像人眼一樣理解和解釋圖像和視頻中的信息。隨著深度學習、大數據等技術的快速發展,計算機
    的頭像 發表于 06-06 17:17 ?1650次閱讀