女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

利用無標簽數據提升人臉識別性能

電子設計 ? 來源:電子設計 ? 作者:電子設計 ? 2020-12-10 20:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人臉識別也許是最成功也最先到達瓶頸的深度學習應用。在go deeper, more data,higher performance的思想指導下,模型更深了,數據卻越來越難增加。
本文首發知乎

[注]:本文約5000字,閱讀時間約12分鐘。文章盡量使用中文,但有些專有名詞翻譯成中文顯得詞不達意,因此也用括號標注了英文。

人臉識別也許是最成功也最先到達瓶頸的深度學習應用。在go deeper, more data,higher performance的思想指導下,模型更深了,數據卻越來越難增加。目前在人臉的公開數據集標到了百萬級別,人臉識別百萬里挑一的正確率達到99.9%(MegaFace benchmark)之后,發現再也標不動了。標注員能標出來的數據永遠是簡單樣本,而人臉識別模型是個深淵,當你凝視深淵的時候,深淵并不想看到你。

深淵想看到這樣的數據,并且明確被告知不是同一個人:

以及這樣的數據,并且明確被告知是同一個人:

在把標注員弄瘋之前,不如先讓模型自己去猜一猜,說不定就猜對了呢?這其實就是半監督學習的思路。利用已有的模型對無標簽數據做某種預測,將預測結果用來幫助模型訓練。這種自我增強(self-enhanced)的學習方式,雖然看起來有漂移(drift)的風險,但實際用起來還挺好用 [5]。對于閉集(close-set)的問題,也就是所有數據都屬于一個已知的類別集合(例如ImageNet, CIFAR等),只需要模型能通過各種方法,例如標簽傳播(label propagation)等,預測出無標簽數據的標簽,再把它們加入訓練即可。

然而問題來了,人臉識別是一個開集(open-set)的問題。

例如,人臉比對(verification)、人臉鑒定(identification)等任務中,測試樣本的身份(identity)通常沒有在訓練樣本中出現過,測試過程通常是提取人臉特征進行比對,而非直接通過網絡推理得到標簽。同樣,對于無標注數據,在采集的過程中,人臉的身份也是未知的。可能有標注的數據的人臉屬于10萬個人,而新來的無標注數據屬于另外10萬個人,這樣一來就無法通過預測標簽的方式把這些數據利用起來。而聚類不同于半監督學習,只需要知道樣本的特征描述(feature)和樣本之間的相似度度量標準(metric)就可以做聚類。聚完類之后再給每個類分配新的標簽,同樣可以用來幫助提升人臉模型。

人臉聚類方法

傳統的人臉聚類一般采用LBP、HOG之類的手動設計的特征,因為這類特征過于過時,不在我們討論的范疇。而深度學習時代的人臉聚類,一般采用卷積神經網絡(CNN)中提取出來的特征 [4]。人臉識別的CNN通常把人臉圖片映射(embedding)到一個高維的向量,然后使用一個線性分類器,加Softmax激活函數和交叉熵損失(Cross Entropy Loss)來訓練。

紫色的向量即為人臉特征(圖片來自 [3])

這種方式決定了這些經過映射(embedding)后的人臉在特征空間里分布在不同的錐形(Cone)中(下左圖),因而可以使用余弦相似度(Cosine Similarity)來度量相似度。或者如果對人臉特征做二范數(L2)歸一化,那么人臉特征則會分布在一個球面上(下右圖),這樣可以使用L2距離來度量。


圖示為2維,實際在高維空間(圖片來自 [6])

有了特征和度量標準之后,就可以考慮如何選擇一個聚類算法了。現成的聚類算法包括K-Means, Spectral, DBSCAN, Hierarchical Agglomerative Clustering (HAC), Rank Order等以及它們的變種。利用這些方法聚類之后,將每一類中的樣本分配相同的標簽,不同的類分配不同的標簽,就可以用來充當訓練集了。

到此為止,似乎已經可以順利地完成這個任務了。然而

使用20萬張圖提取特征之后來測試一下這些聚類算法,K-Means花了10分鐘,HAC花了5.7小時,DBSCAN花了6.9小時, Spectral花了12小時。若使用60萬張圖片提取的特征來做聚類,K-Means超內存了,HAC花了61小時,DBSCAN花了80小時,Spectral跑到天荒地老之后也甩了一句超內存。當圖片數量增加到140萬的時候,幾乎所有的聚類算法都掛了。

K-Means, Spectral, HAC等傳統聚類方法的問題主要在于以下方面:

(a) 聚類算法具有較高的時間復雜度。例如,K-Means是O(NKT),Spectral是O(N^3),HAC是O(N^2)。

(b) 通常認為數據分布服從某些簡單的假設。例如,K-Means假設數據類內具有球狀的分布 [2],并且每一類具有相同的方差(variance),以及不同的類具有相同的先驗概率。然而對于大規模人臉聚類,無標注數據通常來源于開放的場景(in-the-wild),數據內部的結構比較復雜,難以一致地服從這些假設。例如,我們期望數據長這樣(如下左圖):

(c) 通常使用某種特定的metric。例如上述提及的Cosine Similarity和L2距離。同樣,對于復雜的數據結構,衡量兩個樣本是否屬于同一類,單純靠樣本之間的局部相似度是不夠的,這個metric需要融合更多信息。

(d) 缺乏較好的離群值(outliers)控制機制。outliers來源于人臉識別模型對難樣本的embedding誤差,以及觀測到的數據不完整。盡管部分聚類算法例如DBSCAN理論上對outliers魯棒,但從其實際表現來講這個問題遠沒有得到解決。

有監督的metric

終于可以說說自己的工作了。我們被ECCV2018接收的一篇論文(Consensus-Driven Propagation in Massive Unlabeled Data for Face Recognition),簡稱CDP [1],嘗試解決上述這些問題中的一部分。我們提出了一種有監督的metric用于人臉聚類,來部分解決無標注數據內部結構復雜、依賴特定metric、缺乏outlier控制的問題,順便還解決了一下時間復雜度的問題(CDP做到了線性復雜度),當然性能也提升了一大截。

介紹方法之前我們先來介紹一下affinity graph。Graph在半監督學習和聚類上經常出現。Affinity graph的節點是數據樣本,邊代表數據之間的相似度。一種常見的affinity graph是KNN graph,即對所有樣本搜索K近鄰之后將樣本與其近鄰連接起來得到。我們的方法CDP基于KNN graph來構建數據的結構。

CDP本質是學習一個metric,也就是對樣本對(pairs)進行判斷。如下圖,CDP首先使用多個人臉識別模型構建成一個委員會(committee), committee中每個成員對基礎模型中相連的pairs提供包括關系(是否是neighbor)、相似度、局部結構等信息,然后使用一個多層感知機(MLP)來整合這些信息并作出預測(即這個pair是否是同一個人)。這個過程可以類比成一個投票的過程,committee負責考察一個候選人(pair)的各方面信息,將信息匯總給MLP進行決定。最后將所有的positive pairs組成一個新的graph稱為consensus-driven graph。在此graph上使用簡單的連通域搜索并動態剪枝即可快速得到聚類。由于MLP需要使用一部分有標簽的數據來訓練得到,所以CDP是一種基于有監督的metric的聚類方法。方法的更多細節可以參考我們的論文和代碼,并歡迎討論。另外感謝“我愛計算機視覺”公眾號對本文的解讀。


CDP框架

接下來就是激fei動chang人wu心liao的結果分析了。

在復雜度上,CDP由于只需要探索局部結構,因此除了knn搜索之外,聚類部分的復雜度是接近線性的。在20萬數據上,不計入knn搜索(依賴別的庫)的時間的話,CDP單模型的耗時是7.7秒,多模型的耗時是100秒。在140萬數據上,CDP單模型的耗時是48秒,多模型的耗時是585秒。試驗結果上看時間復雜度甚至低于線性(小于7倍)。

在聚類結果上,例如對20萬數據聚類,即使使用單模型也達到了89%的fscore,多模型可以達到95.8%,強于大部分傳統聚類算法。各種聚類算法運行時間和性能測試見GitHub。

我們的實驗中使用CDP聚類后的數據加入人臉識別模型的訓練之后,可以讓模型達到接近全監督(使用ground truth標簽)的結果。如下圖所示:

在兩個測試集(benchmark)上,隨著數據的增多,用CDP聚類結果訓練的人臉模型性能的增長接近全監督模型(所有數據都使用ground truth標注)。有趣的是在IJB-A上我們的結果超過了全監督模型,原因可能是訓練集的ground truth標簽會有一些噪聲(noise),例如誤標注,導致全監督模型在IJB-A的某些測試樣例上表現不佳。

下圖是切換不同的CNN模型結構后的結果:

聚類后的部分結果如下圖所示:

每一組代表聚完類后屬于同一類

我們發現CDP還可以用來做數據和標簽清理(denoise)。例如一個標注好的數據集可能有一些標錯的樣本,或者非常低質量的圖片,可以使用CDP來找到這些圖并舍棄。如下圖:

每一組人臉在原始標注中屬于同一個人,左上角數字是CDP分配的標簽,紅框中的樣本為CDP丟棄的樣本,包括:1. 被錯誤標注進該類,實際是一個孤立點的樣本。2. 低質量圖片,包括過度模糊、卡通等。

在這篇工作中我們發現,基于學習的metric能基于更多的有效信息進行判斷,會比手動設計的metric更擅長解決比較復雜的數據分布。另外,這種類似多模型的投票的方式在魯棒性上帶來了很大提升,這樣可以從無標簽數據中發掘出更多的難樣本。

代碼鏈接:https://github.com/XiaohangZhan/cdp,歡迎watch/star/fork以及交流。

有監督的聚類算法

CDP屬于一種自下而上(bottom up)的方法,因此只能感知局部的數據結構。然而感知全局的數據結構對于聚類更為重要,為此,我們最近提出了一種自上而下(top down)的有監督聚類方法,能自動學習根據數據的結構進行聚類,更加充分地解決上述傳統聚類的問題,不過暫時需要保密。有興趣的朋友可以持續關注我們的專欄:MMLab學術視野,也可以順便關注一下我個人的知乎賬號“Xiaohang Zhan”。

審核編輯 黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1806

    文章

    49011

    瀏覽量

    249343
  • 人臉識別
    +關注

    關注

    77

    文章

    4081

    瀏覽量

    84246
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    【EASY EAI Orin Nano開發板試用體驗】人臉識別提升

    人臉識別,可以通過兩張圖片進行對比,來實現人臉識別功能。這一篇,我將分享如何將提取出來的人臉特征進行保存,一來以
    發表于 07-05 15:21

    人臉識別讓會議簽到效率翻倍

    隱患。如何讓簽到環節既高效感,又能精準管控?四維互聯旗下品牌“四維慧眼人臉識別攝像機”,正在為智慧會議室帶來一場“接觸式效率革命”。
    的頭像 發表于 07-04 16:42 ?146次閱讀

    基于LockAI視覺識別模塊:C++人臉識別

    是實現人臉識別的常用方法: 深度學習方法:現代的人臉識別系統大多采用深度學習方法,并結合大規模人臉數據
    發表于 07-01 12:01

    基于LockAI視覺識別模塊:C++人臉識別

    本文基于RV1106做成的LockAI視覺識別模塊,采用LZ-Picodet模型訓練的人臉檢測模型LZ-Face,以及ArcFace人臉識別模型,實現
    的頭像 發表于 07-01 10:09 ?158次閱讀
    基于LockAI視覺<b class='flag-5'>識別</b>模塊:C++<b class='flag-5'>人臉</b><b class='flag-5'>識別</b>

    房東必備神器:人臉識別門禁系統提升出租屋管理效率

    識別門禁終端、人臉識別門禁一體機、視頻門禁等智能設備,提升出租屋的管理水平和效率。那么,日租房、出租屋安裝視頻門禁終端有什么好處?首先,出租屋人臉
    的頭像 發表于 06-17 10:22 ?149次閱讀
    房東必備神器:<b class='flag-5'>人臉</b><b class='flag-5'>識別</b>門禁系統<b class='flag-5'>提升</b>出租屋管理效率

    CLRC663如何增強對RFID標簽ic的識別距離?

    我現在在使用clrc663通過ISO15693協議識別rifd標簽 ic無線圈(尺寸5*5mm),我現在的方案識別距離很短接近0時才能識別,我這邊需要將
    發表于 03-17 07:50

    安信可AI人臉識別方案

    作為神仙世界的高科技,"接觸式開鎖",人臉識別技術也被廣泛應用在現代生活中,安信可也有AI人臉識別方案!
    的頭像 發表于 02-25 14:39 ?428次閱讀
    安信可AI<b class='flag-5'>人臉</b><b class='flag-5'>識別</b>方案

    人臉識別技術的算法原理解析

    在數字化時代,人臉識別技術已經成為身份驗證和安全監控的重要手段。這項技術的核心在于算法,它們能夠從圖像中提取關鍵信息,并與數據庫中的信息進行匹配,以識別個體。 1.
    的頭像 發表于 02-06 17:50 ?1746次閱讀

    人臉識別技術的應用場景

    在數字化時代,安全和便捷性成為了人們日益關注的話題。人臉識別技術以其獨特的優勢,即無需物理接觸、快速識別和高準確率,成為了解決這些問題的關鍵技術之一。 1. 安全監控 1.1 公共安全 在公共安全
    的頭像 發表于 02-06 17:20 ?1590次閱讀

    人臉識別考勤解決方案:如何用科技實現考勤的感化、智能化

    帶來了革命性的變革,實現了考勤的感化、智能化。人臉識別考勤系統依托于先進的人工智能技術和人臉識別
    的頭像 發表于 01-15 15:24 ?989次閱讀
    <b class='flag-5'>無</b>感<b class='flag-5'>人臉</b><b class='flag-5'>識別</b>考勤解決方案:如何用科技實現考勤的<b class='flag-5'>無</b>感化、智能化

    校園人臉識別閘機通道的應用

    隨著科技的飛速發展,人臉識別技術正逐步滲透到我們生活的各個領域,其中,教育領域的應用尤為引人注目。在校園內,人臉識別閘機通道的安裝與啟用,不僅極大地
    的頭像 發表于 01-15 15:02 ?486次閱讀
    校園<b class='flag-5'>人臉</b><b class='flag-5'>識別</b>閘機通道的應用

    深度識別人臉識別有什么重要作用嗎

    深度學習人臉識別技術是人工智能領域的一個重要分支,它利用深度學習算法來識別和驗證個人身份。這項技術在多個領域都有廣泛的應用,包括但不限于安全監控、身份驗證、社交媒體、智能設備等。 1.
    的頭像 發表于 09-10 14:55 ?1135次閱讀