女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

關于多標簽學習的新趨勢

智能感知與物聯網技術研究所 ? 來源:通信信號處理研究所 ? 作者:通信信號處理研究 ? 2021-01-05 14:35 ? 次閱讀

這里大家帶來一篇武大劉威威老師、南理工沈肖波老師和 UTS Ivor W. Tsang 老師合作的 2020 年多標簽最新的 Survey,我也有幸參與其中,負責了一部分工作。

上半年在知乎上看到有朋友咨詢多標簽學習是否有新的 Survey,我搜索了一下,發現現有的多標簽 Survey 基本在 2014 年之前,主要有以下幾篇:

Tsoumakas 的《Multi-label classification: An overview》(2007)

周志華老師的《A review on multi-label learning algorithms》(2013)

一篇比較小眾的,Gibaja 《Multi‐label learning: a review of the state of the art and ongoing research》2014

時過境遷,從 2012 年起,AI 領域已經發生了翻天覆地的變化,Deep Learning 已經占據絕對的主導地位,我們面對的問題越來越復雜,CV 和 NLP 朝著各自的方向前行。模型越來越強,我們面對的任務的也越來越復雜,其中,我們越來越多地需要考慮高度結構化的輸出空間。多標簽學習,作為一個傳統的機器學習任務,近年來也擁抱變化,有了新的研究趨勢。因此,我們整理了近年多標簽學習在各大會議的工作,希望能夠為研究者們提供更具前瞻性的思考。

關于單標簽學習和多標簽學習的區別,這里簡單給個例子:傳統的圖片單標簽分類考慮識別一張圖片里的一個物體,例如 ImageNet、CIFAR10 等都是如此,但其實圖片里往往不會只有一個物體,大家隨手往自己的桌面拍一張照片,就會有多個物體,比如手機、電腦、筆、書籍等等。在這樣的情況下,單標簽學習的方法并不適用,因為輸出的標簽可能是結構化的、具有相關性的(比如鍵盤和鼠標經常同時出現),所以我們需要探索更強的多標簽學習算法來提升學習性能。

本文的主要內容有六大部分:

Extreme Multi-Label Classification

Multi-Label with Limited Supervision

Deep Multi-Label Classification

Online Multi-Label Classification

Statistical Multi-Label Learning

New Applications

接下去我們對這些部分進行簡單的介紹,更多細節大家也可以進一步閱讀 Survey 原文。另外,由于現在的論文迭代很快,我們無法完全 Cover 到每篇工作。我們的主旨是盡量保證收集的工作來自近年已發表和錄用的、高質量的期刊或會議,保證對當前工作的整體趨勢進行把握。如果讀者有任何想法和意見的話,也歡迎私信進行交流。 1. Extreme Multi-Label Learning (XML) 在文本分類,推薦系統,Wikipedia,Amazon 關鍵詞匹配 [1] 等等應用中,我們通常需要從非常巨大的標簽空間中召回標簽。比如,很多人會 po 自己的自拍到 FB、Ins 上,我們可能希望由此訓練一個分類器,自動識別誰出現在了某張圖片中。

對 XML 來說,首要的問題就是標簽空間、特征空間都可能非常巨大,例如 Manik Varma 大佬的主頁中給出的一些數據集[2],標簽空間的維度甚至遠高于特征維度。其次,由于如此巨大的標簽空間,可能存在較多的 Missing Label(下文會進一步闡述)。最后,標簽存在長尾分布[3],絕大部分標簽僅僅有少量樣本關聯?,F有的 XML 方法大致可以分為三類,分別為:Embedding Methods、Tree-Based Methods、One-vs-All Methods。近年來,也有很多文獻使用了深度學習技術解決 XML 問題,不過我們將會在 Section 4 再進行闡述。XML 的研究熱潮大概從 2014 年開始,Varma 大佬搭建了 XML 的 Repository 后,已經有越來越多的研究者開始關注,多年來 XML 相關的文章理論和實驗結果并重,值得更多的關注。

2. Multi-Label with Limited Supervision 相比于傳統學習問題,對多標簽數據的標注十分困難,更大的標簽空間帶來的是更高的標注成本。隨著我們面對的問題越來越復雜,樣本維度、數據量、標簽維度都會影響標注的成本。因此,近年多標簽的另一個趨勢是開始關注如何在有限的監督下構建更好的學習模型。本文將這些相關的領域主要分為三類: MLC with Missing Labels(MLML):多標簽問題中,標簽很可能是缺失的。例如,對 XML 問題來說,標注者根本不可能遍歷所有的標簽,因此標注者通常只會給出一個子集,而不是給出所有的監督信息。文獻中解決該問題的技術主要有基于圖的方法、基于標簽空間(或 Latent 標簽空間)Low-Rank 的方法、基于概率圖模型的方法。

Semi-Supervised MLC:MLML 考慮的是標簽維度的難度,但是我們知道從深度學習需要更多的數據,在樣本量上,多標簽學習有著和傳統 AI 相同的困難。半監督 MLC 的研究開展較早,主要技術和 MLML 也相對接近,在這一節,我們首先簡要回顧了近年半監督 MLC 的一些最新工作。但是,近年來,半監督 MLC 開始有了新的挑戰,不少文章開始結合半監督 MLC 和 MLML 問題。畢竟對于多標簽數據量來說,即使標注少量的 Full Supervised 數據,也是不可接受的。因此,許多文章開始研究一類弱監督多標簽問題[4](Weakly-Supervised MLC,狹義),也就是數據集中可能混雜 Full labeled/missing labels/unlabeled data。我們也在文中重點介紹了現有的一些 WS-MLC 的工作。

Partial Multi-Label Learning(PML):PML 是近年來多標簽最新的方向,它考慮的是一類 “難以標注的問題”。比如,在我們標注下方的圖片(Zhang et. al. 2020[5])的時候,諸如 Tree、Lavender 這些標簽相對是比較簡單的。但是有些標簽到底有沒有,是比較難以確定的,對于某些標注者,可能出現:“這張圖片看起來是在法國拍的,好像也可能是意大利?”。這種情況稱之為 Ambiguous。究其原因,一是有些物體確實難以辨識,第二可能是標注者不夠專業(這種多標簽的情況,標注者不太熟悉一些事物也很正常)。但是,很多情況下,標注者是大概能夠猜到正確標簽的范圍,比如這張風景圖所在國家,很可能就是 France 或者 Italy 中的一個。我們在不確定的情況下,可以選擇不標注、或者隨機標注。但是不標注意味著我們丟失了所有信息,隨機標注意味著可能帶來噪聲,對學習的影響更大。所以 PML 選擇的是讓標注者提供所有可能的標簽,當然加了一個較強的假設:所有的標簽都應該被包含在候選標簽集中。在 Survey 中,我們將現有的 PML 方法劃分為 Two-Stage Disambiguation 和 End-to-End 方法(我們 IJCAI 2019 的論文 DRAMA[6] 中,就使用了前者)。關于 PML 的更多探討,我在之前的知乎回答里面也已經敘述過,大家也可以在我們的 Survey 中了解更多。

Other Settings:前文說過,多標簽學習的標簽空間紛繁復雜,因此很多研究者提出了各種各樣不同的學習問題,我們也簡單摘要了一些較為前沿的方向:

MLC with Noisy Labels (Noisy-MLC)。

MLC with Unseen Labels. (Streaming Labels/Zero-Shot/Few-Shot Labels)

Multi-Label Active Learning (MLAL)。

MLC with Multiple Instances (MIML)。

3. Deep Learning for MLC 相信這一部分是大家比較關心的內容,隨著深度學習在越來越多的任務上展現了自己的統治力,多標簽學習當然也不能放過這塊香餑餑。不過,總體來說,多標簽深度學習的模型還沒有十分統一的框架,當前對 Deep MLC 的探索主要分為以下一些類別: Deep Embedding Methods:早期的 Embedding 方法通常使用線性投影,將 PCA、Compressed Sensing 等方法引入多標簽學習問題。一個很自然的問題是,線性投影真的能夠很好地挖掘標簽之間的相關關系嗎?同時,在 SLEEC[3]的工作中也發現某些數據集并不符合 Low-Rank 假設。因此,在 2017 年的工作 C2AE[7]中,Yeh 等將 Auto-Encoder 引入了多標簽學習中。由于其簡單易懂的架構,很快有許多工作 Follow 了該方法,如 DBPC[8]等。

4a376d00-4458-11eb-8b86-12bb97331649.png

Deep Learning for Challenging MLC:深度神經網絡強大的擬合能力使我們能夠有效地處理更多更困難的工作。因此我們發現近年的趨勢是在 CV、NLP 和 ML 幾大 Community,基本都會有不同的關注點,引入 DNN 解決 MLC 的問題,并根據各自的問題發展出自己的一條線。 1. XML 的應用:對這個方面的關注主要來自與數據挖掘和 NLP 領域,其中比較值得一提的是 Attention(如 AttentionXML[9])機制、Transformer-Based Models(如 X-Transformer[10])成為了最前沿的工作。

2. 弱監督 MLC 的應用:這一部分和我們弱監督學習的部分相對交叉,特別的,CVPR 2019 的工作 [11] 探索了多種策略,在 Missing Labels 下訓練卷積神經網絡。 DL for MLC with unseen labels:這一領域的發展令人興奮,今年 ICML 的工作 DSLL[12]探索了流標簽學習,也有許多工作 [13] 將 Zero-Shot Learning 的架構引入 MLC。 3. Advanced Deep Learning for MLC:有幾個方向的工作同樣值得一提。首先是 CNN-RNN[14]架構的工作,近年有一個趨勢是探索 Orderfree 的解碼器 [15]。除此之外,爆火的圖神經網絡 GNN 同樣被引入 MLC,ML-GCN[16] 也是備受關注。特別的,SSGRL[17]是我比較喜歡的一篇工作,結合了 Attention 機制和 GNN,motivation 比較強,效果也很不錯。 總結一下,現在的 Deep MLC 呈現不同領域關注點和解決的問題不同的趨勢:

從架構上看,基于Embedding、CNN-RNN、CNN-GNN的三種架構受到較多的關注。

從任務上,在XML、弱監督、零樣本的問題上,DNN 大展拳腳。

從技術上,Attention、Transformer、GNN在 MLC 上的應用可能會越來越多。

4. Online Multi-Label Learning 面對當前這么復雜而眾多的學習問題,傳統的全數據學習的方式已經很難滿足我們現實應用的需求了。因此,我們認為 Online Multi-Label Learning 可能是一個十分重要,也更艱巨的問題。當前 Off-line 的 MLC 模型一般假設所有數據都能夠提前獲得,然而在很多應用中,或者對大規模的數據,很難直接進行全量數據的使用。一個樸素的想法自然是使用 Online 模型,也就是訓練數據序列地到達,并且僅出現一次。然而,面對這樣的數據,如何有效地挖掘多標簽相關性呢?本篇 Survey 介紹了一些已有的在線多標簽學習的方法,如 OUC[18]、CS-DPP[19]等。在弱監督學習的部分,我們也回顧了近年一些在線弱監督多標簽的文章[20](在線弱監督學習一直是一個很困難的問題)。

Online MLC 的工作不多,但是已經受到了越來越多的關注,想要設計高效的學習算法并不簡單,希望未來能夠有更多研究者對這個問題進行探索。 5. Statistical Multi-Label Learning 近年,盡管深度學習更強勢,但傳統的機器學習理論也在穩步發展,然而,多標簽學習的許多統計性質并沒有得到很好的理解。近年 NIPS、ICML 的許多文章都有探索多標簽的相關性質。一些值得一提的工作例如,缺失標簽下的低秩分類器的泛化誤差分析 [21]、多標簽代理損失的相合性質[22]、稀疏多標簽學習的 Oracle 性質[23] 等等。相信在未來,會有更多工作探索多標簽學習的理論性質。

6. New Applications 講了這么多方法論,但追溯其本源,這么多紛繁復雜的問題依然是由任務驅動的,正是有許許多多現實世界的應用,要求我們設計不同的模型來解決尺度更大、監督更弱、效果更強、速度更快、理論性質更強的 MLC 模型。因此,在文章的最后一部分,我們介紹了近年多標簽領域一些最新的應用,如 Video Annotation、Green Computing and 5G Applications、User Profiling 等。在 CV 方向,一個趨勢是大家開始探索多標簽領域在視頻中的應用 [24]。在 DM 領域,用戶畫像受到更多關注,在我們今年的工作 CMLP[25] 中(下圖),就探索了對刷單用戶進行多種刷單行為的分析。不過,在 NLP 領域,似乎大家還是主要以文本分類為主,XML-Repo[2]中的應用還有較多探索的空間,所以我們沒有花額外的筆墨。

4a74a828-4458-11eb-8b86-12bb97331649.png

總結 寫這篇文章的過程中,我跟著幾位老師閱讀了很多文章,各個領域和方向的工作都整理了不少,盡管無法 cover 到所有工作,但是我們盡可能地把握了一些較為重要的探索的方向,也在文中較為謹慎地給出了一些我們的思考和建議,希望能夠給想要了解多標簽學習領域的研究者一點引領和思考。

原文標題:多標簽學習的新趨勢(2020 Survey)

文章出處:【微信公眾號:通信信號處理研究所】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4808

    瀏覽量

    102817
  • AI
    AI
    +關注

    關注

    87

    文章

    34274

    瀏覽量

    275449
  • 深度學習
    +關注

    關注

    73

    文章

    5554

    瀏覽量

    122491

原文標題:多標簽學習的新趨勢(2020 Survey)

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    云里物里推出全新按鍵倉儲標簽

    在工業倉儲場景中,同一物料需響應多個工單并行揀貨是常見的作業模式,但傳統紙質標簽或單一交互設備常面臨信息更新滯后、操作繁瑣、設備管理復雜等難題,導致揀貨效率低下、人工成本攀升。云里物里基于對工業場景的深度洞察,推出全新按鍵倉儲標簽
    的頭像 發表于 05-26 15:37 ?168次閱讀

    NXP eIQ Time Series Studio 工具使用攻略(九)-數據標簽

    其中"Data Labeling",數據標簽工具使用戶能夠通過可視化界面將相應的數據標簽(如電弧或無電?。糜诋斍皵祿D形的不同部分,從而對導入的原始數據進行分類。然后,該工具根據標簽對原始數據進行細分,并創建用于訓練機器
    的頭像 發表于 05-22 09:51 ?552次閱讀
    NXP eIQ Time Series Studio 工具使用攻略(九)-數據<b class='flag-5'>標簽</b>

    佛瑞亞談汽車產業發展的新趨勢與新機遇

    全球汽車科技供應商FORVIA佛瑞亞集團以創新之姿閃耀2025上海車展,圓滿收官此次行業盛會!佛瑞亞集團首席執行官馬啟元(Martin FISCHER)親臨展會現場,與全球行業精英共話未來出行。今天,讓我們透過他的視角,解碼汽車產業發展的新趨勢與新機遇。
    的頭像 發表于 05-14 15:17 ?352次閱讀

    2025車展,電機新趨勢

    上展現出來的,關于電機的幾個趨勢。首先是結構升級,扁線電機、發卡繞組,已經成為主流,我們就不討論了,新型結構主要體現在繞組形式,博世、中車、五菱推出X-pin繞組方
    的頭像 發表于 05-02 08:50 ?198次閱讀
    2025車展,電機<b class='flag-5'>新趨勢</b>

    美能光伏亮相 SolarEX Istanbul 2025 共探光伏檢測技術新趨勢

    土耳其伊斯坦布爾,與全球光伏行業專家共同探討光伏檢測技術發展新趨勢。創新技術亮相,共探光伏未來MillennialSolar美能光伏向全球觀眾全方位展示了其先進且全
    的頭像 發表于 04-15 09:03 ?417次閱讀
    美能光伏亮相 SolarEX Istanbul 2025 共探光伏檢測技術<b class='flag-5'>新趨勢</b>

    智慧路燈綜合桿:賦能低空經濟, 解鎖無人機場,化身低空雷達,護航“空中衛士”引領智慧城市新趨勢

    【案例分享】智慧路燈綜合桿:賦能低空經濟, 解鎖無人機場,化身低空雷達,護航“空中衛士”引領智慧城市新趨勢
    的頭像 發表于 12-10 13:56 ?685次閱讀
    智慧路燈綜合桿:賦能低空經濟, 解鎖無人機場,化身低空雷達,護航“空中衛士”引領智慧城市<b class='flag-5'>新趨勢</b>

    2024世界物聯網大會:IOT研發的新趨勢和PLM系統使用

    盤點世界物聯網大會上的IOT新趨勢,云PLM為IOT設備的研發提供了更多可能
    的頭像 發表于 12-09 17:48 ?551次閱讀

    測徑儀控制軟件 趨勢圖報表一個不能少

    :允許用戶自定義趨勢圖的樣式,包括顏色、線條類型、軸標簽等,以滿足不同用戶的視覺偏好和分析需求。 通道顯示:如果測徑儀支持通道測量,軟件應能同時顯示多個通道的
    發表于 10-21 14:35

    通道開關濾波器的創新者,引領電磁兼容技術新趨勢

    維愛普|通道開關濾波器的創新者,引領電磁兼容技術新趨勢
    的頭像 發表于 10-16 14:25 ?495次閱讀

    多家企業將匯聚深圳,共商電機新趨勢!

    從高效能電機本體、智能控制器、關鍵零部件到先進的測試與檢測設備,如何把握電機產業最新產品動向和技術新趨勢? 如何高效、直接把握當下電機產業鏈上下游的最新產品與電機技術方案? 為構建一個電機行業新產品
    的頭像 發表于 10-15 14:02 ?586次閱讀
    多家企業將匯聚深圳,共商電機<b class='flag-5'>新趨勢</b>!

    光伏電站無人機智慧巡檢新趨勢

    光伏電站無人機智慧巡檢新趨勢 隨著全球能源結構向清潔化、低碳化轉型,光伏發電作為重要的清潔能源之一,其應用日益廣泛。光伏電站的建設和運維也面臨著新的挑戰,尤其是在電站規模不斷擴大后,如何高效、精準
    的頭像 發表于 09-05 16:51 ?482次閱讀
    光伏電站無人機智慧巡檢<b class='flag-5'>新趨勢</b>

    無線液位監測技術在智能化時代的應用新趨勢

    復雜多變的工業場景中靈活應用。隨著物聯網、無線通信技術的飛速發展,無線液位監測技術的出現,以其優勢正逐步改寫液體管理的新趨勢。 一、無線液位監測技術的核心優勢 1. 安裝便捷,降低成本: 相比有線傳感器,無線液位
    的頭像 發表于 08-26 15:19 ?497次閱讀

    揭秘未來辦公新趨勢:樓宇自控系統的智能進化

    在科技浪潮的推動下,辦公空間正悄然發生著翻天覆地的變化。樓宇自控系統,作為智能建筑的靈魂,正引領我們邁向一個前所未有的智慧辦公新時代。這一系統的智能進化,不僅深刻影響著我們的工作環境,更在無形中塑造著未來辦公的新趨勢
    的頭像 發表于 08-10 10:21 ?567次閱讀

    馬拉松賽事新趨勢:超高頻標簽的應用與影響 #物聯網 #賽事標簽 #超高頻標簽 #rfid標簽

    RFID
    深圳市融智興科技有限公司
    發布于 :2024年07月12日 16:29:12

    RFID軍標亮燈標簽,智能高效新體驗!

    廣州一芯未來的RFID軍標亮燈標簽支持軍標協議GJB7377.1A-2018協議強制命令與可選命令,提供標簽選中LED閃爍指示功能,支持單標簽
    的頭像 發表于 06-28 14:24 ?762次閱讀
    RFID軍標亮燈<b class='flag-5'>標簽</b>,智能高效新體驗!