女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為什么半監督學習是機器學習的未來?

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:Andre Ye ? 2020-11-27 10:42 ? 次閱讀

為什么半監督學習是機器學習的未來。

監督學習是人工智能領域的第一種學習類型。從它的概念開始,無數的算法,從簡單的邏輯回歸到大規模的神經網絡,都已經被研究用來提高精確度和預測能力。

然而,一個重大突破揭示了添加“無監督數據”可以提高模型泛化和性能。事實上,在非常多的場景中,帶有標簽的數據并不容易獲得。半監督學習可以在標準的任務中實現SOTA的效果,只需要一小部分的有標記數據 —— 數百個訓練樣本。

在這個我們對半監督學習的探索中,我們會有:

半監督學習簡介。什么是半監督學習,它與其他學習方法相比如何,半監督學習算法的框架/思維過程是什么?

算法:Semi-Supervised GANs。與傳統GANs的比較,過程的解釋,半監督GANs的性能。

用例和機器學習的未來。為什么半監督學習會有如此大的需求,哪里可以應用。

半監督學習介紹

半監督學習算法代表了監督和非監督算法的中間地帶。雖然沒有正式定義為機器學習的“第四個”元素(監督、無監督、強化),但它將前兩個方面結合成一種自己的方法。

這些算法操作的數據有一些標簽,但大部分是沒有標簽的。傳統上,人們要么選擇有監督學習的方式,只對帶有標簽的數據進行操作,這將極大地減小數據集的規模,要么,就會選擇無監督學習的方式,丟棄標簽保留數據集的其余部分,然后做比如聚類之類的工作。

這在現實世界中是很常見的。由于標注是很昂貴的,特別是大規模數據集,特別是企業用途的,可能只有幾個標簽。例如,考慮確定用戶活動是否具有欺詐性。在100萬用戶中,該公司知道有1萬用戶是這樣的,但其他9萬用戶可能是惡意的,也可能是良性的。半監督學習允許我們操作這些類型的數據集,而不必在選擇監督學習或非監督學習時做出權衡。

一般來說,半監督學習算法在這個框架上運行:

半監督機器學習算法使用有限的標記樣本數據集來訓練自己,從而形成一個“部分訓練”的模型。

部分訓練的模型對未標記的數據進行標記。由于樣本標記數據集有許多嚴重的限制(例如,在現實數據中的選擇偏差),標記的結果被認為是“偽標簽”數據。

結合標記和偽標簽數據集,創建一個獨特的算法,結合描述和預測方面的監督和非監督學習。

半監督學習利用分類過程來識別數據資產,利用聚類過程將其分成不同的部分。

算法:Semi-Supervised GAN

半監督的GAN,簡稱為SGAN,是[生成對抗網絡](https://medium.com/analytics-vidhya/gans-for-one -an-直覺解釋-革命概念-2f962c858b95)架構的一個變體,用于解決半監督學習問題。

在傳統的GAN中,判別器被訓練來預測由生成器模型生成的圖像是真實的還是假的,允許它從圖像中學習判別特征,即使沒有標簽。盡管大多數人通常在GANs中使用訓練很好的生成器,可以生成和數據集中相似的圖像,判別器還是可以通過以轉移學習作為起點在相同的數據集上建立分類器,允許監督任務從無監督訓練中受益。由于大部分的圖像特征已經被學習,因此進行分類的訓練時間和準確率會更好。

然而,在SGAN中,判別器同時接受兩種模式的訓練:無監督和監督。

在無監督模式中,需要區分真實圖像和生成的圖像,就像在傳統的GAN中一樣。

在監督模式中,需要將一幅圖像分類為幾個類,就像在標準的神經網絡分類器中一樣。

為了同時訓練這兩種模式,判別器必須輸出1 + n個節點的值,其中1表示“真或假”節點,n是預測任務中的類數。

在半監督GAN中,對判別器模型進行更新,預測K+1個類,其中K為預測問題中的類數,并為一個新的“假”類添加額外的類標簽。它涉及到同時訓練無監督分類任務和有監督分類任務的判別器模型。整個數據集都可以通過SGAN進行傳遞 —— 當一個訓練樣本有標簽時,判別器的權值將被調整,否則,分類任務將被忽略,判別器將調整權值以更好地區分真實的圖像和生成的圖像。

雖然允許SGAN進行無監督訓練,允許模型從一個非常大的未標記數據集中學習非常有用的特征提取,但有監督學習允許模型利用提取的特征并將其用于分類任務。其結果是一個分類器可以在像MNIST這樣的標準問題上取得令人難以置信的結果,即使是在非常非常少的標記樣本(數十到數百個)上進行訓練。

SGAN巧妙地結合了無監督和監督學習的方面,強強聯合,以最小的標簽量,產生難以置信的結果。

用例和機器學習的未來

在一個可用數據量呈指數級增長的時代,無監督數據根本不能停下來等待標注。無數真實世界的數據場景會像這樣出現 —— 例如,YouTube視頻或網站內容。從爬蟲引擎和內容聚合系統到圖像和語音識別,半監督學習被廣泛應用。

半監督學習將監督學習和非監督學習的過擬合和“不擬合”傾向(分別)結合起來的能力,創建了一個模型,在給出最小數量的標記數據和大量的未標記數據的情況下,可以出色地執行分類任務。除了分類任務,半監督算法還有許多其他用途,如增強聚類和異常檢測。盡管這一領域本身相對較新,但由于在當今的數字領域中發現了巨大的需求,算法一直在不斷地被創造和完善。

半監督學習確實是機器學習的未來。

原文標題:比監督學習做的更好:半監督學習

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4806

    瀏覽量

    102738
  • 機器學習
    +關注

    關注

    66

    文章

    8490

    瀏覽量

    134069

原文標題:比監督學習做的更好:半監督學習

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    使用MATLAB進行無監督學習

    監督學習是一種根據未標注數據進行推斷的機器學習方法。無監督學習旨在識別數據中隱藏的模式和關系,無需任何監督或關于結果的先驗知識。
    的頭像 發表于 05-16 14:48 ?543次閱讀
    使用MATLAB進行無<b class='flag-5'>監督學習</b>

    機器學習模型市場前景如何

    當今,隨著算法的不斷優化、數據量的爆炸式增長以及計算能力的飛速提升,機器學習模型的市場前景愈發廣闊。下面,AI部落小編將探討機器學習模型市場的未來
    的頭像 發表于 02-13 09:39 ?284次閱讀

    傳統機器學習方法和應用指導

    在上一篇文章中,我們介紹了機器學習的關鍵概念術語。在本文中,我們會介紹傳統機器學習的基礎知識和多種算法特征,供各位老師選擇。 01 傳統機器
    的頭像 發表于 12-30 09:16 ?1024次閱讀
    傳統<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    如何選擇云原生機器學習平臺

    當今,云原生機器學習平臺因其彈性擴展、高效部署、低成本運營等優勢,逐漸成為企業構建和部署機器學習應用的首選。然而,市場上的云原生機器
    的頭像 發表于 12-25 11:54 ?381次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    來源:Master編程樹“機器學習”最初的研究動機是讓計算機系統具有人的學習能力以便實現人工智能。因為沒有學習能力的系統很難被認為是具有智能的。目前被廣泛采用的
    的頭像 發表于 11-16 01:07 ?833次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    時空引導下的時間序列自監督學習框架

    【導讀】最近,香港科技大學、上海AI Lab等多個組織聯合發布了一篇時間序列無監督預訓練的文章,相比原來的TS2Vec等時間序列表示學習工作,核心在于提出了將空間信息融入到預訓練階段,即在預訓練階段
    的頭像 發表于 11-15 11:41 ?647次閱讀
    時空引導下的時間序列自<b class='flag-5'>監督學習</b>框架

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現智能系統的核心。隨著數據量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學習機器
    的頭像 發表于 11-15 09:19 ?1072次閱讀

    【《大語言模型應用指南》閱讀體驗】+ 基礎知識學習

    收集海量的文本數據作為訓練材料。這些數據集不僅包括語法結構的學習,還包括對語言的深層次理解,如文化背景、語境含義和情感色彩等。 自監督學習:模型采用自監督學習策略,在大量無標簽文本數據上學習
    發表于 08-02 11:03

    【《大語言模型應用指南》閱讀體驗】+ 基礎篇

    章節最后總結了機器學習的分類:有監督學習、無監督學習監督學習、自
    發表于 07-25 14:33

    神經網絡如何用無監督算法訓練

    神經網絡作為深度學習的重要組成部分,其訓練方式多樣,其中無監督學習是一種重要的訓練策略。無監督學習旨在從未標記的數據中發現數據內在的結構、模式或規律,從而提取有用的特征表示。這種訓練方式對于大規模未
    的頭像 發表于 07-09 18:06 ?1350次閱讀

    深度學習中的無監督學習方法綜述

    應用中往往難以實現。因此,無監督學習在深度學習中扮演著越來越重要的角色。本文旨在綜述深度學習中的無監督學習方法,包括自編碼器、生成對抗網絡、聚類算法等,并分析它們的原理、應用場景以及優
    的頭像 發表于 07-09 10:50 ?1537次閱讀

    機器學習算法原理詳解

    機器學習作為人工智能的一個重要分支,其目標是通過讓計算機自動從數據中學習并改進其性能,而無需進行明確的編程。本文將深入解讀幾種常見的機器學習
    的頭像 發表于 07-02 11:25 ?2155次閱讀

    機器學習在數據分析中的應用

    隨著大數據時代的到來,數據量的爆炸性增長對數據分析提出了更高的要求。機器學習作為一種強大的工具,通過訓練模型從數據中學習規律,為企業和組織提供了更高效、更準確的數據分析能力。本文將深入探討機器
    的頭像 發表于 07-02 11:22 ?1238次閱讀

    深度學習與傳統機器學習的對比

    在人工智能的浪潮中,機器學習和深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于機器
    的頭像 發表于 07-01 11:40 ?2201次閱讀

    名單公布!【書籍評測活動NO.35】如何用「時間序列與機器學習」解鎖未來

    設備的運行狀況,生成各種維度的報告。 同時,通過大數據分析和機器學習技術,可以對業務進行預測和預警,從而協助社會和企業進行科學決策、降低成本并創造新的價值。 當今時代,數據無處不在,而時間序列數據更是
    發表于 06-25 15:00