女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何刻畫數據的本質?流形學習能幫到你

格創東智 ? 2019-04-28 19:08 ? 次閱讀

在格物匯之前的文章中,我們系統性的介紹了特征抽取的經典算法——主成分分析PCA與線性判別分析LDA的原理、應用場景,以及這兩種算法的局限性和改進方法。今天的格物匯要給大家介紹一種新的機器學習算法——流形學習


流形學習


流形學習是一類借鑒了拓撲流形概念的降維方法,與核PCA的目的一樣,它想要在低維空間中盡量保持在高維空間中的結構。一個形象的流形降維過程如下圖,我們有一塊卷起來的布,我們希望將其展開到一個二維平面,我們希望展開后的布能夠在局部保持布結構的特征,其實也就是將其展開的過程,就像兩個人將其拉開一樣。


圖1.jpg


流形學習方法有很多種,但是他們具有一些共同的特征:首先構造流形上樣本點的局部鄰域結構,然后用這些局部鄰域結構來將樣本點全局的映射到一個低維空間。它們之間的不同之處主要是在于構造的局部鄰域結構不同,以及利用這些局部鄰域結構來構造全局的低維嵌入方法的不同。下面我們簡要介紹兩種最常見的流形學習方法:Isomap和LLE。

Isomap


高維數據結構可能太過于抽象,很難去理解。我們先來看一個具體的實例:在上一篇文章中,我們所看到的三維空間上的數據是呈現”S”型,假設我們想尋找圖中兩點的測地距離(延曲面距離),就不能用這兩點坐標所計算的歐式距離,如下圖(a)黑色線所示,因為黑色線所構成的路徑延曲面不可達。而應該使用其沿著“S”形曲面所生成的距離,想象一下一只螞蟻在數據曲面上爬行,它不能脫離曲面行走,行走的路徑如下圖(a)紅色線所示。下圖(b)則顯示的是兩條線本真二維結構上所顯示的路徑,很明顯紅色的線更加真實的反映了兩個數據點在三維數據上的距離。

圖2.jpg


上述這種尋找數據曲面測算距離的方法稱為Isomap(等度量映射),它是流形學習中的一種方法。它是如何實現的呢?它假設數據點與K個最近鄰的點可以構成一個子集,這個子集可以用普通的歐式距離來衡量,而這個子集中的點又與其他子集中的點相連,這樣兩個目標點的距離就可以分解成若干子集的歐式距離疊加來近似得到,最后這些相連的點可以降維到低維空間中展現出來。


圖3.jpg



局部線性嵌入(LLE)

流形學習另外一個典型案例是局部線性嵌入(LLE)。Isomap假設近鄰的測地距離可以用歐式距離來表示。而LLE則假設在近鄰內可以用線性加權互相表達。比如對于任意一個樣本x0,我們都可以用他附近的幾個點x1 x2 x3 x4的線性組合表示出來,即

圖4.jpg

經過LLE降維投影后,原來的點x0 x1 x2 x3 x4,投影變成了

圖5.jpg

LLE降維的想法是,降維后盡量去保留高維時的線性組合關系:

圖6.jpg

圖7.jpg


如何求解呢?我們需要先求出線性組合的權重w,對于樣本x0我們需要找到其最近的k個其他樣本點,假設為x1 x2 x3 x4,我們根據線性表示誤差最小來求出w:

圖8.jpg

根據上式確定出線性組合的w以后,我們還需要讓其在低維空間也能盡可能滿足線性組合的表達關系式,也就是說對于x0 x1 x2 x3 x4……的低維投影點z0 z1 z2 z3 z4……滿足:

圖9.jpg

兩個優化目標函數類型很像,但需要明確的是第一個目標函數優化的是權重w,而第二個目標函數優化的是降維后的坐標z。經過優化即可得出樣本集在低維空間上的投影坐標。

總的來說,對于不在某一個點x0鄰域內的其他點A,不管A怎么變動,都不會影響到點x0,這種變動局部限制的思想在很多地方都有用,此外LLE盡可能的保存了局部線性信息,使得其在局部能反映出數據原本的結構。它的流程大致如下圖所示:

圖10.jpg

小結


LLE是廣泛使用的圖形圖像降維方法,它實現簡單,但是對數據的流形分布特征有嚴格的要求。比如不能是閉合流形,不能是稀疏的數據集,不能是分布不均勻的數據集等等,這限制了它的應用。

優點

1、可以學習任意維的局部線性的低維流形

2、算法歸結為稀疏矩陣特征分解,計算復雜度相對較小,實現容易

缺點

1、算法所學習的流行只能是不閉合的,且樣本集是稠密均勻的

2、算法對最近鄰樣本數的選擇敏感,不同的最近鄰數對最后的降維結果有很大影響

好了,以上就是本期格物匯的內容,我們下期見。


本文作者:格創東智OT團隊(轉載請注明作者及來源)

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 智能制造
    +關注

    關注

    48

    文章

    5835

    瀏覽量

    77483
  • 工業互聯網
    +關注

    關注

    28

    文章

    4356

    瀏覽量

    94843
  • 工業大數據
    +關注

    關注

    0

    文章

    72

    瀏覽量

    8009
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    機器學習的智能光子學器件系統研究與應用

    騰訊會議---六月直播 1.機器學習的智能光子學器件系統研究與應用 2.COMSOL聲學多物理場仿真技術與應用 3.超表面逆向設計及前沿應用(從基礎入門到論文復現) 4.智能光學計算成像技術
    的頭像 發表于 06-04 17:59 ?93次閱讀
    機器<b class='flag-5'>學習</b>賦<b class='flag-5'>能</b>的智能光子學器件系統研究與應用

    本質安全設備標準(IEC60079-11)的理解(四)

    本質安全型電子產品設計規范
    發表于 03-24 09:21 ?1次下載

    EM儲網關 ZWS智慧儲云應用(7) — 數據修正

    導讀ZWS智慧儲云,會統計電量、能耗等數據,這些統計數據與客戶收益情況息息相關。在日常運營中,常有各種異常因素,導致統計有誤。ZWS儲云,針對異常情況是如何
    的頭像 發表于 02-08 13:00 ?456次閱讀
    EM儲<b class='flag-5'>能</b>網關 ZWS智慧儲<b class='flag-5'>能</b>云應用(7) — <b class='flag-5'>數據</b>修正

    中科億海微榮獲2024年度中國圖象圖形學學會技術發明獎

    喜報近日,根據《中國圖象圖形學學會科學技術獎章程》和《中國圖象圖形學學會技術發明獎評選條例》相關要求,中國圖象圖形學學會組織完成了2024年科學技術獎勵的推薦和評選工作。經過形式審查、初評公示和終
    的頭像 發表于 12-11 01:02 ?468次閱讀
    中科億海微榮獲2024年度中國圖象圖<b class='flag-5'>形學</b>學會技術發明獎

    ADS1299讀出的數據一直是7FFFFF或800000,怎么解決?

    你好,這是我想實現用來測腦電的方案配置,沒有使用右腿驅動也沒有SRB1或SRB2,也沒有使用菊花鏈。我使用的是整個ADS1299套件,目前正確的讀取ID寄存器,但后面讀出的數據一直是7FFFFF或800000,請問我的寄存器應該如何配置呢,希望可以得
    發表于 11-25 08:26

    智慧園區的核心本質內容有哪些

    智慧園區的核心本質在于整合數字技術、數據智能和智能化管理等多方面因素,以提升園區運營效率、生態環境、服務體驗和可持續發展。這一概念的出現反映了當代城市規劃與管理的新趨勢,旨在通過科技手段改造傳統園區
    的頭像 發表于 11-14 11:58 ?360次閱讀

    FPGA做深度學習走多遠?

    ,共同進步。 歡迎加入FPGA技術微信交流群14群! 交流問題(一) Q:FPGA做深度學習走多遠?現在用FPGA做深度學習加速成為一個熱門,深鑒科技,商湯,曠視科技等都有基于FPGA做深度
    發表于 09-27 20:53

    什么是飛輪儲 – 它是如何工作的?

    飛輪本質上是一個機械電池,由繞軸旋轉的質量組成。它以動能的形式儲存能量,其工作原理是將轉子加速到非常高的速度,并將系統中的能量維持為旋轉。飛輪儲是一種很有前途的技術,可以替代傳統的鉛酸電池作為儲
    的頭像 發表于 09-11 07:39 ?1066次閱讀
    什么是飛輪儲<b class='flag-5'>能</b> – 它是如何工作的?

    貼片電容與貼片電阻的本質差異在哪里?

    貼片電容與貼片電阻的本質差異在哪里?
    的頭像 發表于 08-27 15:51 ?718次閱讀
    貼片電容與貼片電阻的<b class='flag-5'>本質</b>差異在哪里?

    智能家居單火改零火這幾種方案單火模塊零線發生器一定會幫到你

    智能家居單火改零火這幾種方案單火模塊零線發生器一定會幫到你
    的頭像 發表于 08-02 08:18 ?2312次閱讀
    智能家居單火改零火這幾種方案單火模塊零線發生器一定會<b class='flag-5'>幫到你</b>!

    機器學習中的數據分割方法

    在機器學習中,數據分割是一項至關重要的任務,它直接影響到模型的訓練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細探討機器學習數據分割的方法,包括常見的分割方法、各自的優缺點、
    的頭像 發表于 07-10 16:10 ?2984次閱讀

    機器學習中的數據預處理與特征工程

    在機器學習的整個流程中,數據預處理與特征工程是兩個至關重要的步驟。它們直接決定了模型的輸入質量,進而影響模型的訓練效果和泛化能力。本文將從數據預處理和特征工程的基本概念出發,詳細探討這兩個步驟的具體內容、方法及其在機器
    的頭像 發表于 07-09 15:57 ?1228次閱讀

    人工智能、機器學習和深度學習是什么

    在科技日新月異的今天,人工智能(Artificial Intelligence, AI)、機器學習(Machine Learning, ML)和深度學習(Deep Learning, DL)已成為
    的頭像 發表于 07-03 18:22 ?2555次閱讀

    機器學習數據分析中的應用

    隨著大數據時代的到來,數據量的爆炸性增長對數據分析提出了更高的要求。機器學習作為一種強大的工具,通過訓練模型從數據
    的頭像 發表于 07-02 11:22 ?1284次閱讀

    深度學習模型訓練過程詳解

    深度學習模型訓練是一個復雜且關鍵的過程,它涉及大量的數據、計算資源和精心設計的算法。訓練一個深度學習模型,本質上是通過優化算法調整模型參數,使模型能夠更好地擬合
    的頭像 發表于 07-01 16:13 ?2445次閱讀