女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種優化深度網絡的降維分解技術解析

454398 ? 來源:AI加速微信公眾號 ? 作者:AI加速微信公眾號 ? 2020-11-21 11:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本篇介紹的也是采用了降維的思想來加速網絡推理,但是數學上采用了不同的方法。而且這篇文章提出的方法可以加速深度網絡,其在vgg-16上進行了實驗,獲得了4倍的加速效果,而在imageNet分類中top-5錯誤率僅有0.3%升高。

1、原理

首先我們來看神經網絡中的卷積運算的形式,對于任一個隱藏層,它有c幅輸入圖片,每幅圖片都會和一個卷積核進行卷積運算。假設卷積核大小為kxk,那么就有c個卷積核。我們可以將圖片沿著個數方向重新生成一個維度,圖片就成了一個3D的張量,大小為hxhxc。卷積核為kxkxc,其在kxk方向進行劃窗,而c方向進行求和。每個輸出點實際上是kxkxc個乘法求和結果。這c個卷積核會輸出一幅圖片,如果隱藏層有d個節點,實際上是輸出n幅圖片。如果將kxkxcxd這么大的卷積核進行重新排列,排成一個d行,每行有kxkxc個數據,就稱為了一個矩陣,我們令為W。那么輸入圖片排成一個向量,長度為kxkxc。用矩陣乘法可以表示為:



W為一個dx(kkc+1)的維度矩陣,多增加一個1是將bias加在末尾。但是有人會問一幅圖片是hxh個點,現在僅在x向量中取了其kxk個點,那么其他的點如何計算呢?實際上其它點可以看做為多組x向量輸入,在之后降維分解中都考慮在內。

從上述公式看出,計算量復雜度為O(dkkc)。文章中文章可以用于更深網絡的本質原因。

接下來作者重新表達y為:


M是一個dxd的矩陣,秩為d’。y-是平均響應,其維度也為d’。但是這里作者為什么引入了y-并沒有講。我想和歸一化有類似作用吧,可以糾正數據沿著網絡傳輸的發散性。經過降維的后的y,其和x關系變為了:


b是新生成的bias,為:


由于M的秩為d’,所以可以進行分解為:


那么就有:



W矩陣變為d’x(kkc+1)大小,因此計算量降低為O(d’kkc)+O(dd’),因為O(dd’)很小,所以計算復雜度變為原來的d’/d。實際上是減小了神經網絡中輸入通道的數量,將輸入通道減少拆分成兩層網絡,如圖中所示。而CP分解的權重通道數沒有變,而是減小了kxk方向維度。


以上公式的導出都是基于y有較低的維數表達,實際中并不會有這樣嚴格的數學性質,因為對于任意輸入x,以及不同訓練集訓練出來的網絡,我們不能保證y的維數實際低于d。所以這變成了一個近似問題,如何選擇一個d’,同時使得新獲得的參數的網絡可以逼近最初結果。作者使用平方差來作為目標函數進行計算:


以上優化問題可以很容易獲得解。實際上是尋找yyT的最大本征值,這類似于PCA方法。通過提取出排列在前幾位最大的本征值,而剩余本征值設置為0來優化網絡參數。最大本征值反應了表達y的信息的能力。然后通過一些矩陣變換就可以得到M矩陣。

上述方法很容易兼容非線性單元,因為考慮非線性單元后,優化目標變為:


其中r為非線性函數,作者只考慮了ReLu函數的求解。以上目標函數很難求解,因此作者做了一些數學變換,將上述損失函數進行了松弛處理,即引入了z,重新表達為:


從中看出當lamda逼近無窮時,其目標函數等同于原始目標函數。通過上述方法,可以優化每一層的網絡參數。因為每層網絡的輸出是下層輸入,所以整個優化一層層傳遞下去可以完成整體網絡優化。

2、結果

首先作者選擇了一個10層網絡進行試驗,結果為:


這里symmetric和asymmetric是作者進行非線性優化時,分別使用了原始的輸入結果和近似輸入結果來進行的。實際上是修正每層造成的錯誤沿著層向前積累。可以看出asymmetric比symmetric有更低的錯誤率。

VGG是一個廣泛使用的網絡模型,是一個深度網絡,其被廣泛用于物體識別,圖像分割,視頻分析中。作者在VGG-16上進行了實驗,實驗結果和CP分解的做了對比,如圖:


結論

本文介紹了另外一種降維方法,其可以優化深度網絡。個人感覺其還是有一定局限性,首先其在網絡前向傳輸優化時,錯誤率還是會進行積累,這也是僅僅優化了16層VGG的原因,當然這相比CP分解確實加深了。但是類似resnet這樣更深的網絡,作者并沒有報道過。

編輯:hfy


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4814

    瀏覽量

    103577
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    一種基于經優化算法優化過的神經網絡設計FIR濾波器的方法介紹

    、計算速度等方面的優越性。基于這種算法,有人分別將其在數域和數上做出了推廣。本文提出的方法,是基于余弦基神經網絡設計方法的一種改良,其基本思想首先是使設計頻響與理想頻響之間的全局誤差在通帶和阻帶范圍
    發表于 07-08 07:16

    文本分類中一種混合型特征方法

    提出一種基于特征選擇和特征抽取的混合型文本特征方法,分析基于選擇和抽取的特征方法各自的特點,借助特征項的類別分布差異信息對特征集進行
    發表于 04-01 08:46 ?7次下載

    空時自適應處理研究

    是空時自適應處理(STAP :SPACE-TIME ADAPTIVE PROCESSING)實用化的重要手段,基于雜波協方差矩陣特征分解
    發表于 12-18 16:46 ?13次下載

    一種基于FPGA的二DCT和IDCT的新算法

    提出了一種新的二DCT和IDCT的FPGA實現結構,采用行列快速算法將二算法分解為兩個
    發表于 01-12 10:35 ?59次下載
    <b class='flag-5'>一種</b>基于FPGA的二<b class='flag-5'>維</b>DCT和IDCT的新算法

    基于FPGA的高光譜圖像奇異值分解技術

    基于FPGA的高光譜圖像奇異值分解技術
    發表于 08-30 15:10 ?2次下載

    一種基于局部結構保持的數據方法

    一種基于局部結構保持的數據方法_張琳
    發表于 01-07 18:56 ?2次下載

    一種基于深度神經網絡的基音檢測算法

    一種基于深度神經網絡的基音檢測算法_曹猛
    發表于 01-07 19:08 ?0次下載

    基于譜特征嵌入的腦網絡狀態觀測矩陣方法

    針對基于功能核磁共振( fMRI)重構的腦網絡狀態觀測矩陣數過高且無特征表現的問題,提出一種基于譜特征嵌入( Spectral Embedding)的
    發表于 11-29 16:36 ?0次下載

    如何使用FPGA實現高光譜圖像奇異值分解技術

    了解決高光譜圖像數高、數據量巨大、實時處理技術實現難的問題,提出了高光譜圖像實時處理技術。采用奇異值
    發表于 03-11 16:07 ?10次下載
    如何使用FPGA實現高光譜圖像奇異值<b class='flag-5'>分解</b><b class='flag-5'>降</b><b class='flag-5'>維</b><b class='flag-5'>技術</b>

    一種帶核方法的判別圖正則非負矩陣分解算法

    非負矩陣分解(NMF)是一種非常有效的數據方法,廣泛應用于圖像聚類等領域。然而NMF是無監督的方法,沒有使用數據的標簽信息,也不能捕獲
    發表于 04-07 16:01 ?30次下載
    <b class='flag-5'>一種</b>帶核方法的判別圖正則非負矩陣<b class='flag-5'>分解</b>算法

    一種基于DSCNN-BILSTM的入侵檢測方法

    針對傳統的入侵檢測方法無法有效提取網絡流量數據特征的問題,提出了一種基于 DSCNN- BILSTM的入侵檢測方法,該方法引入了深度可分離卷積代替標準卷積從而減少了模型參數,降低了計算量,并應用雙向
    發表于 04-16 15:41 ?14次下載
    <b class='flag-5'>一種</b>基于DSCNN-BILSTM的入侵檢測方法

    一種基于DeepFM的深度興趣因子分解網絡

    推薦系統能夠根據用戶的喜妤從海量信息中篩選岀其可能感興趣的信息并進行排序展示。隨著深度學習在多個研究領域取得了良好的效果,其也開始應用于推薦系統。目前基于深度學習的推薦排序算法常采用E
    發表于 04-20 14:00 ?10次下載
    <b class='flag-5'>一種</b>基于DeepFM的<b class='flag-5'>深度</b>興趣因子<b class='flag-5'>分解</b>機<b class='flag-5'>網絡</b>

    一種新型的數據采集多視圖算法技術

    。為更好地利用多視圖數據,促進算法在實際中的應用,對多視圖算法進行研究。分析多視圖數據和多視圖學習,在典型相關分析(CCA)的基礎上追溯多視圖CCA和核CCA,介紹多視圖
    發表于 05-28 10:53 ?5次下載

    淺析卷積與池化的對比

    在學習深度學習中卷積網絡過程中,有卷積層,池化層,全連接層等等,其中卷積層與池化層均可以對特征圖,本次實驗針對控制其他層次致的情況下,
    的頭像 發表于 02-17 14:58 ?1543次閱讀
    淺析卷積<b class='flag-5'>降</b><b class='flag-5'>維</b>與池化<b class='flag-5'>降</b><b class='flag-5'>維</b>的對比

    深度神經網絡(DNN)架構解析優化策略

    深度神經網絡(Deep Neural Network, DNN)作為機器學習領域中的一種重要技術,以其強大的特征學習能力和非線性建模能力,在多個領域取得了顯著成果。DNN的核心在于其多
    的頭像 發表于 07-09 11:00 ?3848次閱讀