女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

關于神經網絡的十大學習率衰減提效策略

深度學習自然語言處理 ? 來源:煉丹筆記 ? 作者:時晴 ? 2021-06-16 17:48 ? 次閱讀

十大學習率衰減策略!

簡 介

目前越來越多非結構化問題的出現,神經網絡也扮演著愈加重要的作用。一個好的神經網絡對于最終任務的預測至關重要,但要得到一個好的神經網絡則需要考慮眾多的因素,本文我們重點介紹神經網絡中調參重學習率衰減的調節策略。本文介紹目前tensorflow中的9大學習率衰減策略。

exponential_decay = learning_rate_decay.exponential_decay

piecewise_constant = learning_rate_decay.piecewise_constant

polynomial_decay = learning_rate_decay.polynomial_decay

natural_exp_decay = learning_rate_decay.natural_exp_decay

inverse_time_decay = learning_rate_decay.inverse_time_decay

cosine_decay = learning_rate_decay.cosine_decay

cosine_decay_restarts = learning_rate_decay.cosine_decay_restarts

linear_cosine_decay = learning_rate_decay.linear_cosine_decay

noisy_linear_cosine_decay = learning_rate_decay.noisy_linear_cosine_decay

學習率衰減

01

分段常數衰減

在對應區間置中不同的學習率的常數值,一般初始學習率會大一些,后面越來越小,要根據樣本量的大小設置區間的間隔大小,樣本量越大,區間間隔要小一點。在真正的網絡訓練中,需要操作人員根據具體任務對學習率具體設置

該方法有助于針對不同任務進行精細地調參,在任意步長后下降任意數值的learning rate。

02

指數衰減

指數衰減的方式,學習率的大小和訓練次數指數相關,指數衰減簡單直接,收斂速度快,是最常用的學習率衰減方式,其數學公式為:

如下圖所示,紅色的為學習率隨訓練次數的指數衰減方式,藍色的即為分段常數衰減 。

2089ade2-cab3-11eb-9e57-12bb97331649.png

03

自然指數衰減

自然指數衰減和指數衰減方式相似,不同的在于它的衰減底數是,所以它的收斂的速度更快,一般用于相對比較容易訓練的網絡,便于較快的收斂,其更新公式為:

和分段常數以及指數衰減相比,其中綠色的是自然指數衰減。

04

多項式衰減

多項式衰減的方式進行更新學習率,需要給定初始學習率和最低學習率,然后按照給定的衰減方式將學習率從初始值衰減到最低值,其更新規則即為:

此處需要注意有兩個機制:

降到最低學習率后,到訓練結束可以一直使用最低學習率進行更新;

另一個是再次將學習率調高,使用decay_steps的倍數,取第一個大于global_steps的結果,即:

可以用它來防止神經網絡在訓練的后期由于學習率過小而導致的網絡一直在某個局部最小值附近震蕩,在后期增大學習率跳出局部極小值。

05

倒數衰減

倒數衰減的數學公式為:

21befb18-cab3-11eb-9e57-12bb97331649.png

06

余弦衰減

顧名思義,就是采用余弦方式進行學習率的衰減。其更新機制如下:

其中alpha可以看作是baseline,保證學習率不會低于某個值。不同alpha的影響如下:

221ba6a6-cab3-11eb-9e57-12bb97331649.png

07

循環學習率衰減

學習率以循環周期進行衰減。是循環學習率的cycle版本。

余弦函數式的下降模擬了大lr找潛力區域然后小lr快速收斂的過程,加之restart帶來的cycle效果,有漲1-2個點的可能。

08

線性余弦衰減

線性余弦衰減方式是基于余弦方式的衰減策略,其數學公式為:

線性余弦衰減一般應用領域是增強學習領域,

09

噪聲線性余弦衰減

在線性余弦衰減的基礎上,加入了噪聲。就得到了噪聲線性余弦衰減。噪聲線性余弦衰減提升了學習率尋找最優值的隨機性和可能性。

0110

自定義學習率

大家還可以依據自己的想法自定義學習率衰減策略,例如可以依據驗證集合的表現,來更新學習率,如果驗證集合上評估指標在不斷變好,則保持lr,否則降低學習率。

參考文獻

tensorflow learning schedule之分段常數衰減用法

An Overview of Deep Learning Optimization Methods and Learning Rate Attenuation Methods

Tensorflow中learning rate decay的奇技淫巧

TensorFlow使用記錄 (三):Learning Rate Scheduling

深度學習中的固定學習率衰減策略總結

https://github.com/tensorflow/tensorflow/blob/master/tensorflow/python/training/learning_rate_decay.py

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 噪聲
    +關注

    關注

    13

    文章

    1137

    瀏覽量

    47899
  • 神經網絡
    +關注

    關注

    42

    文章

    4809

    瀏覽量

    102840
  • 函數
    +關注

    關注

    3

    文章

    4371

    瀏覽量

    64241

原文標題:神經網絡十大學習率衰減提效策略!

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    BP神經網絡的調參技巧與建議

    BP神經網絡的調參是一個復雜且關鍵的過程,涉及多個超參數的優化和調整。以下是一些主要的調參技巧與建議: 一、學習(Learning Rate) 重要性 :學習
    的頭像 發表于 02-12 16:38 ?665次閱讀

    如何優化BP神經網絡學習

    優化BP神經網絡學習是提高模型訓練效率和性能的關鍵步驟。以下是一些優化BP神經網絡學習的方
    的頭像 發表于 02-12 15:51 ?777次閱讀

    BP神經網絡與深度學習的關系

    BP神經網絡與深度學習之間存在著密切的關系,以下是對它們之間關系的介紹: 一、BP神經網絡的基本概念 BP神經網絡,即反向傳播神經網絡(Ba
    的頭像 發表于 02-12 15:15 ?727次閱讀

    人工神經網絡的原理和多種神經網絡架構方法

    在上一篇文章中,我們介紹了傳統機器學習的基礎知識和多種算法。在本文中,我們會介紹人工神經網絡的原理和多種神經網絡架構方法,供各位老師選擇。 01 人工神經網絡 ? 人工
    的頭像 發表于 01-09 10:24 ?1025次閱讀
    人工<b class='flag-5'>神經網絡</b>的原理和多種<b class='flag-5'>神經網絡</b>架構方法

    BP神經網絡學習機制

    BP神經網絡(Backpropagation Neural Network),即反向傳播神經網絡,是一種基于梯度下降算法的多層前饋神經網絡,其學習機制的核心在于通過反向傳播算法
    的頭像 發表于 07-10 15:49 ?1096次閱讀

    BP神經網絡和卷積神經網絡的關系

    BP神經網絡(Backpropagation Neural Network)和卷積神經網絡(Convolutional Neural Network,簡稱CNN)是兩種在人工智能和機器學習領域
    的頭像 發表于 07-10 15:24 ?2297次閱讀

    rnn是遞歸神經網絡還是循環神經網絡

    RNN(Recurrent Neural Network)是循環神經網絡,而非遞歸神經網絡。循環神經網絡是一種具有時間序列特性的神經網絡,能夠處理序列數據,具有記憶功能。以下是
    的頭像 發表于 07-05 09:52 ?951次閱讀

    遞歸神經網絡是循環神經網絡

    遞歸神經網絡(Recurrent Neural Network,簡稱RNN)和循環神經網絡(Recurrent Neural Network,簡稱RNN)實際上是同一個概念,只是不同的翻譯方式
    的頭像 發表于 07-04 14:54 ?1425次閱讀

    循環神經網絡和卷積神經網絡的區別

    循環神經網絡(Recurrent Neural Network,RNN)和卷積神經網絡(Convolutional Neural Network,CNN)是深度學習領域中兩種非常重要的神經網絡
    的頭像 發表于 07-04 14:24 ?1939次閱讀

    深度神經網絡與基本神經網絡的區別

    在探討深度神經網絡(Deep Neural Networks, DNNs)與基本神經網絡(通常指傳統神經網絡或前向神經網絡)的區別時,我們需要從多個維度進行深入分析。這些維度包括
    的頭像 發表于 07-04 13:20 ?1677次閱讀

    卷積神經網絡與循環神經網絡的區別

    在深度學習領域,卷積神經網絡(Convolutional Neural Networks, CNN)和循環神經網絡(Recurrent Neural Networks, RNN)是兩種極其重要
    的頭像 發表于 07-03 16:12 ?5369次閱讀

    如何使用神經網絡進行建模和預測

    神經網絡是一種強大的機器學習技術,可以用于建模和預測變量之間的關系。 神經網絡的基本概念 神經網絡是一種受人腦啟發的計算模型,由大量的節點(神經
    的頭像 發表于 07-03 10:23 ?1223次閱讀

    卷積神經網絡和bp神經網絡的區別

    化能力。隨著深度學習技術的不斷發展,神經網絡已經成為人工智能領域的重要技術之一。卷積神經網絡和BP神經
    的頭像 發表于 07-02 14:24 ?5916次閱讀

    神經網絡架構有哪些

    神經網絡架構是機器學習領域中的核心組成部分,它們模仿了生物神經網絡的運作方式,通過復雜的網絡結構實現信息的處理、存儲和傳遞。隨著深度學習技術
    的頭像 發表于 07-01 14:16 ?1411次閱讀

    電機控制系統的神經網絡優化策略

    電機控制系統作為現代工業自動化的核心組成部分,其性能直接影響到整個生產線的效率和穩定性。隨著人工智能技術的快速發展,神經網絡在電機控制系統中的應用越來越廣泛。神經網絡優化策略通過模擬人腦神經
    的頭像 發表于 06-25 11:46 ?1205次閱讀