女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

電子發燒友App

硬聲App

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示
電子發燒友網>電子資料下載>電子資料>PyTorch教程12.6之勢頭

PyTorch教程12.6之勢頭

2023-06-05 | pdf | 0.73 MB | 次下載 | 免費

資料介紹

第 12.4 節中,我們回顧了在執行隨機梯度下降時會發生什么,即,在只有梯度的噪聲變體可用的情況下執行優化時。特別是,我們注意到對于噪聲梯度,我們在選擇面對噪聲的學習率時需要格外謹慎。如果我們將它降低得太快,收斂就會停滯。如果我們過于寬容,我們將無法收斂到一個足夠好的解決方案,因為噪聲會不斷驅使我們遠離最優解。

12.6.1。基本

在本節中,我們將探索更有效的優化算法,尤其是針對實踐中常見的某些類型的優化問題。

12.6.1.1。漏平均值

在上一節中,我們討論了小批量 SGD 作為加速計算的一種方法。它還有一個很好的副作用,即平均梯度減少了方差量。小批量隨機梯度下降可以通過以下方式計算:

(12.6.1)gt,t?1=?w1|Bt|∑i∈Btf(xi,wt?1)=1|Bt|∑i∈Bthi,t?1.

為了保持符號簡單,我們在這里使用 hi,t?1=?wf(xi,wt?1) 作為樣本的隨機梯度下降i使用及時更新的權重t?1. 如果我們能夠從方差減少的效果中受益,甚至超越小批量的平均梯度,那就太好了。完成此任務的一個選擇是用“leaky average”代替梯度計算:

(12.6.2)vt=βvt?1+gt,t?1

對于一些β∈(0,1). 這有效地將瞬時梯度替換為對多個過去梯度進行平均的梯度 。v稱為速度。它積累了過去的梯度,類似于一個重球從目標函數景觀上滾下來如何對過去的力進行積分。為了更詳細地了解發生了什么,讓我們展開vt遞歸地進入

(12.6.3)vt=β2vt?2+βgt?1,t?2+gt,t?1=…,=∑τ=0t?1βτgt?τ,t?τ?1.

大的β相當于長期平均水平,而小 β僅相當于相對于梯度法的輕微修正。新的梯度替換不再指向特定實例上最速下降的方向,而是指向過去梯度的加權平均值的方向。這使我們能夠實現批量平均的大部分好處,而無需實際計算其梯度的成本。稍后我們將更詳細地重新討論這個平均過程。

上述推理構成了現在所謂的 加速梯度方法的基礎,例如動量梯度。他們享有額外的好處,即在優化問題是病態的情況下更有效(即,在某些方向上進展比其他方向慢得多,類似于狹窄的峽谷)。此外,它們允許我們對后續梯度進行平均以獲得更穩定的下降方向。事實上,即使對于無噪聲凸問題,加速方面也是動量起作用的關鍵原因之一。

正如人們所預料的那樣,由于其功效,勢頭是深度學習及其他領域優化的一個深入研究的課題。例如,請參閱Goh(2017 年撰寫的 精美說明文章,以獲取深入分析和交互式動畫。它是由Polyak ( 1964 )提出的。Nesterov(2018在凸優化的背景下進行了詳細的理論討論。長期以來,眾所周知,深度學習的勢頭是有益的。參見例如Sutskever等人的討論 。( 2013 )了解詳情。

12.6.1.2。病態問題

為了更好地理解動量法的幾何特性,我們重新審視了梯度下降法,盡管它的目標函數明顯不太令人滿意。回想一下我們在12.3 節中使用的f(x)=x12+2x22,即適度扭曲的橢球物鏡。我們通過在x1方向通過

(12.6.4)f(x)=0.1x12+2x22.

像之前一樣

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1ZSKY-2310AI 3A SOT-23 N溝道增強型MOSFET規格書
  2. 0.63 MB   |  2次下載  |  免費
  3. 2MFRC522非接觸式讀卡器IC中文手冊
  4. 0.79 MB   |  1次下載  |  免費
  5. 3TP4055 500mA線性鋰離子電池充電器中文手冊
  6. 0.75 MB   |  1次下載  |  免費
  7. 4VSM8N65A-T2英文規格書
  8. 0.35 MB   |  次下載  |  免費
  9. 5ZSKY-3401 SOT-23塑料封裝MOSFETS規格書
  10. 0.45 MB   |  次下載  |  免費
  11. 6AU6825集成音頻DSP的2×32W數字型Class D音頻功
  12. 2.48 MB   |  次下載  |  免費
  13. 7X1A000171000300,FC2012AN,32.768kHz,2012mm,EPSON晶振
  14. 166.31 KB  |  次下載  |  免費
  15. 8DS-AR1A H01-CN-V1
  16. 331.25 KB  |  次下載  |  免費

本月

  1. 1人形機器人電機驅動和傳感報告
  2. 4.27 MB   |  130次下載  |  免費
  3. 2U盤一鍵制作
  4. 23.84 MB   |  41次下載  |  免費
  5. 3Altium Designer元件庫
  6. 17.11 MB   |  16次下載  |  免費
  7. 424V2A開關電源PCB資料分享
  8. 0.23 MB   |  7次下載  |  1 積分
  9. 5SM2246EN原理圖與規格書
  10. 1.43 MB   |  4次下載  |  1 積分
  11. 6HZ-CORE-RK3588-技術規格書
  12. 992.45 KB  |  3次下載  |  免費
  13. 7GD100PIX120C6SNA規格書
  14. 0.98 MB   |  3次下載  |  免費
  15. 8BK7258英文規格書
  16. 1.67 MB   |  3次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935127次下載  |  10 積分
  3. 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
  4. 1.48MB  |  420064次下載  |  10 積分
  5. 3Altium DXP2002下載入口
  6. 未知  |  233089次下載  |  10 積分
  7. 4電路仿真軟件multisim 10.0免費下載
  8. 340992  |  191382次下載  |  10 積分
  9. 5十天學會AVR單片機與C語言視頻教程 下載
  10. 158M  |  183339次下載  |  10 積分
  11. 6labview8.5下載
  12. 未知  |  81586次下載  |  10 積分
  13. 7Keil工具MDK-Arm免費下載
  14. 0.02 MB  |  73814次下載  |  10 積分
  15. 8LabVIEW 8.6下載
  16. 未知  |  65988次下載  |  10 積分