女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>PyTorch教程10.8之波束搜索

PyTorch教程10.8之波束搜索

2023-06-05 | pdf | 0.20 MB | 次下載 | 免費

資料介紹

10.7 節(jié)中,我們介紹了編碼器-解碼器架構,以及端到端訓練它們的標準技術。然而,當談到測試時間預測時,我們只提到了 貪心策略,我們在每個時間步選擇下一個預測概率最高的標記,直到在某個時間步,我們發(fā)現(xiàn)我們已經(jīng)預測了特殊的序列結尾“”標記。在本節(jié)中,我們將從形式化這種貪婪搜索策略開始,并確定從業(yè)者往往會遇到的一些問題。隨后,我們將該策略與兩種替代方案進行比較:窮舉搜索(說明性但不實用)和 波束搜索(實踐中的標準方法)。

讓我們從設置我們的數(shù)學符號開始,借用第 10.7 節(jié)中的約定。隨時步t′,解碼器輸出表示詞匯表中每個標記出現(xiàn)在序列中的概率的預測(可能的值 yt′+1, 以先前的標記為條件 y1,…,yt′和上下文變量c,由編碼器產(chǎn)生以表示輸入序列。為了量化計算成本,表示為Y輸出詞匯表(包括特殊的序列結束標記“”)。我們還將輸出序列的最大標記數(shù)指定為 T′. 我們的目標是搜索所有的理想輸出 O(|Y|T′)可能的輸出序列。請注意,這稍微高估了不同輸出的數(shù)量,因為在“”標記出現(xiàn)之后沒有后續(xù)標記。然而,出于我們的目的,這個數(shù)字大致反映了搜索空間的大小。

10.8.1。貪心搜索

考慮第 10.7 節(jié)中的簡單貪婪搜索策略 在這里,隨時步t′,我們只需從中選擇條件概率最高的標記 Y, IE,

(10.8.1)yt′=argmaxy∈YP(y∣y1,…,yt′?1,c).

一旦我們的模型輸出“”(或者我們達到最大長度 T′) 輸出序列完成。

這個策略看似合理,其實還不錯!考慮到它在計算上的要求是多么的低,你很難獲得更多的收益。然而,如果我們暫時擱置效率,搜索最有可能的序列似乎更合理,而不是(貪婪選擇的)最有可能的標記序列事實證明,這兩個對象可能完全不同。最可能的序列是最大化表達式的序列 ∏t′=1T′P(yt′∣y1,…,yt′?1,c). 在我們的機器翻譯示例中,如果解碼器真正恢復了潛在生成過程的概率,那么這將為我們提供最有可能的翻譯。不幸的是,不能保證貪心搜索會給我們這個序列。

讓我們用一個例子來說明它。假設輸出字典中有四個標記“A”、“B”、“C”和“”。圖10.8.1中,每個時間步下的四個數(shù)字分別代表在該時間步生成“A”、“B”、“C”、“”的條件概率。

https://file.elecfans.com/web2/M00/A9/C9/poYBAGR9N4-AaGx4AAET1yiKAhk378.svg

圖 10.8.1在每個時間步,貪婪搜索選擇條件概率最高的標記。

在每個時間步,貪心搜索選擇條件概率最高的標記。因此,將預測輸出序列“A”、“B”、“C”和“”(圖 10.8.1)。這個輸出序列的條件概率是 0.5×0.4×0.4×0.6=0.048.

接下來,讓我們看一下圖 10.8.2中的另一個例子。與圖 10.8.1不同,在時間步 2 中,我們選擇圖 10.8.2中的標記“C” ,它具有第二高的條件概率。

https://file.elecfans.com/web2/M00/AA/43/pYYBAGR9N5GACDvWAAEKuTR1cgg914.svg

圖 10.8.2每個時間步下的四個數(shù)字代表在該時間步生成“A”、“B”、“C”和“”的條件概率。在時間步 2,選擇具有第二高條件概率的標記“C”。

由于時間步3所基于的時間步1和2的輸出子序列已經(jīng)從圖10.8.1中的“A”和“B”變?yōu)?/font>圖10.8.2 中的“A”和“C” 圖 10.8.2中每個標記在時間步長 3 的條件概率也發(fā)生了變化 假設我們在時間步 3 選擇標記“B”。現(xiàn)在時間步 4 以前三個時間步“A”、“C”和“B”的輸出子序列為條件,這與“A”不同、“B”、“C”在圖 10.8.1中。因此,圖 10.8.2中第 4 步生成每個 token 的條件概率 也與 圖 10.8.1不同. 因此, 圖 10.8.2中輸出序列“A”、“C”、“B”和“”的條件概率為 0.5×0.3×0.6×0.6=0.054,大于圖 10.8.1中的貪心搜索。在本例中,貪心搜索得到的輸出序列“A”、“B”、“C”、“”并不是最優(yōu)序列。

10.8.2。窮舉搜索

如果目標是獲得最可能的序列,我們可以考慮使用 窮舉搜索:窮舉所有可能的輸出序列及其條件概率,然后輸出得分最高的預測概率。

雖然這肯定會給我們想要的東西,但它的計算成本卻高得令人望而卻步 O(|Y|T′),序列長度呈指數(shù)增長,詞匯量很大。例如,當|Y|=10000T′=10,我們需要評估1000010=1040序列。與實際應用程序相比,這些數(shù)字很小,但已經(jīng)超出了任何可預見的計算機的能力。另一方面,貪心搜索的計算成本是


下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1山景DSP芯片AP8248A2數(shù)據(jù)手冊
  2. 1.06 MB  |  532次下載  |  免費
  3. 2RK3399完整板原理圖(支持平板,盒子VR)
  4. 3.28 MB  |  339次下載  |  免費
  5. 3TC358743XBG評估板參考手冊
  6. 1.36 MB  |  330次下載  |  免費
  7. 4DFM軟件使用教程
  8. 0.84 MB  |  295次下載  |  免費
  9. 5元宇宙深度解析—未來的未來-風口還是泡沫
  10. 6.40 MB  |  227次下載  |  免費
  11. 6迪文DGUS開發(fā)指南
  12. 31.67 MB  |  194次下載  |  免費
  13. 7元宇宙底層硬件系列報告
  14. 13.42 MB  |  182次下載  |  免費
  15. 8FP5207XR-G1中文應用手冊
  16. 1.09 MB  |  178次下載  |  免費

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234315次下載  |  免費
  3. 2555集成電路應用800例(新編版)
  4. 0.00 MB  |  33566次下載  |  免費
  5. 3接口電路圖大全
  6. 未知  |  30323次下載  |  免費
  7. 4開關電源設計實例指南
  8. 未知  |  21549次下載  |  免費
  9. 5電氣工程師手冊免費下載(新編第二版pdf電子書)
  10. 0.00 MB  |  15349次下載  |  免費
  11. 6數(shù)字電路基礎pdf(下載)
  12. 未知  |  13750次下載  |  免費
  13. 7電子制作實例集錦 下載
  14. 未知  |  8113次下載  |  免費
  15. 8《LED驅動電路設計》 溫德爾著
  16. 0.00 MB  |  6656次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935054次下載  |  免費
  3. 2protel99se軟件下載(可英文版轉中文版)
  4. 78.1 MB  |  537798次下載  |  免費
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420027次下載  |  免費
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234315次下載  |  免費
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費
  11. 6電路仿真軟件multisim 10.0免費下載
  12. 340992  |  191187次下載  |  免費
  13. 7十天學會AVR單片機與C語言視頻教程 下載
  14. 158M  |  183279次下載  |  免費
  15. 8proe5.0野火版下載(中文版免費下載)
  16. 未知  |  138040次下載  |  免費