女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

簡述位置編碼在注意機制中的作用

深度學習自然語言處理 ? 來源:DeepHub ? 作者:DeepHub ? 2021-06-16 17:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

神經(jīng)網(wǎng)絡知識。

有一種叫做注意機制的東西,但是你不需要知道注意力具體實現(xiàn)。

RNN/LSTM的不足。

A. Vaswani等人的《Attention Is All You Need》被認為是解決了眾所周知的LSTM/RNN體系結構在深度學習空間中的局限性的突破之一。本文介紹了transformers 在seq2seq任務中的應用。該論文巧妙地利用了 D.Bahdanau 等人通過聯(lián)合學習對齊和翻譯的神經(jīng)機器翻譯注意機制的使用。并且提供一些示例明確且詳盡地解釋了注意力機制的數(shù)學和應用。

在本文中,我將專注于注意力機制的位置編碼部分及其數(shù)學。

假設您正在構建一個 seq2seq 學習任務,并且您想要開發(fā)一個模型,該模型將輸入英語句子并將其翻譯成其他 語言?!癆ll animals are equal but some are more equal than others ”→Badhā prā?ī’ō samāna chē parantu kē?alāka an’ya karatā vadhu samāna chē你的第一步是獲取這個輸入句子,運行一個分詞器,將它轉換成數(shù)字,然后將它傳遞給一個嵌入層,這可能會為這個句子中的每個單詞添加一個額外的維度。

在運行 RNN 或 LSTM 時,隱藏狀態(tài)保留單詞在句子中的相對位置信息。然而,在 Transformer 網(wǎng)絡中,如果編碼器包含一個前饋網(wǎng)絡,那么只傳遞詞嵌入就等于為您的模型增加了不必要的混亂,因為在詞嵌入中沒有捕獲有關句子的順序信息。為了處理單詞相對位置的問題,位置編碼的想法出現(xiàn)了。

在從嵌入層提取詞嵌入后,位置編碼被添加到這個嵌入向量中。

解釋位置編碼最簡單的方法是為每個單詞分配一個唯一的數(shù)字 ∈ ? 。或者為每個單詞分配一個在 [0,1] ∈ ? 范圍內的實數(shù)(如果輸入句子很長,這樣可以處理很大的值)。但是,上述兩種方法都沒有捕捉到單詞之間時間步長的準確性。為了克服這個問題,本文使用了 sin 和 cosine 函數(shù)形式的位置編碼。

打個比方,我們輸入模型的序列,無論是句子、視頻序列還是股票市場價格數(shù)據(jù),都將始終是時域信號。表示時域信號的最佳方式是通過正弦方程 sin(ωt)。如果我們巧妙地使用這個波動方程,我們可以在一次拍攝中捕獲詞嵌入的時間和維度信息。

讓我們看一下這個等式,在接下來的步驟中,我們將嘗試把它形象化。

052682a0-cab3-11eb-9e57-12bb97331649.png

讓我們考慮一個簡單的句子,它被分詞,然后它的詞嵌入被提取。句子長度為5,嵌入維數(shù)為8。因此,每個單詞都表示為1x8的向量。

現(xiàn)在我們在時間維度上取一個序列把正弦PE向量加到這個嵌入向量上。

進一步,我們對沿dim維數(shù)的其他向量做類似的操作。

本文在嵌入向量中交替加入正弦和余弦。如果dim是偶數(shù),則sin級數(shù)相加,如果dim是奇數(shù),則cos級數(shù)相加。

這很好地捕獲了沿時間維度(或等式中描述的 pos 維度。我將 pos 和 time 互換使用,因為它們意味著相同的事情)但是如何也捕獲沿dims維度的相對位置信息呢?這里的答案也在于等式本身。ω 項。

05f41878-cab3-11eb-9e57-12bb97331649.png

隨著 i 從 0 增加到 d_embedding/2,頻率也從 1/2π 減少到 1/(2π.10000)

因此我們看到,沿著無序方向的每個向量,位置的唯一性被捕獲。該論文還描述了這種編碼的魯棒性。但是我仍然無法找出為什么特別使用數(shù)字 10000 進行位置編碼(它可能是一個超參數(shù)嗎?)。這個解釋粗略地展示了如何使用正弦和余弦對于模型理解是非常合理和有效的。下面的圖表本身講述了位置編碼如何隨位置(時間)和尺寸變化。

人們可以很容易地看到,這些是簡單的時頻圖,其中位置代表時間,深度代表頻率。時間頻率圖已被用于從射電天文學到材料光譜分析的許多應用中。因此,從現(xiàn)有的現(xiàn)實世界系統(tǒng)構建類比確實可以更好地理解問題。

這是我對注意力機制中使用的位置編碼的看法。在接下來的系列中,我將嘗試撰寫有關編碼器-解碼器部分的內容,并將注意力應用于現(xiàn)實世界的規(guī)模問題。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4814

    瀏覽量

    103599
  • 編碼
    +關注

    關注

    6

    文章

    969

    瀏覽量

    55769
  • rnn
    rnn
    +關注

    關注

    0

    文章

    89

    瀏覽量

    7108
  • LSTM
    +關注

    關注

    0

    文章

    60

    瀏覽量

    4051

原文標題:位置編碼在注意機制中的作用

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    什么是伺服電機編碼器?作用/關鍵技術/選型等一起看看吧!

    什么是伺服電機編碼器? 伺服電機編碼器是伺服系統(tǒng)的核心反饋元件,用于實時檢測電機的轉速、位置、角度等參數(shù),并將信號反饋給控制器(如伺服驅動器),形成閉環(huán)控制,確保電機運動的精準性和穩(wěn)
    的頭像 發(fā)表于 06-09 11:07 ?603次閱讀
    什么是伺服電機<b class='flag-5'>編碼</b>器?<b class='flag-5'>作用</b>/關鍵技術/選型等一起看看吧!

    磁旋轉編碼永磁同步電機位置測量的應用(可下載)

    一、概述與直流電機相比,永磁同步電機具有體積小、 效率高、無需維護等優(yōu)點,某些應用 場景,由位置傳感器精度引起的轉矩波動應限制 1%以內,這就要求電機
    發(fā)表于 04-09 13:37 ?0次下載

    絕對式編碼伺服電機控制的應用與優(yōu)勢分析

    反饋傳感器,能夠直接提供電機的絕對位置信息。伺服電機控制系統(tǒng),絕對值編碼器作為反饋裝置,起到了至關重要的作用。它帶來了精確的
    的頭像 發(fā)表于 02-06 09:46 ?717次閱讀
    絕對式<b class='flag-5'>編碼</b>器<b class='flag-5'>在</b>伺服電機控制<b class='flag-5'>中</b>的應用與優(yōu)勢分析

    如何提高編碼器的工作效率與作用

    編碼器是一種將信號或數(shù)據(jù)從一種形式或格式轉換為另一種形式的設備。工業(yè)自動化、通信、計算機等領域中,編碼器扮演著至關重要的角色。提高編碼器的工作效率和
    的頭像 發(fā)表于 11-24 10:12 ?665次閱讀

    編碼機器人技術的應用 編碼傳感器系統(tǒng)作用

    編碼機器人技術扮演著至關重要的角色,特別是傳感器系統(tǒng),其作用不可忽視。以下是對
    的頭像 發(fā)表于 11-24 10:02 ?1609次閱讀

    編碼器的安裝注意事項 磁編碼測量系統(tǒng)作用

    編碼器的安裝注意事項 磁編碼器的安裝過程需要特別注意以下幾點,以確保其能夠正常工作并長期保持高精度: 避免直接沖擊 : 安裝磁
    的頭像 發(fā)表于 11-23 09:28 ?929次閱讀

    編碼工業(yè)自動化的應用

    編碼工業(yè)自動化的應用非常廣泛,其基于磁場變化來測量轉速和位置的工作原理,使其提升生產(chǎn)效率、優(yōu)化產(chǎn)品質量以及降低能耗等方面發(fā)揮著不可
    的頭像 發(fā)表于 11-23 09:09 ?1238次閱讀

    MySQL編碼機制原理

    前言 一位讀者本地部署 MySQL 測試環(huán)境時碰到一個問題,我覺得挺有代表性的,所以寫篇文章介紹一下,看完相信你會對 MySQL 的編碼機制有最本質的了解,本文的目錄結構如下 讀者問題簡介
    的頭像 發(fā)表于 11-09 11:01 ?581次閱讀

    其利天下技術·伺服電機編碼器的作用及工作原理·低壓伺服電機驅動方案開發(fā)

    電機系統(tǒng)起著至關重要的作用,是實現(xiàn)高效、穩(wěn)定和精確控制的核心組件。編碼器的作用是什么呢?它的工作原理又是怎樣的?其利天下·伺服電機驅動方案編碼
    的頭像 發(fā)表于 11-02 10:38 ?1017次閱讀
    其利天下技術·伺服電機<b class='flag-5'>編碼</b>器的<b class='flag-5'>作用</b>及工作原理·低壓伺服電機驅動方案開發(fā)

    對于多級放大電路板,PCB布局,電源擺放的位置應該注意什么?

    對于多級放大電路板,PCB布局,電源擺放的位置應該注意什么,我一些資料上看到過:多級放大電路
    發(fā)表于 09-20 08:25

    全極霍爾傳感器AH471電動牙刷位置檢測作用

    全極霍爾傳感器AH471電動牙刷位置檢測作用
    的頭像 發(fā)表于 09-14 09:58 ?698次閱讀
    全極霍爾傳感器AH471<b class='flag-5'>在</b>電動牙刷<b class='flag-5'>中</b>起<b class='flag-5'>位置</b>檢測<b class='flag-5'>作用</b>

    電機控制系統(tǒng)編碼器概述與作用

    編碼器分辨率是描述編碼測量運動過程中所能分辨的最小位置變化量的指標。理解編碼器分辨率對于設計和實現(xiàn)高精度的運動控制系統(tǒng)至關重要。以下是對
    的頭像 發(fā)表于 08-17 19:49 ?1058次閱讀

    AGV輪轂電機編碼

    編碼器還可以提供電機的絕對位置信息,這對于AGV系統(tǒng)的定位和校準至關重要。AGV系統(tǒng),一般會使用Z信號來表示編碼器的絕對
    的頭像 發(fā)表于 07-22 11:33 ?1017次閱讀
    AGV輪轂電機<b class='flag-5'>中</b>的<b class='flag-5'>編碼</b>器

    簡述半導體原理——晶體管家族的核心工作機制

    簡述半導體原理——晶體管家族的核心工作機制
    的頭像 發(fā)表于 07-20 08:14 ?1665次閱讀
    <b class='flag-5'>簡述</b>半導體原理——晶體管家族的核心工作<b class='flag-5'>機制</b>

    電容單相電機作用

    單相電機是一種常見的電機類型,廣泛應用于家用電器、工業(yè)設備和商業(yè)設施。單相電機的工作原理與三相電機不同,其主要特點是只有一個電源相,因此需要特殊的啟動和運行機制。單相電機,電容的
    的頭像 發(fā)表于 07-19 15:32 ?4003次閱讀