女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

在風格遷移中如何進行數據增強

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:丁磊 ? 2021-01-13 09:41 ? 次閱讀

這是一篇關于風格遷移中如何進行數據增強的論文。在introduction部分,informal-->formal 的風格遷移問題,最大的障礙是訓練數據的不足。為了解決此問題,本篇論文提出三種數據增強的方法來獲得有用的語句對,分別為

back translation (BT)

我們使用原始語料庫訓練一個seq2seq模型。其中將formal語句作為模型的輸入,讓seq2seq模型有能力輸出對應的informal句子。則 模型輸入的formal語句和輸出的informal語句就構成了一個新的語句對。

formality discrimination (F-Dis)

F-Dis方法使用機器翻譯模型,將一個informal句子重寫為formal句子。首先使用Google翻譯API 將這些informal語句翻譯成 其他語種(比如法語),然后又翻譯回英語。如下圖所示:

831f1182-549c-11eb-8b86-12bb97331649.jpg

其中,informal語句可以從網上論壇上收集得到。

表示收集到的第i條句子(informal), 是最后翻譯回的句子(formal), 二者構成了一個新的語句對。

本方法同時使用CNN構建了一個“格式判別器”:用來給一個句子的“正規”程度 打分。就是上圖中右邊括號內的小數。最終選出的新數據集要求如下:

837b0564-549c-11eb-8b86-12bb97331649.png

其中表示句子的“正規”程度, 是閾值

multi-task transfer (M-Task)

我們觀察到,formal語句通常語法正確,而informal語句的語法經常出錯。

前人研究表明,對FST的輸出再使用一個語法錯誤糾正模型( grammatical error correction model,GEC)可以提高模型效果。受此啟發,本論文直接使用GEC的訓練數據作為增強的新數據集。如下圖

83e7497c-549c-11eb-8b86-12bb97331649.png

模型訓練

上面提到的seq2seq模型為Transformer (base)。

本論文首先使用增強的新數據用于 預訓練,然后使用原始語料數據做微調,將這稱為pre-training & finetuning (PT&FT)方法。下面結果證明了PT&FT的效果優于ST方法。ST是把增強數據和原數據一起訓練。

843ca7b4-549c-11eb-8b86-12bb97331649.jpg

下圖展現了三種數據增強方法的效果:

84b0048e-549c-11eb-8b86-12bb97331649.jpg

下圖展現了我們的方法與前人模型的比較結果:

84cef614-549c-11eb-8b86-12bb97331649.jpg

責任編輯:xj

原文標題:【ACL2020】關于正式風格遷移的數據增強方法

文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7239

    瀏覽量

    90962
  • 機器學習
    +關注

    關注

    66

    文章

    8490

    瀏覽量

    134029
  • 自然語言處理

    關注

    1

    文章

    628

    瀏覽量

    14000

原文標題:【ACL2020】關于正式風格遷移的數據增強方法

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    數據臺接入富士PLC進行數據采集并遠程維護

    要實現數據臺接入富士PLC進行數據采集并遠程維護,可以參考以下方案: 硬件連接 通過富士PLC支持的通信接口(如以太網口、串口等),使用相應的通信線纜將PLC與數據
    的頭像 發表于 04-24 14:24 ?159次閱讀

    請問ldc1000與主機進行數據傳輸的過程數據傳輸速率設置為多大合適?

    你好,請問ldc1000與主機進行數據傳輸的過程數據傳輸速率設置為多大合適(我的差不多1M),但數據一直不對····
    發表于 01-17 06:37

    HarmonyOS Next 應用元服務開發-分布式數據對象遷移數據文件資產遷移

    數據對象組網進行數據恢復。 創建空的分布式數據對象,用于接收恢復的數據; 從want讀取分布式數據
    發表于 12-24 10:11

    HarmonyOS Next 應用元服務開發-分布式數據對象遷移數據權限與基礎數據

    向用戶申請授權。 二、基礎數據遷移 使用分布式數據對象,與上述開發步驟類似,需要在源端onContinue()接口中進行數據保存,并在對端的onCreate()/onNewWant()
    發表于 12-24 09:40

    使用CAN總線進行數據采集的方法

    是汽車內部各個模塊之間進行通信的一種協議,通過它可以獲取到車輛的各種狀態信息、傳感器數據等。因此,進行數據采集之前,需要熟悉CAN總線的工作原理、通信協議以及
    的頭像 發表于 12-20 18:18 ?2060次閱讀

    zeta的定義和應用 如何使用zeta進行數據分析

    Zeta(ζ)電位是描述懸浮粒子液體中移動時所產生的電位差的一個物理量,以下是對其定義、應用以及如何進行數據分析的詳細解釋: Zeta電位的定義 Zeta電位是通過理論推導和實驗測量得到的,它反映
    的頭像 發表于 12-19 18:10 ?4580次閱讀

    如何使用ddc進行數據分類

    探討如何使用DDC(Dewey Decimal Classification,即杜威十進制分類法)進行數據分類時,我們首先需要明確DDC是一種用于圖書館分類和組織圖書的體系,它按照一定的體系將各種
    的頭像 發表于 12-18 15:05 ?926次閱讀

    如何使用cmp進行數據庫管理的技巧

    使用 cmp 命令時進行有效的數據庫管理。 1. 理解 cmp 命令 cmp 命令用于比較兩個文件是否在內容上完全相同。它逐字節比較文件,并在找到第一個不同的地方時停止。這對于檢查數據
    的頭像 發表于 12-17 09:31 ?524次閱讀

    如何使用SQL進行數據分析

    使用SQL進行數據分析是一個強大且靈活的過程,它涉及從數據庫中提取、清洗、轉換和聚合數據,以便進行進一步的分析和洞察。 1. 數據提取(Da
    的頭像 發表于 11-19 10:26 ?1100次閱讀

    ADS1299與STM32f407通過SPI進行數據傳輸的時候,可以直接使用HAL庫的HAL_SPI_Receive函數進行數據傳輸嗎?

    與STM32f407通過SPI進行數據傳輸的時候,可以使能SPI之后,直接使用HAL庫的HAL_SPI_Receive函數進行數據
    發表于 11-13 08:29

    使用TMS320C6000 MCBSP進行數據打包

    電子發燒友網站提供《使用TMS320C6000 MCBSP進行數據打包.pdf》資料免費下載
    發表于 10-26 10:54 ?0次下載
    使用TMS320C6000 MCBSP<b class='flag-5'>進行數據</b>打包

    使用AI大模型進行數據分析的技巧

    使用AI大模型進行數據分析的技巧涉及多個方面,以下是一些關鍵的步驟和注意事項: 一、明確任務目標和需求 使用AI大模型之前,首先要明確數據分析的任務目標,這將直接影響模型的選擇、數據
    的頭像 發表于 10-23 15:14 ?2402次閱讀

    如何利用海外爬蟲IP進行數據抓取

    利用海外爬蟲IP進行數據抓取需要綜合考慮多個方面。
    的頭像 發表于 10-12 07:54 ?513次閱讀

    何進行IP檢測

    排查網絡連接問題,并及時的防范潛在的網絡攻擊。 那么,如何進行 IP 地址檢測呢?接下來我將進行圖示哦~ 使用操作系統自帶的工具 ① Windows 系統,按win+R,輸入“ipconfig”命令。 ② Mac 系統
    的頭像 發表于 07-26 14:09 ?1073次閱讀
    如<b class='flag-5'>何進行</b>IP檢測

    求助,IR615可以選用哪種vpn協議?如何進行配置?

    現有多臺IR615路由器,希望將其配置為vpn客戶端,連接云服務器的vpn服務端 工程師遠程連接云服務器對IR615進行管理 IR615可以選用哪種vpn協議?如何進行配置? 服務
    發表于 07-25 07:53