女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

通過Token實現多視角文檔向量表征的構建

深度學習自然語言處理 ? 來源:NLP工作站 ? 作者:劉聰 ? 2022-07-08 11:13 ? 次閱讀

寫在前面

今天給大家帶來一篇ACL2022論文MVR,「面向開放域檢索的多視角文檔表征」,主要解決同一個文檔向量與多個語義差異較大問題向量語義不匹配的問題。通過「插入多個特殊Token」實現多視角文檔向量表征的構建,并為了防止多種視角間向量的趨同,引入了「退火溫度」的全局-局部損失,論文全稱《Multi-View Document Representation Learning for Open-Domain Dense Retrieval》。

該篇論文與前兩天分享的DCSR-面向開放域段落檢索的句子感知的對比學習一文有異曲同工之妙,都是在檢索排序不引入額外計算量的同時,通過插入特殊Token構建長文檔的多語義向量表征,使得同一文檔可以與多種不同問題的向量表征相似。

8665290c-f08c-11ec-ba43-dac502259ad0.png

并且目前的檢索召回模型均存在一些缺陷:

Cross-encoder類模型(BERT)由于計算量太大,無法在召回階段使用;

Bi-encoder類模型(DPR)無法很好地表現長文檔中的多主題要素;

Late Interaction類模型(ColBERT)由于使用sum操作,無法直接使用ANN進行排序;

Attention-based Aggregator類模型(PolyEncoder)增加了額外運算并且無法直接使用ANN進行排序。

867ad496-f08c-11ec-ba43-dac502259ad0.png

模型

868cedd4-f08c-11ec-ba43-dac502259ad0.png

通常向量表征時,采用特殊字符[CLS]對應的向量表征作為文本的向量表征。為了獲取文檔中更細粒度的語義信息,MVR引入多個特殊字符[VIE]替代[CLS]。

對于文檔來說,在文本前插入多個字符[],為了防止干擾原始文本的位置信息,我們將[]的所有位置信息設置為0,文檔語句位置信息從1開始。

對于問題來說,由于問題較短且通常表示同一含義,因此僅使用一個特殊字符[VIE]。

模型采用雙編碼器作為骨干,分別對問題和文檔進行編碼,如下:

其中,表示鏈接符,[VIE]和[SEP]為BERT模型的特殊字符,和分別為問題編碼器和文檔編碼器。

如上圖所示,首先計算問題向量與每個視角的文檔向量進行點積,獲取每一個視角的得分,然后通過max-pooler操作,獲取視角中分值最大的作為問題向量與文檔向量的得分,如下:

為了防止多種視角間向量的趨同,引入了帶有退火溫度的Global-Local Loss,包括全局對比損失和局部均勻損失,如下:

其中,全局對比損失為傳統的對比損失函數,給定一個問題、一個正例文檔以及多個負例文檔,損失函數如下:

為了提高多視角向量的均勻性,提出局部均勻性損失,強制將選擇的查詢向量與視角向量更緊密,原理其他其視角向量,如下:

為了進一步區分不同視角向量間的差異,采用了退火溫度,逐步調整不同視角向量的softmax分布,如下:

其中,為控制退火速度的超參,為模型訓練輪數,每訓練一輪,溫度更新一次。注意:在全局對比損失和局部均勻損失中,均使用了退火溫度。

實驗

如下表所示,MVR方法對比于其他模型,獲取了更好的效果。

86a9f596-f08c-11ec-ba43-dac502259ad0.png

并且,通過實驗發現,當視角個數選擇8時,MVR模型效果最佳。

86d99328-f08c-11ec-ba43-dac502259ad0.png

針對Global-Local Loss進行消融實驗,發現當沒有局部均勻損失和退火溫度時,會使得效果下降;當兩者都沒有時,效果下降更加明顯;并且一個合適退火速度,對訓練較為重要。

86ef0b4a-f08c-11ec-ba43-dac502259ad0.png

相比于其他模型來說,在文檔編碼階段和檢索召回階段的速度基本沒有影響,但由于需要存儲多個視角向量,因此造成存儲空間變大。

8705501c-f08c-11ec-ba43-dac502259ad0.png

并且,對比了簡單的句子切割或者等片段截斷方法獲取一個文本的多個向量表征,發現其效果均不理想,與DCSR一文觀點一致。

87189046-f08c-11ec-ba43-dac502259ad0.png

總結

該論文為了對長文檔更好地進行向量表征,引入多個特殊字符,使其生成「多種不同視角的向量表征」,解決了同一個文檔向量與多個語義差異較大問題向量語義不匹配的問題。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編碼器
    +關注

    關注

    45

    文章

    3775

    瀏覽量

    137191

原文標題:ACL2022 | MVR:面向開放域檢索的多視角文檔表征

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    HarmonyOS5云服務技術分享--自有賬號對接AGC認證

    體系(比如自研的用戶系統),通過AGC的??自有賬號認證??功能,可以快速接入AGC的認證服務,實現: ??擴展認證方式??:讓用戶既可以用自有賬號登錄,也能使用AGC支持的第三方登錄(比如華為賬號、微
    發表于 05-22 16:32

    HarmonyOS5云服務技術分享--認證文檔問題

    ??: 通過創建不同項目區分測試環境與生產環境。 每個項目可獨立管理不同版本的認證服務配置。 ??2. 開通認證服務?? 登錄AGC控制臺,進入目標項目,在「構建 > 認證服務」頁面啟用
    發表于 05-22 13:20

    請問如何通過S32K312命令行構建代碼?

    現在我們已經通過 S32DS3.5 IDE 開發了固件,它也可以工作了。 最近,我們收到了通過命令行構建代碼的要求,并且 我從 S32DS 幫助內容中讀取了相關文檔,但這種情況會發生
    發表于 04-09 07:48

    Token經濟,風起隴東

    以萬全之力,筑成東數西算的token經濟走廊
    的頭像 發表于 04-01 09:46 ?1818次閱讀
    <b class='flag-5'>Token</b>經濟,風起隴東

    恭喜福建好視角順利通過三體系復審

    的規范化管理。通過復審,企業能夠不斷提升內部管理水平,增強市場競爭力。2025年3月,福建好視角電子科技有限公司順利通過三體系復審。此次審核全面檢驗了質量管理體系(QM
    的頭像 發表于 03-25 10:57 ?354次閱讀
    恭喜福建好<b class='flag-5'>視角</b>順利<b class='flag-5'>通過</b>三體系復審

    《AI Agent 應用與項目實戰》閱讀心得3——RAG架構與部署本地知識庫

    功能模塊包括文檔處理器、向量化引擎、檢索模塊和響應生成器。文檔處理器負責解析不同格式的輸入文件,將文本內容規范化處理;向量化引擎使用預訓練的embedding模型將文本轉換為
    發表于 03-07 19:49

    通過Arduino Nano Matter開發板構建智能卷簾系統

    在本指南中,您將學習如何通過Arduino NanoMatter開發板和板上的Silicon Labs(芯科科技)MGM240S協議無線模塊來構建一個智能卷簾系統。該系統可通過 Am
    的頭像 發表于 02-28 09:46 ?463次閱讀
    <b class='flag-5'>通過</b>Arduino Nano Matter開發板<b class='flag-5'>構建</b>智能卷簾系統

    DevEco Studio構建分析工具Build Analyzer 為原生鴻蒙應用開發提速

    過程中的關鍵信息進行細粒度追蹤和記錄,通過泳道圖可直觀展示構建過程中線程的執行情況,并與構建日志聯動,幫助開發者更直觀地跟蹤構建流程,快速發現性能問題。可以看出其中最耗時的任務是MyT
    發表于 02-17 18:06

    2025年Next Token Prediction范式會統一模態嗎

    訓練方法與推理策略 性能評測體系 現存挑戰與未來方向 綜述的完整目錄如下: 模態的 Tokenization 我們認為模態的 Tokenization 是 MMNTP 的基石和最重要的部分,它將
    的頭像 發表于 01-21 10:11 ?380次閱讀
    2025年Next <b class='flag-5'>Token</b> Prediction范式會統一<b class='flag-5'>多</b>模態嗎

    【「基于大模型的RAG應用開發與優化」閱讀體驗】+Embedding技術解讀

    引入外部知識庫來增強生成模型的能力。而Embedding在 Embedding模型將用戶的問題和文檔庫中的文本轉換為向量表示,這是RAG系統進行信息檢索和文本生成的基礎。RAG系統通過計算用戶問題
    發表于 01-17 19:53

    如何實現智慧交通的模式銜接

    實現智慧交通的模式銜接是一個復雜而系統的工程,它涉及多種交通方式的整合、信息共享、技術應用等多個方面。以下是一些關鍵步驟和策略,以實現智慧交通的模式銜接: 一、
    的頭像 發表于 11-22 18:11 ?1464次閱讀

    通過工業智能網關實現中間變量表達式的快速配置

    ,出現告警可能是多個變量達到條件而觸發的,就需要對中間變量進行配置。 對此,物通博聯提供基于工業智能網關實現中間變量表達式的快速配置操作。用戶可以根據生產現場的應用需求,靈活配置中間變量表達式,
    的頭像 發表于 10-08 17:10 ?568次閱讀
    <b class='flag-5'>通過</b>工業智能網關<b class='flag-5'>實現</b>中間變<b class='flag-5'>量表</b>達式的快速配置

    協議移動電源的實現

    電子發燒友網站提供《協議移動電源的實現.pdf》資料免費下載
    發表于 09-30 11:44 ?0次下載
    <b class='flag-5'>多</b>協議移動電源的<b class='flag-5'>實現</b>

    量表接入能源監測平臺實現遠程監控節能管理

    在這個信息化、智能化的時代,節能減排已經成為全球共識。如何在保障生活質量的同時,最大限度地節約能源? 熱量表是一種用于測量供暖或制冷系統中熱能消耗的設備。通過加裝塊熱量表,可以精確地
    的頭像 發表于 07-22 10:42 ?544次閱讀

    視覺新紀元:解碼LED顯示屏的視角、可視角、最佳視角的最終奧秘

    在璀璨奪目的LED顯示屏世界里,每一個絢爛畫面的背后,都離不開三個關鍵概念:視角、可視角與最佳視角。這些術語不僅是衡量顯示效果的重要標尺,也是連接觀眾與精彩內容的橋梁。讓我們一起走進這場視覺盛宴,探索那些讓LED顯示屏如此引人入
    的頭像 發表于 06-23 02:55 ?939次閱讀
    視覺新紀元:解碼LED顯示屏的<b class='flag-5'>視角</b>、可<b class='flag-5'>視角</b>、最佳<b class='flag-5'>視角</b>的最終奧秘