一種新穎的標簽驅動去噪框架(LDF)
然后,查詢集利用原型生成相應的查詢表示。最后,通過測量每個原型表示與相應查詢表示之間的距離來進行類別....
基于VLP模型的語義對齊機制
在本文中,我們利用圖像描述模型提出一個新穎的探針方法。通過這個方法,我們從文本角度分析了VLP模型的....
用于學習對象級、語言感知和語義豐富視覺表征的GLIP模型
Visual recognition 模型通常只能預測一組固定的預先確定的目標類別,這限制了在現實世....
Transformer常用的輕量化方法
引言:近年來,Transformer模型在人工智能的各個領域得到了廣泛應用,成為了包括計算機視覺,自....
MRC和QA中使用的思想方法在信息抽取任務中的應用
主要的評測標準有常見的準確率P、召回率R和F1值。在上述四個任務的前三個中,使用P、R、F1可以滿足....
一種基于prompt和對比學習的句子表征學習模型
我們發現prompt,再給定不同的template時可以生成不同方面的positive pair,且....
基于BIO序列標注的方法和基于片段的圖解析方法
該論文的出發點是將端到端基于片段的(span-based)語義角色標注(SRL)轉換為基于詞的(wo....
一個全新的文本到視頻跨模態檢索子任務
PRVR任務旨在從大量未剪輯的長視頻中檢索出與查詢文本部分相關的對應視頻。若一個未經剪輯的長視頻中存....
分享微博在特征Embedding建模方向做的一些工作
首先我們對比自然語言處理和圖像處理:NLP 最基本的數據元素是單詞,每個單詞有一定的含義,可能指代某....
面向社交媒體的多模態屬性級情感分析
另一方面,相比于單一的文本數據,多模態數據包含了多種不同信息,這些信息之間往往一一對應、互為補充,如....
半監督學習代碼庫存在的問題與挑戰
當使用監督學習(Supervised Learning)對大量高質量的標記數據(Labeled Da....
擴散模型應用在自然語言處理中的應用
對該證據下界的變形的形式,我們可以直觀地這么理解:證據下界等價于這么一個過程,我們用編碼器將輸入 x....
GAT模型如何來編碼依存關系
? 本文貢獻有如下兩點: 提出了一個面向方面的樹結構,通過重塑和修剪普通的依存樹來關注目標方面。 提....
基于用于自然語言生成的“語境調優”技術
自然語言生成(又稱為文本生成)旨在基于輸入數據用人類語言生成合理且可讀的文本。隨著預訓練語言模型的發....
借助機器翻譯來生成偽視覺-目標語言對進行跨語言遷移
然而之前的基于機器翻譯的CCR工作大多忽略了這個問題,它們通常使用大規模的預訓練模型在通過機器翻譯得....
文本噪聲標簽在預訓練語言模型(PLMs)上的特性
數據的標簽錯誤隨處可見,如何在噪聲數據集上學習到一個好的分類器,是很多研究者探索的話題。在 Lear....
CLarET:實現上下文到事件相關感知的預訓練模型
自然語言文本里描述的“事件”,通常是由一個謂詞及其論點組成的一個文本片段(span),是一個細粒度的....
文本分類中處理樣本不均衡和提升模型魯棒性的trick
文本分類看似簡單,但實則里面有好多門道。作者水平有限,只能將平時用到的方法和trick在此做個記錄和....
基于訓練階段使用知識庫+KNN檢索相關信息輔助學習方法
上面收的引入知識庫+KNN的方法,緩解了模型參數需要強記憶訓練樣本的問題。此外,文中還通過KNN檢索....
關于AE、OE、SC的序列標注問題
首先從中利用CNN編碼上下文特征,然后將共享向量視為query方面,并用注意力機制計算query和上....
基于重疊和嵌套事件抽取領域的主流方法
具體的詞對關系分類示例如圖2所示。其中S-T表示兩個詞是某個觸發詞的頭部和尾部,S-A表示兩個詞是某....
什么是嵌套實體識別
嵌套命名實體識別是命名實體識別中的一個頗具挑戰的子問題。我們在《實體識別LEAR論文閱讀筆記》與《實....
如何計算模型對預測結果的信心
在很多問題中,獲取標注準確的大量數據需要很高的成本,這也往往限制了深度學習的應用。主動學習通過對未標....
研究人員為多模態NER任務提出新穎的關系增強圖卷積網絡
命名實體識別(NER)是信息抽取的一項基本任務,它的目的是識別文本片段中的實體及類型,如人名(PER....
一個基于參數更新的遷移學習的統一框架
它提出一個基于參數更新的遷移學習的統一框架,建立多種參數優化方法之間的聯系,從而方便理解不同方法背后....
針對文本生成任務提出一種基于提示的遷移學習方法
理解是一個復雜且多面的能力,包括對文本詞匯、背景知識、語言結構的理解。因此,我們采用GLUE, Su....
預先訓練的語言模型能像人類一樣聰明地解釋明喻嗎?
明喻主要分為兩類:封閉式明喻(ClosedSimile),以及開放式明喻(OpenSimile)。如....
NLP中的神經網絡設計與學習
近些年來,人工神經網絡方法已經成為了自然語言處理中最重要的范式之一。但是,大量依賴人工設計的神經網絡....
基于“結構決定性質”零樣本三維藥物設計方法
藥物設計(Drug Design)旨在針對給定的生物靶點(通常為蛋白質口袋)提供符合設計要求的候選分....