論文:A Span-Based Model for Joint Overlapped and DiscontinuousNamed Entity Recognition
鏈接:https://aclanthology.org/2021.acl-long.372.pdf
代碼:https://github.com/foxlf823/sodner
提取摘要
由于普通的NER問題被研究的透透的了,本文主要解決一種稍微復雜些問題:一種帶有覆蓋和不連續(Overlapped and Discontinuous)的命名實體識別任務。
而在這兩者研究上來說,前人只是要么解決覆蓋問題,要么解決不連續問題,但是本文提出一種聯合解決這兩種問題的span-based方法。
span-based方法昨天也提到過了,所以關于實體+關系抽取的任務都可以嘗試。
本文通過兩個步驟構建模型:
通過列舉所有可能的text span來識別出實體片段(entity fragments);
在這些entity fragments上預測是兩種關系overlapping or succession。
這樣,我們不僅可以識別Discontinuous的實體,同時也可以對Overlapped的實體進行雙重檢查。
通過上述方法輕松將NER裝換成RE(Relation Extraction)任務。最終實驗在很多數據集上比如CLEF, GENIA andACE05上展現除了很強勁的性能。
該模型的步驟為
input一方面通過pre-train模型獲取word rep,一方面通過dependency parsing獲取句法信息;
GCN集合LSTM的輸出和句法輸入,得到syntax-enhanced的新的表達;
獲取所有span表示;
通過兩個MLP預測span是否為實體,以及實體時間是否有關系;
最后每個loss加上權重,為最終優化目標。
關鍵分類
AGGCN用來融入句法信息
attention-guided GCN (AGGCN)比普通GCN要強一些,所以這里選用該方法。傳統的GCN:
而AGGCN就是使用self-attention,替換以前的鄰接矩陣A,最后通過線性方法將multi head生成的結果合一:
Span的表示
解碼先預測實體片段,再預測關系。
解碼公式
損失計算
實驗實驗數據介紹
在數據上的表現
在其他數據上與前人的對比,雖然性能不如SOTA,但是這種Span-based方式和SOTA差不了多少,是個新穎的想法。
責任編輯:haq
-
模型
+關注
關注
1文章
3486瀏覽量
49992 -
nlp
+關注
關注
1文章
490瀏覽量
22482
原文標題:ACL2021 | 一種巧妙解決NER覆蓋和不連續問題的方法
文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
評論