標注多跳問答(Multi-hop QA)數據集費時費力!本文首次研究了無監督的多跳問答的可能性,提出了MQG-QA,一種無監督的框架,從同構和異構數據源中自動生成多跳問答對。使用生成的數據預先訓練QA系統將大大減少對人工標注訓練數據的需求。
多跳問答(QA)訓練數據的獲取是非常耗時費力的。為了解決這個問題,我們探索了無監督的多跳QA問答對生成的問題,可以在沒有標注的QA對場景下使用,非常的適合真實場景。
我們模型首先通過首先從每個數據源中選擇或生成相關信息,然后將多個信息整合起來,形成一個多跳問題。我們發現,用我們模型產生的訓練數據訓練出來的模型,性能和完全監督模型之間的F1差距較小。這個現象是非常激動人心的,表明我們可以通過無監督預的構造數據來大大減少對人工標注的訓練的需求。
下圖是該方法的簡易用法演示:
原文標題:【NAACL2021】初探無監督的多跳問答對
文章出處:【微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
人工智能
+關注
關注
1804文章
48677瀏覽量
246300
原文標題:【NAACL2021】初探無監督的多跳問答對
文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
評論