來自查爾默斯大學和哥德堡大學的跨學科研究團隊開發了一個框架,用于研究語言如何演變為描述心理概念的有效工具。在一篇新論文中,他們表明,人工代理可以學習如何以類似于人類語言的人工語言進行交流。該結果已發表在科學雜志《PLOS ONE》上。
這項研究位于認知科學和機器學習之間的邊界。認知科學家提出了一個有影響力的建議,即所有人類語言都可以看作是進化成為一種以經典信息論的意義以接近最優的方式傳達概念的手段。哥德堡研究人員訓練人工代理的方法是基于強化學習的,強化學習是機器學習的一個領域,代理通過與環境交互并獲得反饋逐漸學習。在這種情況下,代理人在沒有任何語言知識的情況下開始學習,并通過獲取有關他們在傳達思想觀念方面的成功程度的反饋來學習交流。
重建色彩
“在我們的論文中,我們研究了代理商如何通過打幾輪由發送者和聽者組成的參考游戲來學習命名心理概念和進行交流。我們特別關注了在認知科學中已深入研究的色域。游戲的工作方式如下;發送方看到一種顏色,并通過從詞匯表向聽眾說出一個單詞來描述顏色,然后嘗試重建顏色。
根據收聽者重建的精確程度,這兩個代理都會收到共享的獎勵。詞匯表中的單詞一開始就沒有意義;在游戲的多個回合中,由代理商決定單詞的含義。我們看到,從信息論的角度來看,由此產生的人工語言幾乎是最優的,并且具有與人類語言相似的特性。” Sleepcycle研究人員MikaelK?geb?ck說,他在Chalmers的博士學位論文中包含了一些結果在論文中提出。
與哥德堡大學語言理論和概率研究中心(CLASP)計算機語言學研究人員Asad Sayeed以及教授Devdatt Dubhashi和Emil Carlsson博士一起。他是計算機科學與工程系數據科學和AI部門的學生,現在已經發表了結果。
Asad Sayeed說:“從實際的角度來看,這項研究提供了開發與人類語言進行交流的對話主體(例如Siri和Alexa)的基本原理。”
通過強化學習來學習交流的基本思想對于社會和文化領域的研究也很有趣,例如,由阿薩德·薩耶德(Asad Sayeed)領導的GRIPES項目,該項目研究狗舌政治。
在將來的研究中有用
“認知實驗非常耗時,因為您經常需要對人類志愿者進行仔細的實驗。我們的方法提供了一種非常強大,靈活且廉價的方法來研究這些基本問題。實驗完全在我們的控制之下,可重復且完全可靠因此,我們的計算框架為研究認知科學,語言和交互作用中的基本問題提供了一種有價值的工具。對于計算機科學家來說,探索各種學習機制的有效性是一個肥沃的領域。” Devdatt Dubhashi說。
Emil Carlsson說:“將來,我們要調查代理商是否也可以在其他領域發展類似于人類語言的交流。一個例子就是我們的代理商是否能夠重構我們在人類語言中觀察到的等級結構。”
長期存在的問題
該研究源于認知科學和語言學一個長期存在的中心問題:在人類語言的所有巨大多樣性中,是否存在共同的普遍原則。20世紀的經典作品表明,用不同的語言來描述顏色具有共同的特性。是否有解釋這些共同屬性的基本原則?
認知科學家最近提出的一項有影響力的建議是,從信息論的角度來看,當語言被視為一種交流思想概念,最有效地利用資源的手段時,確實存在著這樣的普遍通用原則。
麻省理工學院的特德·吉布森(Ted Gibson)于2016年在CLASP上發表了一系列演講,他在演講中描述了從世界各地不同社會和文化中選出的人類受試者的實驗結果,從而引發了一個問題:“如果人類受試者被人造計算機替代,將會怎樣代理,他們會開發一種具有類似通用屬性的語言嗎?”
責任編輯:tzh
-
計算機
+關注
關注
19文章
7660瀏覽量
90752 -
AI
+關注
關注
88文章
35093瀏覽量
279528 -
機器學習
+關注
關注
66文章
8501瀏覽量
134580
發布評論請先 登錄
NVIDIA Isaac Lab可用環境與強化學習腳本使用指南

18個常用的強化學習算法整理:從基礎方法到高級模型的理論技術與代碼實現

詳解RAD端到端強化學習后訓練范式

DAC1282的正弦波模式有什么用處?
【「具身智能機器人系統」閱讀體驗】+初品的體驗
zeta在機器學習中的應用 zeta的優缺點分析
螞蟻集團收購邊塞科技,吳翼出任強化學習實驗室首席科學家
什么是機器學習?通過機器學習方法能解決哪些問題?

NPU與機器學習算法的關系
如何使用 PyTorch 進行強化學習
人工智能、機器學習和深度學習存在什么區別

評論