AAAI 2019今天公布最佳論文、最佳學生論文等獎項,在7745篇投稿論文、16.2%錄取率的競爭下,來自以色列理工學院、CMU、斯坦福和MIT的論文分別斬獲大獎,其中強化學習、零樣本學習尤其受到關注。
作為2019年人工智能學界的第一個頂會,AAAI 2019已經在美國夏威夷拉開了帷幕。
今年AAAI大會主席是AI、機器人研究領域著名專家、德州大學奧斯汀分校的Peter Stone教授 ,南京大學周志華教授、喬治亞理工大學Pascal Van Hentenryck教授是聯合程序主席。
早在大會開始前,周志華教授已經透露AAAI 2019的論文錄取率:16.2%,可以說是AAAI錄取率最低的一年。而且,今年的投稿數量高達7745篇,比去年翻了一番,創下AAAI歷史新高!
日前,AAAI 2019 最受矚目的各大獎項已經全部公布,包括最佳論文獎和最佳學生論文獎、經典論文獎、藍天創意獎、杰出教育家獎、Robert S. Engelmore紀念獎,Feigenbaum 獎等。
2019 AAAI經典論文獎
2019 AAAI經典論文獎授予了2002年在加拿大舉行的第18屆AAAI會議最具影響力的論文:
Content-Boosted Collaborative Filtering for Improved Recommendations
作者:Prem Melville, Raymond J. Mooney, Ramadass Nagarajan
作者機構:德克薩斯大學
論文地址:
https://www.cs.utexas.edu/~ml/papers/cbcf-aaai-02.pdf
這篇論文提出一種在推薦系統中補充基于內容和協同過濾方法的方法。
論文的第一作者Prem Melville將在1月29日上午11:30進行演講。
最佳論文獎(Outstanding Paper Award)
今年,AAAI的“Outstanding Paper Award”共提及4篇論文,其中最佳論文及提名、最佳學生論文及提名各有一篇,這些獎項將由大會程序主席Pascal Van Hentenryck和周志華在頒發。
AAAI-19 最佳論文獎
如何在強化學習中結合樹搜索方法(How to Combine Tree-Search Methods in Reinforcement Learning)
作者:Yonathan Efroni, Gal Dalal, Bruno Scherrer, Shie Mannor
機構:以色列理工學院,法國國家信息與自動化研究所(INRIA)
鏈接:https://arxiv.org/abs/1809.01843
最佳論文提名:
Solving Imperfect-Information Games via Discounted Regret Minimization
作者:Noam Brown, Tuomas Sandholm
機構:卡內基梅隆大學(CMU)
鏈接:https://arxiv.org/abs/1809.04040
AAAI-19最佳學生論文獎
Zero Shot Learning for Code Education: Rubric Sampling with Deep Learning Inference
作者:Mike Wu, Milan Mosse, Noah Goodman, Chris Piech
機構:斯坦福大學
鏈接:https://arxiv.org/abs/1809.01357
最佳學生論文獎提名:
Learning to Teach in Cooperative Multiagent Reinforcement Learning
作者:Shayegan Omidshafiei, Dong Ki Kim, Miao Liu(劉淼), Gerald Tesauro, Matthew Riemer, Chris Amato, Murray Campbell, Jonathan How
機構:MIT、IBM、美國東北大學
鏈接:https://arxiv.org/abs/1805.07830
CMU、斯坦福、MIT等摘獲最佳論文獎,強化學習最受關注
AAAI-19 最佳論文獎
如何在強化學習中結合樹搜索方法(How to Combine Tree-Search Methods in Reinforcement Learning)
作者:Yonathan Efroni, Gal Dalal, Bruno Scherrer, Shie Mannor
機構:以色列理工學院,法國國家信息與自動化研究所(INRIA)
論文簡介:
有限時域前瞻策略(Finite-horizon lookahead policies)已經在強化學習中得到廣泛應用,并取得了令人印象深刻的實證成果。通常,前瞻性策略是通過特定的規劃方法實現的,例如蒙特卡洛樹搜索(Monte Carlo Tree Search),AlphaZero正是應用了該方法。將規劃問題視為樹搜索,實現上的一種合理做法是只備份葉節點上的值,而根節點上獲得的信息只用于更新策略。
在這篇論文中,作者質疑了這種方法的有效性,認為后一過程通常是非收縮的,其收斂性沒有保證。
論文提出一種簡單明了的增強方法:使用最優樹路徑的返回值來備份根節點的后代的值。為了實現結果,作者引入一個稱為多步貪婪一致性(multiple-step greedy consistency)的概念。然后,在樹搜索階段和值估計階段同時注入噪聲的情況下,為上述增強方法的兩個算法實例提供收斂速度。
AAAI-19最佳學生論文獎
代碼教育的零樣本學習:深度學習推理的量規采樣(Zero Shot Learning for Code Education: Rubric Sampling with Deep Learning Inference)
作者:Mike Wu, Milan Mosse, Noah Goodman, Chris Piech
機構:斯坦福大學
論文簡介:
現代計算機科學教育中,大規模開放在線課程(MOOC)記錄了數千小時關于學生如何解決編碼挑戰的數據。由于數據豐富,這些平臺吸引了機器學習社區的興趣,許多新算法試圖自動提供反饋,以幫助未來的學生學習。但對于第一批學生呢?在大多數教育環境(如教室)中,沒有足夠的作業歷史數據來進行監督學習。
在這篇論文中,作者提出一種“human-in-the-loop”的“量規抽樣”(Rubric sampling)方法來解決“零樣本”反饋的挑戰。結果證明,該方法能夠為第一批學生的入門編程作業提供自主反饋,其準確性大大優于依賴大量數據的算法,甚至接近人類水平。
Rubric sampling只需要最少的教師工作量,能夠將反饋與學生答案的特定部分聯系起來,并能夠用教師的語言清晰地解答學生的錯誤。隨著更多特定于作業的學生數據可獲取,深度學習推理使得Rubric sampling方法的效果能夠進一步提高。作者使用Code.org(世界最大的編程教育平臺)的一個新數據集證明了他們的結果。
最佳論文獎提名:
Solving Imperfect-Information Games via Discounted Regret Minimization
作者:Noam Brown, Tuomas Sandholm
機構:卡內基梅隆大學(CMU)
這篇論文的兩位作者分別是CMU計算機系博士生Noam Brown,以及該校計算機系教授Tuomas Sandholm。這兩位也是去年的著名的***AI程序“冷撲大師”(Libratus)的締造者,堪稱***AI之父。論文通過***基準平臺來探討不完全信息條件下的博弈策略問題。
論文簡介:
反事實后悔最小化(CFR)是目前最熱門一系列迭代算法,在實際應用中,也是近似解決大型不完美信息博弈問題的最快方法。在本文中,我們介紹了新的CFR變體。分別為:
1)以多種方式從先前的迭代中將后悔程度實現縮減(在某些情況下,對正向和負向后悔采用不同處理方式),
2)以多種方式對迭代進行重新加權,獲得輸出策略,
3)使用非標準后悔最小化和/或
4)利用“樂觀后悔匹配”方式。這可以在許多環境下顯著提高性能。
首先,我們在每個測試的游戲中引入一個優于CFR +(一種之前的最先進的算法)的變體,包括大規模的現實設置。 CFR +是一個強大的基準:目前沒有其他算法能夠超越它。最后,我們表明,與CFR +不同,許多重要的算法的新變體與現代不完美信息博弈修剪技術兼容,也與博弈樹中的采樣兼容。
最佳學生論文獎提名:
Learning to Teach in Cooperative Multiagent Reinforcement Learning
作者:Shayegan Omidshafiei, Dong Ki Kim, Miao Liu(劉淼), Gerald Tesauro, Matthew Riemer, Chris Amato, Murray Campbell, Jonathan How
機構:MIT、IBM、美國東北大學
集體人類知識顯然因為個人創新通過交流向其他人流動這一事實而獲益。與人類社會群體類似,分布式學習系統中的智能體也可能會從彼此交流中受益,實現分享知識和教授技能。先前的研究成果已經在關注改進智能體學習的教學問題,但是這些方法所基于的假設,讓這些教學上的應用無法用在一般的多智能體問題上,或者還需要領域內專業知識來解決關于應用范圍的問題。這種學習教學問題存在固有的復雜性,與量度教學質量和效果的長期影響密切相關,給標準化多智能體共同教學問題造成了更大的挑戰。
與現有研究相比,本文提出了智能體在多智能體環境中進行教學的首個通用的框架和算法。我們的算法(LeCTR)解決了合作多智能體強化學習中的點對點教學問題。我們的方法中的每個智能體都會學習在何時何地提出建議,然后利用收到的建議來改善學習效果。重要的是,這些智能體的角色并不固定,智能體能夠學會在適當的時刻承擔學生和/或教師的角色,發出請求并提供建議,以提高整個團隊的表現。與目前最先進的教學方法的實證比較表明,我們的教學智能體不僅學得更快,而且可以學會協調用現有方法無法完成的任務。
其他大獎:藍天獎、Feigenbaum 紀念獎等
AAAI-19藍天創意獎(AAAI-19 Blue Sky Idea Awards)
AAAI與計算機研究協會計算社區聯盟(CCC)合作,宣布三篇獲獎論文,這些論文提出了可以激發研究界追求新方向的想法和愿景,比如提出了新問題、新應用領域或新方法。獲獎者分別是:
第一名:Pat Langley 獲獎論文:Explainable, Normative, and Justified Agency
第二名:Francesca Rossi和Nicholas Mattei 獲獎論文:Building Ethically Bounded AI
第三名: Barry Smyth,獲獎論文Recommender Systems: A Healthy Obsession
2019 AAAI/EAAI杰出教育家獎
AAAI / EAAI杰出教育家獎旨在表彰為人工智能教育做出重大貢獻、為人工智能社區實現長期利益的個人或團體。 2019年AAAI / EAAI杰出教育家獎頒給佐治亞理工學院的Ashok Goel,以表彰他持續卓越的教學貢獻,利用AI技術來教授AI技術的創新,采用科學實驗和獎學金來評估和改進AI的教學方法,以及他向整個社區分享的大量資源。該獎項由AAAI和人工智能教育進展研討會(Symposium on Educational Advances in Artificial Intelligence)聯合贊助。
2019年羅伯特·S·恩格爾莫爾紀念獎
羅伯特·S·恩格爾莫爾(Robert S. Engelmore)紀念獎由IAAI-19和AI Magazine贊助,由IAAI-19主席Karen Myers和AI Magazine主編Ashok Goel主持。 該獎項于2003年設立,旨在紀念羅伯特·S·恩格爾博士為AAAI、AI雜志和AI應用社區的卓越貢獻,以及他對應用AI期刊的貢獻。 2019年的獎項將頒發給南加州大學的Milind Tambe團隊,以表彰他們在多智能體系統領域的杰出貢獻,以及在解決具有重大社會意義的問題上的應用。
Feigenbaum獎
AAAI Feigenbaum獎旨在表彰和鼓勵通過計算機科學實驗方法取得的杰出的AI研究進展。 2019年的AAAI Feigenbaum獎項授予加州大學伯克利分校的Stuart Russell,以表彰他通過創新和概率知識表示,推理和學習的成就對AI領域的具有廣泛影響力貢獻。 Feigenbaum獎由Feigenbaum Nii基金會資助。
-
人工智能
+關注
關注
1804文章
48677瀏覽量
246380 -
論文
+關注
關注
1文章
103瀏覽量
15133 -
強化學習
+關注
關注
4文章
269瀏覽量
11515
原文標題:AAAI 2019最佳論文公布,CMU、斯坦福、MIT上榜
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
后摩智能四篇論文入選三大國際頂會
新思科技如何重塑未來的設計
美報告:中國芯片研究論文全球領先
從OpenVINO? 2019_R3下載的face-detection-retail-0004模型,運行時報錯怎么解決?
小華半導體2025年經銷商合作會議成功召開
中國電提出大模型推理加速新范式Falcon

港大提出SparX:強化Vision Mamba和Transformer的稀疏跳躍連接機制

評論