ICML ( International Conference on Machine Learning),國際機(jī)器學(xué)習(xí)大會如今已發(fā)展為由國際機(jī)器學(xué)習(xí)學(xué)會(IMLS)主辦的年度機(jī)器學(xué)習(xí)國際頂級會議。今天,第35屆 ICML 大會在瑞典的斯德哥爾摩正式召開,與大家一同分享這一領(lǐng)域在這一年里的突破。ICML 2018 共有 2473 篇論文投稿,共有 621 篇論文殺出重圍入選獲獎名單,接受率接近25%。其中 Google 強(qiáng)勢領(lǐng)跑,Deep Mind 、FaceBook和微軟也是精彩紛呈;而在高校中 UC Berkeley 和 Stanford 、CMU 以近 30 篇榮登 Top 榜。
而今年不得不說咱們國內(nèi)的成績,雖然清華被收錄了 12 篇,相比之下還是有差距,不過相比往年的數(shù)量和今年如此激烈的競爭下,進(jìn)步是不可忽視的,尤其是今年復(fù)旦大學(xué)的一篇論文與 DeepMind、斯坦福大學(xué)的兩篇論文一同獲得 Runner Up 獎,騰訊 AI Lab 也是有超十篇論文被收錄,都讓我們對國內(nèi)研究抱有更多的期待,也相信國內(nèi)的研究所與高校在人工智能領(lǐng)域的基礎(chǔ)性研究方面會取得更驕人的成績。
▌會議巡講 Schedule
Tutorial Session 是后續(xù)主要技術(shù)開始前的教程日
后續(xù)三天就是主要技術(shù)的精彩紛呈,涉及了深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、有限學(xué)習(xí)、變分貝葉斯、優(yōu)化方法、自動機(jī)器學(xué)習(xí)等內(nèi)容。
▌?wù)撐氖占?/p>
最佳論文1:來自 MIT 的 Anish Athalye 與來自 UC Berkely 的 Nicholas Carlini 和 David Wagner 獲得了最佳論文。該研究定義了一種被稱為「混淆梯度」(obfuscated gradients)的現(xiàn)象。在面對強(qiáng)大的基于優(yōu)化的攻擊之下,它可以實現(xiàn)對對抗樣本的魯棒性防御。早在今年 2 月,這項研究攻破了 ICLR 2018 七篇對抗樣本防御論文的研究,曾一度引起了深度學(xué)習(xí)社區(qū)的熱烈討論。
論文鏈接:
https://arxiv.org/abs/1802.00420
項目鏈接:
https://github.com/anishathalye/obfuscated-gradients
最佳論文2:來自 UC Berkeley EECS 的 Lydia T. Liu、Sarah Dean、Esther Rolf、Max Simchowitz 和 Moritz Hardt 的論文同樣也獲得了最佳論文獎。在這個研究中,關(guān)注機(jī)器學(xué)習(xí)公平性的靜態(tài)分類標(biāo)準(zhǔn)如何與暫時的利益指標(biāo)相互作用。總結(jié)了三個標(biāo)準(zhǔn)準(zhǔn)則的延遲影響,強(qiáng)調(diào)評估公平性準(zhǔn)則的度量和時序建模的重要性等一系列的新挑戰(zhàn)和權(quán)衡問題。
論文鏈接:
https://arxiv.org/abs/1803.04383
▌Runner Up 論文
Runner UP 論文1:復(fù)旦大學(xué)數(shù)據(jù)科學(xué)學(xué)院副教授黃增峰完成的在線流(online streaming)算法與 DeepMind、斯坦福大學(xué)的兩篇論文共同獲得 Runner Up 獎。在該論文討論的這種在線流算法可以在只有非常小的協(xié)方差誤差的情況下,從大型矩陣抽取出最能近似它的小矩陣。
論文地址:
http://203.187.160.132:9011/www.cse.ust.hk/c3pr90ntc0td/~huang***/ICML18.pdf
Runner UP 論文2:來自 DeepMind 和牛津大學(xué)的研究者在研究中開發(fā)了新的技術(shù)來理解和控制一般博弈中的動態(tài)。主要的結(jié)果是將二階動態(tài)分解為兩個部分。第一個和潛博弈(potential game)相關(guān);第二個和哈密頓博弈相關(guān),這是一種新的博弈類型,遵循一種守恒定律——類似于經(jīng)典力學(xué)系統(tǒng)中的守恒定律。
論文地址:
https://arxiv.org/abs/1802.05642
Runner UP 論文3:來自斯坦福大學(xué)的研究者在研究中首先展示了為解決經(jīng)驗風(fēng)險最小化(ERM)使最初公平的模型也變得不公平了這一問題,提出了一種基于分布式魯棒優(yōu)化(distributionally robust optimization,DRO)的方法,可以最小化所有分布上的最大風(fēng)險,使其接近經(jīng)驗分布。
論文地址:
https://arxiv.org/abs/1806.08010
頒發(fā)的兩項最佳論文獎來表彰一些最有前途的論文技術(shù)方案的研究。最好的論文還將被邀請參加《機(jī)器學(xué)習(xí)雜志》。
▌國內(nèi)未來可期
而今年騰訊 AI Lab也是取得了十余篇入選的好成績,相比去年的 4 篇入選,這個成績不僅是國內(nèi)企業(yè)研究、高校研究的榜首,在國際排名上也是有了很大的進(jìn)步。
在十余篇的研究中,主要分為三類:新模型與新框架、分布式與去中心化及機(jī)器學(xué)習(xí)的理論研究與優(yōu)化方法。本次為大家介紹三種新模型與新框架。
用于強(qiáng)化學(xué)習(xí)的基于反饋的樹搜索
研究者還使用深度神經(jīng)網(wǎng)絡(luò)實現(xiàn)了這種基于反饋的樹搜索算法并在《王者榮耀》1v1 模式上進(jìn)行了測試。為了進(jìn)行對比,研究者訓(xùn)練了 5 個操控英雄狄仁杰的智能體,結(jié)果他們提出的新方法顯著優(yōu)于其它方法。
論文鏈接:
https://arxiv.org/abs/1805.05935
通過學(xué)習(xí)遷移實現(xiàn)遷移學(xué)習(xí)
遷移學(xué)習(xí)的三個核心研究問題是:何時遷移、如何遷移和遷移什么。為特定的遷移任務(wù)選擇合適的遷移算法往往需要高成本的計算或相關(guān)領(lǐng)域的專業(yè)知識。為了能更有效地找到適合當(dāng)前任務(wù)的遷移算法,研究者根據(jù)人類執(zhí)行遷移學(xué)習(xí)的方式,設(shè)計了一種可根據(jù)之前的遷移學(xué)習(xí)經(jīng)歷提升新領(lǐng)域之間的遷移學(xué)習(xí)有效性的新框架:學(xué)習(xí)遷移(L2T:Learning to Transfer)。
論文地址:
https://ai.tencent.com/ailab/media/publications//icml/148_Transfer_Learning_via_Learning_to_Transfer.pdf
通過強(qiáng)化學(xué)習(xí)實現(xiàn)端到端的主動目標(biāo)跟蹤
目標(biāo)跟蹤的目標(biāo)是根據(jù)視頻的初始幀中的目標(biāo)標(biāo)注定位該目標(biāo)在連續(xù)視頻中的位置。對于移動機(jī)器人和無人機(jī)等視角會變動的平臺或目標(biāo)會離開當(dāng)前拍攝場景的情況,跟蹤目標(biāo)時通常還需要對攝像頭的拍攝角度進(jìn)行持續(xù)調(diào)整。該論文提出了一種使用強(qiáng)化學(xué)習(xí)的端到端的主動目標(biāo)跟蹤方法,可直接根據(jù)畫面情況調(diào)整攝像頭角度。具體而言,研究者使用了一個 ConvNet-LSTM 網(wǎng)絡(luò),其輸入為原始視頻幀,輸出為相機(jī)運動動作(前進(jìn)、向左等)。
上圖展示了這個 ConvNet-LSTM 網(wǎng)絡(luò)的架構(gòu),其中的強(qiáng)化學(xué)習(xí)部分使用了一種當(dāng)前最佳的強(qiáng)化學(xué)習(xí)算法 A3C。因為在現(xiàn)實場景上訓(xùn)練端到端的主動跟蹤器還無法實現(xiàn),所以研究者在 ViZDoom 和 Unreal Engine 進(jìn)行了模擬訓(xùn)練。
論文地址:
https://arxiv.org/abs/1705.10561
更多詳細(xì)論文解讀可以參考學(xué)習(xí):
https://ai.tencent.com/ailab/paper-list.html
https://mp.weixin.qq.com/s/xpX7eDG5ivk8ZYRjAEsH5g
▌國外大咖云集
Google AI & Deep Mind
這個數(shù)量多到不知道幾時營長才能給大家推薦完,無論是機(jī)器學(xué)習(xí)理論,深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、經(jīng)典算法都有研究,利用架構(gòu)與工具在語音、語言、翻譯、音樂、視覺處理等領(lǐng)域也都有解決的的問題與挑戰(zhàn)。只能說 Google 真是高度活躍在方方面面,有質(zhì)有量,不愧是本屆大會的白金贊助商。屆時 Google 還將與大家分享 TensorFlow、Magenta等項目的最新工作,開展有關(guān)機(jī)器學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等相關(guān)專題研討會。DeepMind 于近日提出的多智能體的教程也將會在大會于大家進(jìn)行分享,營長也在上周為大家介紹過這個最新研究。
Google 論文收錄與研討會:
https://ai.googleblog.com/2018/07/google-at-icml-2018.html?m=1
Deep Mind 論文收錄與研討會:
https://deepmind.com/blog/deepmind-papers-icml-2018
Microsoft
本屆 ICML 大會微軟通過26篇論文,一個個人健康機(jī)器學(xué)習(xí)的教程與兩個研討會;研究中涉及通過緊湊的潛在空間聚類進(jìn)行半監(jiān)督學(xué)習(xí)、提出 Katyusha X 的簡單動量方法、GAN、SBEED(收斂強(qiáng)化學(xué)習(xí))、探索加速 CNN 的隱藏維度、增強(qiáng) CycleGAN等理論與算法的研究。兩個研討會的主題分別關(guān)于個性化AI 與 FAIM‘18 Causal ML。
Microsoft 論文收錄與研討會:
https://deepmind.com/blog/deepmind-papers-icml-2018
FaceBook 收錄作品的數(shù)量與 Google、DeepMind 、微軟相比較少,不過在神經(jīng)機(jī)器翻譯、人工智能代理、強(qiáng)化學(xué)習(xí)、語音、端到端的對話模型、GAN及多智能體的強(qiáng)化學(xué)習(xí)等領(lǐng)域也都有出色的研究。在強(qiáng)化學(xué)習(xí)中引入 SCAL 算法并證明顯著優(yōu)于現(xiàn)有的 UCRL、PSRL 等算法;在具有 Attention 機(jī)制的RNN網(wǎng)絡(luò)中很多使用簡單形式的編碼器,F(xiàn)acebook 在研究中提出了一種聚焦 RNN 編碼器的機(jī)制,用于序列建模任務(wù),用于根據(jù)需要關(guān)注輸入的關(guān)鍵部分,在合成任務(wù)上有更好的改進(jìn);在多智能體的強(qiáng)化學(xué)習(xí)中提出 SOM (Self Other-Modeling)的方法,在三個不同任務(wù)上評估此方法,表明代理能夠在合作與對抗環(huán)境中使用它們對其他玩家隱藏狀態(tài)的估計來學(xué)習(xí)更好的策略。除了理論研究、方法的創(chuàng)新,在本屆大會,F(xiàn)acebook 也組織了一場研討會,和大家一起一起探討在強(qiáng)化學(xué)習(xí)中的預(yù)測模型與強(qiáng)化模型。
Facebook 論文收錄與研討會:
https://research.fb.com/facebook-research-at-icml-2018
▌結(jié)束語
直播已經(jīng)開始,營長先去前方為大家收集情況,精彩內(nèi)容后續(xù)為大家報道。點擊閱讀原文可獲取直播鏈接。
最后為大家精心整理本次大會的時間表、收錄論文地址及工作坊&研討會概述,只需此一文在手,收盡 ICML 大會所有。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4812瀏覽量
103212 -
人工智能
+關(guān)注
關(guān)注
1805文章
48899瀏覽量
247951 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8499瀏覽量
134330
原文標(biāo)題:ICML進(jìn)行時 | 一文看盡獲獎?wù)撐募癎oogle、Facebook、微軟、騰訊的最新科研成果
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
四維圖新旗下六分科技與航天世源達(dá)成全面戰(zhàn)略合作
SOLIDWORKS科研版?面向?qū)W術(shù)界的解決方案

天馬微電子亮相2025國際顯示技術(shù)大會
激光 PID 控制器的工作原理與優(yōu)勢
智芯公司榮獲中國電子學(xué)會科技進(jìn)步一等獎

華為智算實驗室解決方案助力科研創(chuàng)新高質(zhì)量發(fā)展
入駐眾多科研機(jī)構(gòu),優(yōu)可測白光干涉儀助力前沿成果發(fā)布

祝賀!億達(dá)科創(chuàng)榮獲高交會“優(yōu)秀科研成果創(chuàng)新獎”

中科曙光鑄穩(wěn)算力底座,賦能科研成果落地
Dell PowerScale數(shù)據(jù)湖助力醫(yī)研一體化建設(shè)
海康微影DV式手持測溫?zé)嵯駜x助力提升科研效率
逐際動力發(fā)布全尺寸人形機(jī)器人CL-2
激勵科研人員使用中國自主量子計算機(jī)!“本源悟空”啟動卓越論文獎勵計劃

Aigtek安泰電子論文獎勵政策再升級,激勵科研創(chuàng)新未來可期!

評論