機(jī)器學(xué)習(xí)領(lǐng)域之間的知識(shí)遷移是現(xiàn)在AI中存在的一個(gè)重要問題。來自IBM Research的Kamil Rocki最近開發(fā)了一款“超級(jí)計(jì)算機(jī)”,每秒可處理10億幀,能幫助開發(fā)出更高效的機(jī)器學(xué)習(xí)算法和更強(qiáng)健的人工智能記憶。
總是有些聰明人,能解決那么棘手的問題。
機(jī)器學(xué)習(xí)算法能夠在最困難的棋盤游戲、經(jīng)典的電子游戲甚至一些現(xiàn)代游戲中戰(zhàn)勝人類。
但是它們?nèi)匀挥幸恍┖艽蟮木窒扌裕饕c“記憶”有關(guān)——或者更確切地說,與缺乏記憶有關(guān)。
在IBM Research從事人工智能研究的計(jì)算機(jī)科學(xué)家Kamil Rocki最近開發(fā)了一款“超級(jí)計(jì)算機(jī)”,用于從數(shù)千個(gè)虛擬Game Boy身上開發(fā)機(jī)器學(xué)習(xí)應(yīng)用程序。Rocki希望這個(gè)項(xiàng)目能幫助開發(fā)出更高效的機(jī)器學(xué)習(xí)算法和更強(qiáng)健的人工智能記憶。
不同ML領(lǐng)域間的知識(shí)遷移是難點(diǎn)
計(jì)算機(jī)科學(xué)家訓(xùn)練了一個(gè)人工神經(jīng)網(wǎng)絡(luò)(一種松散地以人腦為基礎(chǔ)的計(jì)算架構(gòu)),以便它能夠執(zhí)行特定的任務(wù),比如打敗特定的游戲。
然而,如果一個(gè)已經(jīng)掌握了俄羅斯方塊的神經(jīng)網(wǎng)絡(luò)想要學(xué)習(xí)一款更復(fù)雜的游戲,比如《超級(jí)馬里奧兄弟》,那么這個(gè)神經(jīng)網(wǎng)絡(luò)基本上是從零開始,無法利用它在俄羅斯方塊上的經(jīng)驗(yàn)更快地學(xué)習(xí)《超級(jí)馬里奧兄弟》。
Rocki的Game Boy計(jì)算集群是一個(gè)工具,他希望能夠借此幫助解決現(xiàn)在人工智能研究中的一個(gè)主要問題:機(jī)器學(xué)習(xí)領(lǐng)域之間的知識(shí)遷移。
2015年,谷歌的DeepMind證明了單個(gè)神經(jīng)網(wǎng)絡(luò)能夠掌握幾種不同的Atari 2600游戲。這是邁向神經(jīng)網(wǎng)絡(luò)記憶的一步,然而正如羅基在博客中描述他的“超級(jí)計(jì)算機(jī)”時(shí)所解釋的那樣,這些游戲在復(fù)雜性方面并沒有太大的差異。
《太空入侵者》的播放頻率為100MHz,是FPGA全速的四分之一。
在DeepMind的神經(jīng)網(wǎng)絡(luò)所掌握的大多數(shù)Atari游戲中,玩家與操縱桿的動(dòng)作及其在屏幕上的結(jié)果之間的關(guān)系都是通過即時(shí)反饋來明確的。
這與《波斯王子》(Prince of Persia)等游戲截然不同。在這些游戲中,玩家的行為可能不會(huì)立即產(chǎn)生反饋,而且屏幕上也不會(huì)一直顯示分?jǐn)?shù)。
Rocki在他的博客中解釋說,要用人工智能處理這些游戲,他覺得需要一個(gè)神經(jīng)網(wǎng)絡(luò),它必須能夠快速地進(jìn)行游戲,并且同時(shí)運(yùn)行幾個(gè)游戲。
Rocki寫道:“想象一下,你可以在百分之一的時(shí)間內(nèi)完成《波斯王子》,同時(shí)運(yùn)行10萬款游戲。”
神經(jīng)網(wǎng)絡(luò)還必須在一個(gè)游戲機(jī)上實(shí)現(xiàn)。
游戲機(jī)上有各種各樣的游戲可供選擇,這些游戲并不需要耗費(fèi)大量資源才能運(yùn)行,這樣才能測(cè)試它在更復(fù)雜游戲上使用先驗(yàn)知識(shí)的能力。
Rocki在他的研究中考慮了幾種不同的游戲機(jī),包括街機(jī)版的太空入侵者、Atari2600、任天堂娛樂系統(tǒng)(NES)和Game Boy Classic。
但問題是,這些系統(tǒng)中速度的峰值都是每秒3000幀。如果Rocki想真正提高機(jī)器學(xué)習(xí)的速度,他必須弄清楚如何在這些平臺(tái)上以每秒數(shù)億幀的速度運(yùn)行。
最終,Rocki決定使用Game Boy,因?yàn)樵撚螒驒C(jī)擁有超過1,000款可供選擇的游戲,在復(fù)雜性方面存在很多差異。 Game Boy Classic的160×144兩位(bit)彩色屏幕也易于處理,這使得運(yùn)行游戲的系統(tǒng)變得更加容易。
Rocki試圖根據(jù)自己的主觀判斷,通過游戲的復(fù)雜性來組織Game Boy游戲。像《太空入侵者》這樣的游戲在左邊,不那么復(fù)雜,而《Pokemon》和《波斯王子》則在右上角,更加復(fù)雜。
為此,Rocki在現(xiàn)場(chǎng)可編程門陣列(FPGA)中模擬了大多數(shù)游戲機(jī)核心的英特爾8080 CPU。FPGA是一種強(qiáng)大、專業(yè)的計(jì)算機(jī)芯片,可用于大規(guī)模模擬其他硬件。
例如,在最初的《太空入侵者》街機(jī)控制臺(tái)中使用的8080 CPU以每秒100萬次(1 MHz)的速度運(yùn)行。
然而,當(dāng)這個(gè)CPU在FPGA中模擬時(shí),它的時(shí)鐘頻率可高達(dá)400 MHz,這就像以每秒24,000幀的速度運(yùn)行游戲一樣。
不僅如此,單個(gè)FPGA一次可以模擬100個(gè)這樣的CPU,在單個(gè)FPGA芯片上每秒總共可以產(chǎn)生240萬幀。
Rocki在一封電子郵件中說,有1296個(gè)FPGA芯片連接在一起,每秒可以從數(shù)百個(gè)模擬Game Boys中產(chǎn)生大約10億幀。(理論上,這可以在50塊FPGA芯片上實(shí)現(xiàn),但Rocki說,他和同事們并沒有“把它們推到極限”。)
硬件加速的俄羅斯方塊,以100MHz的速度播放,大約是全速的四分之一。
正如Rocki在他的博客中所寫,使用他的Gameboy超級(jí)計(jì)算機(jī)進(jìn)行的測(cè)試到目前為止相當(dāng)成功。
他認(rèn)為這款工具是更廣泛的趨勢(shì)之一,在未來十年內(nèi)將AI算法與先進(jìn)的硬件解決方案相結(jié)合。
這可能最終會(huì)讓我們走上更強(qiáng)大的人工智能之路。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103594 -
超級(jí)計(jì)算機(jī)
+關(guān)注
關(guān)注
2文章
472瀏覽量
42472 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8503瀏覽量
134599
原文標(biāo)題:“Game Boy超級(jí)計(jì)算機(jī)”每秒處理10億幀,ML知識(shí)遷移不再是難題!
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
Blue Lion超級(jí)計(jì)算機(jī)將在NVIDIA Vera Rubin上運(yùn)行
NVIDIA技術(shù)賦能歐洲最快超級(jí)計(jì)算機(jī)JUPITER
樹莓派替代臺(tái)式計(jì)算機(jī)?樹莓派上七款最佳的輕量級(jí)操作系統(tǒng)!

BU-67121W實(shí)驗(yàn)室航空電子接口計(jì)算機(jī)North Hills
NVIDIA發(fā)布高性價(jià)比生成式AI超級(jí)計(jì)算機(jī)
云端超級(jí)計(jì)算機(jī)使用教程
虛擬內(nèi)存對(duì)計(jì)算機(jī)性能的影響
量子計(jì)算機(jī)與普通計(jì)算機(jī)工作原理的區(qū)別

【小白入門必看】一文讀懂深度學(xué)習(xí)計(jì)算機(jī)視覺技術(shù)及學(xué)習(xí)路線

評(píng)論