讓我們想象一下:只要在心里浮現(xiàn)出某個(gè)人物或風(fēng)景,就能從一堆數(shù)碼照片中把它搜索出來(lái)。或者不用動(dòng)筆就能畫(huà)出一個(gè)新的廚房設(shè)計(jì)。又或者給心愛(ài)的人發(fā)送一張想象中的落日照片。一臺(tái)能讀懂你的心思的電腦會(huì)有很多用處,更不用說(shuō)對(duì)于那些癱瘓的、無(wú)法正常與人交流的人。如今,科學(xué)家們已經(jīng)創(chuàng)造出了來(lái)解釋和準(zhǔn)確地再現(xiàn)一個(gè)人所看到的或想象的圖像的算法。這項(xiàng)技術(shù)可能還需要幾十年的時(shí)間才能有實(shí)際應(yīng)用,但科學(xué)家們離建立起能夠幫助我們投射內(nèi)心的系統(tǒng)更近了一步。
“我很驚訝它能運(yùn)轉(zhuǎn)得這么好,”來(lái)自印第安納州西拉斐特普渡大學(xué)(Purdue University)的計(jì)算機(jī)科學(xué)家劉中明(音)說(shuō)。他幫助開(kāi)發(fā)了一種算法,可以在一定程度上再現(xiàn)觀眾在看電影時(shí)看到的畫(huà)面。“這真的很酷。”
使用算法來(lái)解碼心智圖像并不稀奇(mental images, 即我們從記憶中提取曾儲(chǔ)存的視覺(jué)信息時(shí),腦海中重現(xiàn)的影像)。自 2011 年以來(lái),研究人員通過(guò)把當(dāng)下的大腦活動(dòng)與之前觀看圖像時(shí)檢測(cè)到的大腦活動(dòng)相匹配的方法,再現(xiàn)了電影片段、照片,甚至夢(mèng)境圖像。但這些方法都有其局限性:有些只處理很簡(jiǎn)單的圖像類別,比如臉型,而有些則必須從預(yù)先編程的圖像諸如“人”或“鳥(niǎo)”之類的類別中進(jìn)行選擇。
最新的這種算法則可以在線機(jī)動(dòng)生成可辨認(rèn)的圖像,甚至可以重現(xiàn)那些沒(méi)親眼見(jiàn)過(guò)、想象出來(lái)的畫(huà)面。
為了弄清楚一個(gè)人在看什么,研究人員首先進(jìn)行了功能性磁共振成像(fMRI)測(cè)試,它能通過(guò)測(cè)量大腦血液流動(dòng)間接監(jiān)控神經(jīng)活動(dòng)。他們找來(lái)三個(gè)被試,讓他們每人觀看了超過(guò) 1000 張的圖片,每張圖片看多次,通過(guò)這種方式將大腦視覺(jué)處理區(qū)域的活動(dòng)繪制成了分辨率為 2 毫米的“地圖”,作為參考。他們的目標(biāo)是,找到大腦看見(jiàn)某圖像時(shí)產(chǎn)生的應(yīng)答活動(dòng),比如一只獵豹,并最終讓計(jì)算機(jī)繪制出一幅幾乎相同的圖像。
但是,研究小組并不是給實(shí)驗(yàn)對(duì)象一幅接一幅地展示畫(huà),直到電腦正確地模擬出來(lái),而是建立了代替大腦的系統(tǒng),深度神經(jīng)網(wǎng)絡(luò)(deep neural network ,DNN),它由幾層簡(jiǎn)單的處理元素組成。該研究的通訊作者、日本京都大學(xué)的神經(jīng)學(xué)家神谷之康(Yukiyasu Kamitani)說(shuō):“我們認(rèn)為,深度神經(jīng)網(wǎng)絡(luò)完全可以代表大腦的分層處理系統(tǒng)。”
“通過(guò)使用 DNN,我們可以從大腦視覺(jué)系統(tǒng)的不同層次提取信息,”從簡(jiǎn)單的明暗對(duì)比到更有意義的內(nèi)容,比如不同的人臉。
使用“解碼器”,研究人員創(chuàng)造了大腦對(duì)圖像的反應(yīng),但這些都儲(chǔ)存在深度神經(jīng)網(wǎng)絡(luò) DNN 中。如此一來(lái),他們便不再需要實(shí)際的 fMRI 數(shù)據(jù),僅僅需要 DNN 的翻譯。
在猜測(cè)別人在看什么時(shí),翻譯的內(nèi)容將作為模板,而 fMRI 數(shù)據(jù)則不再重要。系統(tǒng)隨后將嘗試?yán)L制一幅圖,這幅圖會(huì)激發(fā) DNN 以匹配該模板的方式進(jìn)行響應(yīng)。它通過(guò)不斷地試錯(cuò),直到描繪出理想的圖像,無(wú)論是獵豹、鴨子,還是彩色玻璃窗。這個(gè)系統(tǒng)從一些隨機(jī)的東西開(kāi)始,類似于電視屏幕上的雪花,接著在 200 次的嘗試過(guò)程中慢慢地改進(jìn)它的圖像。為了更接近理想圖像,系統(tǒng)計(jì)算了 DNN 活動(dòng)和模板化 DNN 活動(dòng)之間的差異。這些計(jì)算引導(dǎo)系統(tǒng)不斷調(diào)整像素的位置,直到接近理想圖像。
為了使最終的產(chǎn)品更加準(zhǔn)確,研究人員加入了一個(gè)“深度發(fā)生器網(wǎng)絡(luò)”(deep generator network, DGN)。這個(gè)算法已經(jīng)經(jīng)過(guò)了預(yù)先訓(xùn)練,可以根據(jù)它的輸入生成逼真的圖像。DGN 讓算法重現(xiàn)的畫(huà)看起來(lái)更自然。研究人員在上月末發(fā)表的一篇預(yù)印本論文中稱,一旦添加了這一功能,人們就能第一時(shí)間分辨出兩張照片中的哪一幅是想要被重現(xiàn)的,成功率高達(dá) 99%。
接下來(lái),科學(xué)家們?cè)噲D解讀出人們想象中的圖片。這一次,他們掃描了三名受試者的大腦,要求他們回憶之前展示過(guò)的圖像,包括魚(yú)、飛機(jī)和簡(jiǎn)單的彩色圖形。這個(gè)方法不能完好地展示出圖像,但是對(duì)于形狀,生成器創(chuàng)建出一個(gè)可識(shí)別的圖像的概率是 83%。
這是“有趣而細(xì)致的研究”,哥倫比亞大學(xué)扎克曼研究所的計(jì)算神經(jīng)學(xué)家尼克拉斯克里奇斯科特(Nikolaus Kriegeskorte)說(shuō)。他想知道計(jì)算機(jī)生成圖像的不準(zhǔn)確性在多大程度上是由于大腦活動(dòng)測(cè)量手段的限制,以及它們?cè)诙啻蟪潭壬戏从沉宋覀兊拇竽X對(duì)圖像解讀時(shí)的錯(cuò)誤。他說(shuō):“更高分辨率的核磁共振成像和其他腦成像技術(shù)可能會(huì)進(jìn)一步完善結(jié)果。”通過(guò)對(duì)測(cè)量和算法進(jìn)行持續(xù)的改進(jìn),我們也許有一天能通過(guò)大腦中的心像進(jìn)行交流。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103441 -
算法
+關(guān)注
關(guān)注
23文章
4708瀏覽量
95271 -
圖像
+關(guān)注
關(guān)注
2文章
1094瀏覽量
41199 -
AI
+關(guān)注
關(guān)注
88文章
35008瀏覽量
278804
原文標(biāo)題:AI時(shí)代的高科技讀心術(shù):算法解碼腦中圖像
文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
深圳人形機(jī)器人行走視頻震驚英偉達(dá)科學(xué)家,下一個(gè)劃時(shí)代產(chǎn)品是AI機(jī)器人?

利用NVIDIA 3D引導(dǎo)生成式AI Blueprint控制圖像生成
地物光譜儀如何幫助科學(xué)家研究植被和土壤?

我國(guó)科學(xué)家制備出可控手性石墨烯卷
開(kāi)源項(xiàng)目!OpenCat—— 一個(gè)全能的平價(jià)四足機(jī)器人
視美泰聯(lián)合小冰打造全新“AI數(shù)字人工廠”

西湖大學(xué):科學(xué)家+AI,科研新范式的樣本

螞蟻集團(tuán)收購(gòu)邊塞科技,吳翼出任強(qiáng)化學(xué)習(xí)實(shí)驗(yàn)室首席科學(xué)家
AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感
《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得
《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得
SK海力士為未來(lái)AI系統(tǒng)打造的新一代存儲(chǔ)器
上海科學(xué)家精準(zhǔn)操控原子“人造”藍(lán)寶石 為低功耗芯片研制開(kāi)辟新路
受人眼啟發(fā)!科學(xué)家開(kāi)發(fā)出新型改良相機(jī)

評(píng)論