近期,加州大學(xué)洛杉磯分校的研究人員利用深度卷積網(wǎng)絡(luò)(DCNN)在對象分類方面取得了較大的突破,但他們還發(fā)現(xiàn),AI與人類識物的方式是完全不同的:人類更傾向于根據(jù)物體的全局信息進行分類,而機器卻對物體的局部信息敏感。
識別,是人類智能的重要組成部分。如果機器能夠比人類更快速的做到識別,其意義將是非常深遠(yuǎn)的。
然而,人類和機器識別事物的方式截然不同。
拿上圖舉例,對于圖(a)來說,人類能夠很快分辨出是一只熊,在速度和準(zhǔn)確性方面都遠(yuǎn)超于機器;但是對于圖(b),機器算法能夠?qū)⑵錃w類為熊,而人類可能看上半天都無法識別是什么。
雖然目前在通過機器算法識別事物方面已經(jīng)有了一些突破性進展,但即便是最先進的算法、技術(shù),也可能認(rèn)錯事物:例如將電視機中的靜態(tài)畫面或者抽象的圖畫,誤認(rèn)為是真實世界中的事物。
這些困難很大程度上是難以消除的,因為我們對這些神經(jīng)網(wǎng)絡(luò)如何“看”和“識別”事物沒有很好的理解。
最近,加州大學(xué)洛杉磯分校的研究人員在PLOS computing Biology上發(fā)表了一篇文章,這項研究正在測試神經(jīng)網(wǎng)絡(luò),以了解它們的視覺極限以及計算機視覺和人類視覺之間的差異。
論文地址:
https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1006613#sec001
他們提出了一種名為VGG-19的深度卷積神經(jīng)網(wǎng)絡(luò)。這是最先進的技術(shù),在ImageNet大規(guī)模視覺識別挑戰(zhàn)等標(biāo)準(zhǔn)化測試中已經(jīng)超越了人類。
并且還發(fā)現(xiàn):人類更傾向于根據(jù)物體的全局信息進行分類,而機器卻對物體的局部信息敏感。
這一結(jié)果將有助于解釋為什么神經(jīng)網(wǎng)絡(luò)在圖像識別中會犯人類從未犯過的錯誤。
識別方式不同,使得AI擅于紋理識物,弱于輪廓
在第一個實驗中,訓(xùn)練神經(jīng)網(wǎng)絡(luò)將圖像整理分類,歸入1000個不同的類別。
然后呈現(xiàn)出只有輪廓的圖像:所有的局部信息都丟失了,只留下物體的輪廓。
如果你能選對其中一個,你就比最先進的圖像識別軟件強多了。
通常情況下,經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)能夠識別這些對象,分類正確率達到90%以上。
而在研究輪廓的時候,這個數(shù)字降低到了10%。雖然人類觀察者幾乎總能產(chǎn)生正確的形狀標(biāo)簽,但神經(jīng)網(wǎng)絡(luò)似乎對圖像的整體形狀幾乎不敏感。
當(dāng)研究人員試圖讓神經(jīng)網(wǎng)絡(luò)對他們已經(jīng)識別出的玻璃雕像進行分類時,出現(xiàn)了一個特別有趣的例子:當(dāng)我們很容易識別水獺或北極熊的玻璃模型時,神經(jīng)網(wǎng)絡(luò)將它們分別歸類為“氧氣面罩”和“開罐器”。
神經(jīng)網(wǎng)絡(luò)依賴于分類對象的紋理信息,而在這個例子中這些信息是丟失的,神經(jīng)網(wǎng)絡(luò)無法僅通過形狀來識別對象。
研究人員發(fā)現(xiàn),當(dāng)神經(jīng)網(wǎng)絡(luò)明確地被訓(xùn)練用來識別物體輪廓的時候,圖像輪廓的輕微扭曲就足以再次欺騙AI,而不會對人類的判定造成影響。
神經(jīng)網(wǎng)絡(luò)似乎對物體的整體形狀不敏感,而是依賴于局部分布點之間的統(tǒng)計相似性,在此基礎(chǔ)上便有了進一步的實驗。
如果將圖像打亂,使整體形狀消失,但保留了局部特征,會有怎樣的結(jié)果呢?
事實證明,神經(jīng)網(wǎng)絡(luò)在識別“亂序版本”物體方面要比只有輪廓的物體要好得多,也快得多,即使在人類“基本無法識別”的時候也是如此。學(xué)生們只能對37%的被打亂的物體進行分類,而神經(jīng)網(wǎng)絡(luò)成功的概率為83%。
更明智地使用神經(jīng)網(wǎng)絡(luò),需先了解其運作方式
作者Kellman說:“這項研究表明,這些系統(tǒng)在不考慮形狀的情況下,就能從訓(xùn)練過的圖像中得到正確的答案。對人類來說,整體形狀是物體識別的首要條件,而通過整體形狀識別圖像似乎根本不在這些深度學(xué)習(xí)系統(tǒng)考慮范疇當(dāng)中。”
人們可能天真地認(rèn)為,由于神經(jīng)網(wǎng)絡(luò)的許多層都是基于大腦神經(jīng)元之間的連接建立的模型,而且與視覺皮層的結(jié)構(gòu)非常相似,因此計算機視覺的運作方式必然與人類視覺相似。
但是這種研究表明,雖然基本架構(gòu)可能類似于人類大腦,但由此產(chǎn)生的“思維”運作方式卻截然不同。
研究人員目前可以漸漸地了解到神經(jīng)網(wǎng)絡(luò)中的“神經(jīng)元”在受到刺激時是如何運作的,并將其與生物系統(tǒng)對相同刺激的反應(yīng)進行比較。也許有一天,我們可以利用這些對比來了解神經(jīng)網(wǎng)絡(luò)是如何“思考”的,以及這些反應(yīng)與人類的不同之處。
但是,到目前為止,還需要更多的實驗心理學(xué)來探索神經(jīng)網(wǎng)絡(luò)和人工智能算法是如何感知世界的。
針對神經(jīng)網(wǎng)絡(luò)的測試更接近于科學(xué)家如何嘗試?yán)斫鈩游锏母泄倩蛴變喊l(fā)育中的大腦,而不僅僅是開發(fā)一款軟件。通過將這種實驗心理學(xué)與新的神經(jīng)網(wǎng)絡(luò)設(shè)計技術(shù)相結(jié)合,可能會使它們更加可靠。
然而,這項研究表明,對于我們正在創(chuàng)造和使用的算法,仍有很多不解之處:
它們是如何運作的;
它們是如何做出決策的;
它們與我們有何不同。
隨著神經(jīng)網(wǎng)絡(luò)在社會、科技發(fā)展中扮演著越來越重要的角色,如果我們想要明智而有效地使用它們,深入理解神經(jīng)網(wǎng)絡(luò)將是至關(guān)重要的——而不是只見樹木不見森林。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4806瀏覽量
102737 -
算法
+關(guān)注
關(guān)注
23文章
4697瀏覽量
94710 -
機器識別
+關(guān)注
關(guān)注
1文章
13瀏覽量
2613
原文標(biāo)題:UCLA:最先進DCNN已超越人類,識物方式與人腦不同
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
看臺積電、三星7納米截然不同的觀點

臺積電與三星針對7nm制程技術(shù)觀點截然不同

opa695用示波器探頭與sma轉(zhuǎn)bnc線觀察出現(xiàn)截然不同的結(jié)果,為什么?
人類與機器人有感情產(chǎn)生嗎?
測試:人類看待事物會傾向于與AI機器達成一致
韓國的兩家公司對于投資動力電池截然不同的想法
鏡面媒體上的信息流動方式與當(dāng)前的移動互聯(lián)網(wǎng)傳播截然不同
智能顯示屏鏡面媒體上的信息流動方式與互聯(lián)網(wǎng)截然不同
如何比較兩種截然不同的編程語言的性能
WISDome武器識別系統(tǒng)圓頂開源

利用超快成像技術(shù)觀測到兩種截然不同的全息圖案

評論