據(jù)《科學(xué)》(Science)雜志2017年10月報(bào)道,一家名為Vicarious的人工智能公司開(kāi)發(fā)的人工智能算法攻破了被人們廣泛使用的CAPTCHAs驗(yàn)證碼。
CAPTCHAs(Completely Automated Public Turing Test To Tell Computers and Humans Apart,全自動(dòng)區(qū)分計(jì)算機(jī)和人類的圖靈測(cè)試)是目前最常用的一種驗(yàn)證碼,通常由一組混亂的字符、波浪線和其他背景噪聲組成。例如,在你報(bào)名參加一個(gè)時(shí)事通訊或購(gòu)買(mǎi)音樂(lè)會(huì)門(mén)票之前,可能會(huì)被要求輸入這些字符。
科學(xué)家稱,他們已經(jīng)開(kāi)發(fā)出一種計(jì)算機(jī)模型,能從根本上攻破CAPTCHAs驗(yàn)證碼。
有很多種方法可以將字母呈現(xiàn)并混合在一起,人們通常可以很直觀的讀出來(lái),但對(duì)計(jì)算機(jī)來(lái)說(shuō)卻很難。破解驗(yàn)證碼的能力已經(jīng)成為評(píng)判人工智能研究人員的一個(gè)重要基準(zhǔn)。
許多人嘗試過(guò)并獲得了一些成功。例如,10年前Ticketmaster公司起訴了一家科技公司,因?yàn)閷?duì)方能夠繞過(guò)該公司的驗(yàn)證碼系統(tǒng)大規(guī)模地購(gòu)買(mǎi)音樂(lè)會(huì)門(mén)票。但人工智能公司Vicarious的聯(lián)合創(chuàng)始人迪利普·喬治(Dileep George)說(shuō)道,之前的一些嘗試只是利用了一種特殊的驗(yàn)證碼弱項(xiàng),而程序的細(xì)微變化就可以很容易地對(duì)它進(jìn)行防御。Vicarious公司在《科學(xué)》雜志上發(fā)表了一項(xiàng)新模型,它通過(guò)較少的訓(xùn)練就可以比以前的模型更有效地解析文本,從而能從根本上打破驗(yàn)證碼的防御系統(tǒng)。
喬治說(shuō),以前的模型試圖讓機(jī)器能像人類一樣學(xué)習(xí),這在很大程度上依賴于一種叫做深度學(xué)習(xí)的主流人工智能技術(shù)。“深度學(xué)習(xí)是這樣一種技術(shù),你有多層神經(jīng)元,然后你訓(xùn)練這些神經(jīng)元按照你的方式做出反應(yīng)。”他說(shuō)。例如,你可以通過(guò)成千上萬(wàn)次地展示字母A和B的示例圖片來(lái)訓(xùn)練一臺(tái)機(jī)器識(shí)別字母A和字母B。即使是這樣,它也很難識(shí)別出字母A與B的重疊,除非它已經(jīng)明確地接受了重疊圖片的訓(xùn)練。“它只復(fù)制了人腦工作的一些方面。當(dāng)然,我們能夠從案例中學(xué)習(xí)。但是人腦不需要把每個(gè)字符看很多次來(lái)重新認(rèn)識(shí)它,例如大腦會(huì)識(shí)別出字母A,即使它更大或是傾斜的。”
喬治的團(tuán)隊(duì)使用了一種被稱為遞歸皮層網(wǎng)絡(luò)(Recursive Cortical Network)的不同方法,他說(shuō),即使缺乏訓(xùn)練,該方法也能更好地推理出它所看到的東西。“我們發(fā)現(xiàn),大腦對(duì)視覺(jué)世界做出了一些假設(shè),而神經(jīng)網(wǎng)絡(luò)(深度學(xué)習(xí))卻沒(méi)有”。以下是他們新方法的工作原理:
在訓(xùn)練階段,新方法建立了它所接觸字母的內(nèi)部模型。因此,如果你向它展示大量的A、B等不同的字符,針對(duì)這些字符應(yīng)該是什么樣的,它將建立起自己的內(nèi)部模型。所以它將顯示:這是字母的輪廓,這是字母的內(nèi)部結(jié)構(gòu),這是背景,等等。然后,當(dāng)一個(gè)新的圖像出現(xiàn),它會(huì)試著解釋新圖像,并用它以前見(jiàn)過(guò)的字符來(lái)解釋新圖像的所有像素。所以它會(huì)說(shuō),A的這部分缺失了是因?yàn)樗贐的后面。
驗(yàn)證碼有很多種。根據(jù)本論文,新方法的模型“解決驗(yàn)證碼相關(guān)問(wèn)題的正確率達(dá)66.6%……,計(jì)算機(jī)檢測(cè)正確率為64.4%,雅虎為57.4%,貝寶(全球最大的在線支付平臺(tái))則是57.1%。
然而,這項(xiàng)研究的重點(diǎn)實(shí)際上與驗(yàn)證碼無(wú)關(guān),而是關(guān)于如何制造看上去能像人類一樣推理的機(jī)器人。“我們的長(zhǎng)期目標(biāo)是打造像人腦一樣思維的智力。”喬治說(shuō),“驗(yàn)證碼對(duì)我們來(lái)說(shuō)只是一個(gè)很自然的測(cè)試,因?yàn)橥ㄟ^(guò)這個(gè)測(cè)試,你可以檢查你的系統(tǒng)是否能像大腦一樣工作。”機(jī)器人需要了解它周圍的世界,能夠用物體和操作物體進(jìn)行推理。這些案例只需要較少的訓(xùn)練樣本,卻能以非常靈活的方式面對(duì)世界,并且都能進(jìn)行推理,所以非常重要;而且這些案例也是我們正在應(yīng)用的領(lǐng)域。
有些人對(duì)機(jī)器人將具備類似人類能力而感到不安,對(duì)此他的回答概括起來(lái)就是:“這將是技術(shù)的發(fā)展。至于計(jì)算機(jī)未來(lái)能夠像人腦一樣工作,我們將不得不視其為理所應(yīng)當(dāng)?shù)内厔?shì)。”
目前還不清楚這項(xiàng)研究對(duì)信息安全的影響有多大。喬治指出,谷歌已經(jīng)從文本驗(yàn)證碼轉(zhuǎn)移到了更高級(jí)的測(cè)試。隨著人工智能變得越來(lái)越智能,證明用戶是人的測(cè)試也將變得更加智能。
-
人工智能
+關(guān)注
關(guān)注
1805文章
48843瀏覽量
247509
原文標(biāo)題:CAPTCHAs驗(yàn)證碼被人工智能攻破
文章出處:【微信號(hào):AI_News,微信公眾號(hào):人工智能快報(bào)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論