引爆AI技術(shù)的Alphago與李世石的“人工智能”世紀(jì)大戰(zhàn)已經(jīng)過(guò)去三年,與三年前Alphago大勝李九段時(shí)人們驚呼“人工智能將要替代人類(lèi)”相比,2019年的人們?cè)诿鎸?duì)AI時(shí)則更為淡然,與之對(duì)應(yīng)的現(xiàn)實(shí)是,近三年來(lái)人工智能技術(shù)雖已取得驚人成就,但仍未真正脫離“人工”的現(xiàn)實(shí)。
AI的“人工不智能”之困
2018年5月,谷歌在其I/O開(kāi)發(fā)者大會(huì)上,展示了令人印象深刻的Duplex人工智能語(yǔ)音技術(shù),當(dāng)時(shí)谷歌現(xiàn)場(chǎng)演示了Duplex語(yǔ)音AI預(yù)約理發(fā)服務(wù),在與理發(fā)店溝通過(guò)程中Duplex的那一聲“嗯哼”更是技驚四座、驚艷全球,隨后谷歌董事長(zhǎng)驕傲的向世界宣布:在電話預(yù)約領(lǐng)域,Duplex已經(jīng)通過(guò)了圖靈測(cè)試。
然而,事情當(dāng)然沒(méi)有那么簡(jiǎn)單,在《紐約時(shí)報(bào)》記者的測(cè)試中發(fā)現(xiàn),在成功預(yù)約的4次中,有三次是由人工偽裝成Duplex完成的,隨后谷歌官方聲明,目前通過(guò)Duplex撥打的電話中,約有25%由人類(lèi)完全操作,在其他非人工操作的情況下,有15%的呼叫受到了人為干預(yù)。
即使人工智能技術(shù)強(qiáng)如谷歌,也仍然邁不過(guò)AI語(yǔ)音交互的“智能之坑”。而實(shí)際上,著名的圖靈測(cè)試,也有其特定歷史環(huán)境下的局限性。
在圖靈測(cè)試中,僅僅通過(guò)AI是否表現(xiàn)的像個(gè)人類(lèi)的判斷無(wú)法有效得出AI是否真的具有智能,而要想AI脫離“人工”烙印真正實(shí)現(xiàn)智能,就必須真正跨過(guò)那條人與AI之間的邊界。
在電影《機(jī)械姬》中,人工智能Ava在利用Caleb的感情達(dá)到幫助自己成功逃生則是“真正成功的圖靈測(cè)試”的刻畫(huà),影片中,人工智能Ava的締造者Nathen真正目的正是希望Ava通過(guò)“性魅力、對(duì)人性的操縱、同理心”等人類(lèi)情感特征的綜合利用而實(shí)現(xiàn)逃生,因而,Ava的逃生也是“圖靈測(cè)試的終極版”。
雖然相比機(jī)械姬Ava,谷歌人工智能Duplex的完成度顯得“相形見(jiàn)絀”,但作為人工智能最為重要的底層技術(shù)之一,AI語(yǔ)音交互技術(shù)近年來(lái)的發(fā)展取得了一系列進(jìn)步,并隨著智能手機(jī)、智能音箱等硬件設(shè)備進(jìn)入千家萬(wàn)戶(hù)。
實(shí)際上,AI語(yǔ)音交互的基礎(chǔ)是基于深度學(xué)習(xí)算法對(duì)語(yǔ)言系統(tǒng)的深度集成,因而決定其具有明顯的“雙邊效應(yīng)”,一方面,AI語(yǔ)音交互的完成度越高,其用戶(hù)數(shù)量增長(zhǎng)越快;另一方面,用戶(hù)數(shù)量與使用頻次的增長(zhǎng)反作用于AI語(yǔ)音交互的深度學(xué)習(xí)訓(xùn)練,從而實(shí)現(xiàn)更高的完成度。
AI語(yǔ)音交互的“動(dòng)態(tài)規(guī)劃”法則
在互聯(lián)網(wǎng)江湖看來(lái),語(yǔ)言交互的過(guò)程的本質(zhì),是數(shù)據(jù)在“動(dòng)態(tài)規(guī)劃”邏輯下對(duì)數(shù)據(jù)特征的精確匹配。
在數(shù)學(xué)領(lǐng)域,動(dòng)態(tài)規(guī)劃(dynamic programming)是運(yùn)籌學(xué)的一個(gè)分支,是求解決策過(guò)程(decision process)最優(yōu)化的數(shù)學(xué)方法。在AI語(yǔ)音交互上,實(shí)現(xiàn)交互的過(guò)程可以看做是一個(gè)對(duì)語(yǔ)音輸入數(shù)據(jù)反饋“最優(yōu)解”的數(shù)據(jù)匹配過(guò)程。
從技術(shù)構(gòu)成上來(lái)看,AI語(yǔ)音交互技術(shù)大致可分為三個(gè)層面:“交互層、算法層、數(shù)據(jù)層”。在一個(gè)完整的AI語(yǔ)音交互過(guò)程中,由語(yǔ)音識(shí)別反饋技術(shù)為核心,實(shí)現(xiàn)交互層AI與人的交互觸達(dá),然后由算法層進(jìn)行“動(dòng)態(tài)規(guī)劃”解析,將完整語(yǔ)義下的文字?jǐn)?shù)據(jù)拆解為特定的“數(shù)據(jù)包”,并由算法將“數(shù)據(jù)包”與已有“語(yǔ)言系統(tǒng)數(shù)據(jù)”進(jìn)行精確匹配,從而實(shí)現(xiàn)AI對(duì)語(yǔ)義的理解并給出反饋。
簡(jiǎn)單來(lái)說(shuō),這就像你拿著一只印著小貓圖案的黃色鉛筆并且想要一只同樣的鉛筆,你需要去一個(gè)有著各種各樣筆的文具店,因而你需要用“動(dòng)態(tài)規(guī)劃”思維將這只獨(dú)特的鉛筆“拆分開(kāi)來(lái)”,明確它的種類(lèi)以及特征:首先,它是鉛筆、其次它是黃色的,最后它印著小貓圖案。然后根據(jù)這些特征通過(guò)篩選(算法)去找到文具店中同樣的鉛筆。(與已有“語(yǔ)言系統(tǒng)數(shù)據(jù)”進(jìn)行精確匹配)
但就目前的技術(shù)條件下,想要實(shí)現(xiàn)語(yǔ)言數(shù)據(jù)的100%精確匹配需要一些“先決條件”。
交互層實(shí)現(xiàn)100%準(zhǔn)確率的語(yǔ)音識(shí)別準(zhǔn)確率是保證整個(gè)語(yǔ)音交互不會(huì)出現(xiàn)語(yǔ)義“理解”偏差的重要前提,而要實(shí)現(xiàn)語(yǔ)音識(shí)的精準(zhǔn)必須構(gòu)建完整的“語(yǔ)句數(shù)據(jù)庫(kù)”,然后通過(guò)大量的識(shí)別訓(xùn)練提升其準(zhǔn)確度。
其次,在實(shí)現(xiàn)精確語(yǔ)音識(shí)別后,需要算法對(duì)其進(jìn)行“數(shù)據(jù)打包”并且實(shí)現(xiàn)對(duì)“語(yǔ)言系統(tǒng)數(shù)據(jù)庫(kù)”進(jìn)行快速檢索,從而匹配到相應(yīng)的“反饋方案”,而由于不同的語(yǔ)義決定了不同的語(yǔ)音交互場(chǎng)景,因此需要涵蓋幾乎所有語(yǔ)音交互場(chǎng)景的“算法倉(cāng)”,同時(shí)每個(gè)算法必須滿(mǎn)足對(duì)于精度和效率的雙重需求。
在數(shù)據(jù)層,“語(yǔ)言系統(tǒng)”數(shù)據(jù)庫(kù)的完善程度重某種意義上決定了整個(gè)語(yǔ)言交互系統(tǒng)的完成度。
無(wú)論是“交互層”還是“算法層”都需要“語(yǔ)言系統(tǒng)大數(shù)據(jù)”的全面參與,因而,構(gòu)建完善的“語(yǔ)言系統(tǒng)”數(shù)據(jù)是整個(gè)AI語(yǔ)音交互系統(tǒng)的核心,也是技術(shù)上難度最高的一環(huán)。
然而,現(xiàn)實(shí)中在語(yǔ)音識(shí)別領(lǐng)域,目前只有科大訊飛的語(yǔ)音識(shí)別技術(shù)達(dá)到了98%的準(zhǔn)確率,在整個(gè)語(yǔ)音交換互領(lǐng)域,也僅僅只有谷歌的Duplex通過(guò)了圖靈測(cè)試,而要想真正實(shí)現(xiàn)語(yǔ)音交互的人工智能,仍然需要AI底層技術(shù)革新的推動(dòng)。
進(jìn)階AI語(yǔ)音交互與“數(shù)據(jù)納什均衡博弈”
目前,無(wú)論是蘋(píng)果的Siri 還是微軟的小娜,在語(yǔ)音交互中均未實(shí)現(xiàn)基于時(shí)間線對(duì)語(yǔ)境的理解。而就2018年5月谷歌開(kāi)發(fā)者大會(huì)上Duplex的表現(xiàn)來(lái)看,谷歌人工智能語(yǔ)音識(shí)別技術(shù)在語(yǔ)境的“理解”上已經(jīng)取得了一些進(jìn)展。
互聯(lián)網(wǎng)江湖團(tuán)隊(duì)認(rèn)為,在進(jìn)階的語(yǔ)音交互過(guò)程中,除了遵循“動(dòng)態(tài)規(guī)劃”原則實(shí)現(xiàn)對(duì)語(yǔ)言數(shù)據(jù)的檢索外,基于“語(yǔ)言系統(tǒng)”對(duì)輸入數(shù)據(jù)的反饋則是一場(chǎng)算法驅(qū)動(dòng)下數(shù)據(jù)與數(shù)據(jù)的“納什均衡博弈。”
所謂“納什均衡”,實(shí)際上是一種策略組合,在該策略組合上,即在博弈的雙方中,一方的策略會(huì)隨著另一方的策略變動(dòng)進(jìn)行策略組合的調(diào)整,以達(dá)到一種戰(zhàn)略上的“均衡態(tài)勢(shì)”,而這種“均衡態(tài)勢(shì)”被稱(chēng)為“納什均衡”。
在進(jìn)階AI語(yǔ)音交互中,AI算法基于時(shí)間線對(duì)語(yǔ)義的“理解”過(guò)程,可以看做是對(duì)于語(yǔ)言輸入數(shù)據(jù)端的變化,完成AI算法端相應(yīng)的策略變換的過(guò)程,從而形成“數(shù)據(jù)納什均衡”。納什均衡的形成需要以既定的“目標(biāo)收益”為前提,而在AI語(yǔ)音交互中,這種“目標(biāo)收益”實(shí)質(zhì)上就是“在時(shí)間線的上對(duì)于語(yǔ)境的理解”。
“數(shù)據(jù)納什均衡”下的進(jìn)階AI語(yǔ)音交互雖然從理論上可以實(shí)現(xiàn)AI對(duì)特定語(yǔ)境下的理解,但這樣的AI仍不能夠算的上真正的人工智能,真正意義上的人工智能不僅僅是“具有人類(lèi)語(yǔ)言特征”的AI,而是真正具備人類(lèi)思維能力以及行為能力的AI系統(tǒng)。
因此,從這個(gè)意義上來(lái)講,真正的人工智能不僅具有“人類(lèi)思維”的軟件范式,也需要在物理上的“擬人化”,使之具備作為“人”行動(dòng)能力。而想要實(shí)現(xiàn)真正的人工智能,不僅需要AI技術(shù)的“人化”也需要工程上的“人類(lèi)化”。
因而,電影《機(jī)械姬》以及《機(jī)械公敵》中的人工智能形態(tài)才是完美的人工智能,從某意義上來(lái)講,這樣的人工智以及成為了一種由“人工”創(chuàng)造的硅基生命,而不僅僅是簡(jiǎn)單的“人工智能”了。
尾聲
AI天花板盡顯,人工智能還有多遠(yuǎn)?
當(dāng)下AI技術(shù)的興起,源于深度學(xué)習(xí)算法領(lǐng)域取得的突破性進(jìn)展,因而從這個(gè)意義上來(lái)講,如今AI技術(shù)實(shí)質(zhì)上是計(jì)算形式的革新。
也就是說(shuō),剝?nèi)ト斯ぶ悄艿耐庖拢缃竦腁I并未真正意義上實(shí)現(xiàn)“人工智能”,更多的還是一種用于大數(shù)據(jù)分析與檢索的工具,實(shí)際上,當(dāng)下AI的價(jià)值也在于對(duì)數(shù)據(jù)的高效匹配和應(yīng)用。另一方面,雖然AI技術(shù)在產(chǎn)業(yè)應(yīng)用上仍有巨大的空間,但深度學(xué)習(xí)算法的“工具式”人工智能的天花板已經(jīng)觸及,算法驅(qū)動(dòng)下的AI技術(shù)已經(jīng)到達(dá)瓶頸。
也許,《機(jī)械姬》中對(duì)于人工智能的幻想在本世紀(jì)末也未必能夠?qū)崿F(xiàn),而對(duì)于“人工智能顛覆人類(lèi)”的恐懼也頗為“杞人憂(yōu)天”,相對(duì)于人工智能時(shí)代的到來(lái),或許我們更應(yīng)該關(guān)注如今AI技術(shù)對(duì)于當(dāng)下的改變,而AI語(yǔ)音交互作為AI技術(shù)應(yīng)用的前沿陣地,任何的技術(shù)以及應(yīng)用層面的進(jìn)展都更值得我們?nèi)リP(guān)注。
評(píng)論