上周,清華 AI 公開課迎來最后一講,本講主題是:落地的人工智能。講者楊強是香港科技大學(xué)講座教授,華人首個AAAI Fellow和IJCAI理事長,第四范式公司聯(lián)合創(chuàng)始人。 楊強教授作為邀請講者,與清華大學(xué)海峽研究院大數(shù)據(jù) AI 中心專家委員雷鳴等共同探討了 AI 在當(dāng)前和未來將產(chǎn)生的影響和落地的場景。
在課程開始,雷鳴老師先概述了對產(chǎn)業(yè)有較大影響的技術(shù),以及未來將發(fā)生的演變。
從技術(shù)角度看,未來對產(chǎn)業(yè)產(chǎn)生比較大影響的技術(shù)有:
基于視頻的信息理解和處理技術(shù)。現(xiàn)在,基于靜態(tài)的圖片的處理技術(shù),比如人臉識別、物體識別等,已經(jīng)達(dá)到了可用的水平。但是,在視頻分析和處理方面的研究才剛剛開始,還沒有非常有效、成熟的技術(shù)。
自然語言對話、理解和處理。尤其是半開放環(huán)境的對話,難度還很大。
強化學(xué)習(xí)。未來將在自動駕駛、廣告等領(lǐng)域產(chǎn)生影響。
內(nèi)容生成相關(guān)技術(shù)。
小樣本學(xué)習(xí)和遷移學(xué)習(xí)。在樣本匱乏的情況下解決問題。
產(chǎn)業(yè)在未來可能發(fā)生的一些演變:
首先是自動駕駛。以前我們還會討論自動駕駛是不是有落地的可能,是不是太危險、太科幻了。但現(xiàn)在來看,我們認(rèn)為自動駕駛的落地只是時間的問題。今年很快,百度的小批量量產(chǎn)自動駕駛汽車就會投入使用,真正實現(xiàn)商業(yè)化。
第二是智能醫(yī)療。智能醫(yī)療最近的發(fā)展很快,以醫(yī)學(xué)影像的發(fā)展為牽引,在一些特定領(lǐng)域的進(jìn)展很不錯。FDA最近剛給出了AI診斷的第二個license。
智能教育。探討教育的難度比較大,因為教育不是一個客觀問題,是一個交互式的,高維度的問題。所以AI全面介入教育的“智能老師”難度很大,但是以個性化教育作為切入,在一些特定領(lǐng)域,比如作文評分、作業(yè)批改、個性化出題等,已經(jīng)在不斷改變教育的生態(tài)。
智能助理。去年開始進(jìn)入一種非常白熱化的競爭階段,未來會進(jìn)一步的落地,通過迭代,會在更多垂直應(yīng)用上越做越好。
游戲及娛樂。個性化、娛樂內(nèi)容的生產(chǎn)。
智能制造。中國是制造大國,如果疊加智能制造,可以大幅度提高中國制造的水平和能力。中國在軟件方面發(fā)展較快,但硬件上的話,無論是芯片還是其他重要零部件制造,跟國際水平差距還很大。要承認(rèn)差距的客觀存在性,依靠中國巨大的市場,大力加大研發(fā)投入。不能僅靠國家,整個產(chǎn)業(yè)的企業(yè)和國家要一起把這部分發(fā)展起來。
智能農(nóng)業(yè)。中國是農(nóng)業(yè)大國,在智能農(nóng)業(yè)上已經(jīng)有一些發(fā)展。比如用無人機進(jìn)行病蟲害巡檢、定向農(nóng)藥噴灑、大棚的溫控,病蟲害檢測等,未來都有一些非常實際的應(yīng)用場景。
整體來看,AI在各個行業(yè)都有很多落地的場景,未來AI自身的發(fā)展結(jié)合落地的場景,應(yīng)該會產(chǎn)生很多創(chuàng)新。
楊強:一個AI,兩種模式
楊強:今天的題目很應(yīng)景,叫 “落地的人工智能”。這個題目是拿來跟大家探討的,因為這是一個大題目。人工智能到現(xiàn)在已經(jīng) 60 多年,幾起幾落,它的興衰也是圍繞著 “AI是不是可以落地” 進(jìn)行的。
今天的講座,第一部分是人工智能概述。
人工智能分為四個發(fā)展階段。初級階段是感知環(huán)境(Perception),我們知道單層的神經(jīng)網(wǎng)絡(luò)也叫 perceptron(感知器),是 60 年代就出現(xiàn)的可以簡單學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)。這是 AI 必要的一步,因為要有感知智能,才能收集大量數(shù)據(jù),這一階段需要傳感器、互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等技術(shù)。
第二個階段是機器學(xué)習(xí)(machine learning)階段。能從數(shù)據(jù)里面學(xué)習(xí)。第三個階段是自動推理(reasoning),需要搜索、邏輯、博弈論等技術(shù)。最后也是最高階段是抽象遷移(abstraction),需要有新的理論和系統(tǒng)。
一個AI,兩種模式
通用 vs 特殊:有很多人試圖解決通用 AI,但現(xiàn)在絕大部分工作還是在特殊的、任務(wù)驅(qū)動的人工智能。
輔助 vs 自動:比如計算機視覺是輔助型的,相當(dāng)于給機器戴上了眼鏡。無人車是自動型的,因為它的整個運作是自動的,也有自動的學(xué)習(xí)能力,人類只是為它提供一些必要的資源。
交互 vs 核心:交互型的 AI 是為了跟人溝通,是閉環(huán)的。還有一種做法是把 AI 作為一個核心的系統(tǒng),它的副產(chǎn)品是對人有用,但它可以完全按照自己的方式發(fā)展。AlphaGo 就是一個例子。
說到人工智能落地,第一個問題就是什么叫“落地”,誰來規(guī)范什么時候AI可以算作“落地了”? 這個標(biāo)準(zhǔn)是首先要建立的。在任何科學(xué)與工程領(lǐng)域,都要首先建立測試“成功”的準(zhǔn)則,否則就會事倍功半。要知道,智能的測試是非常難以做到公正的,也經(jīng)歷了很多的考驗,比如著名的“聰明的漢斯”,是對一匹叫做“漢斯”的馬的智能測試,因為一開始沒有注意到高維的特征空間,而得到了錯誤的結(jié)論。圖靈測試是一種更合理的測試,但也不是唯一的測試。
我認(rèn)為深度學(xué)習(xí)的成功主要來自兩個方面:第一,層次之間的演化是一種非線性的轉(zhuǎn)化,這種轉(zhuǎn)化如果進(jìn)行多次,就有可能產(chǎn)生高維空間的 pattern。第二,所有這些加起來,這個網(wǎng)絡(luò)本身成為一個特征產(chǎn)生器,產(chǎn)生一個高維的空間,在這個空間里,世界上的任何東西(圖像、語音等)都會有統(tǒng)一的表達(dá),并且你可以計算它們的距離。
高維度的、統(tǒng)一的特征表達(dá),這就是人工智能想達(dá)到的目標(biāo)。所有的推理、類比、抽象等,都可以在這個空間里得到。但這個空間是通過在數(shù)據(jù)中學(xué)習(xí)獲得的,這個手段在現(xiàn)階段是通過大數(shù)據(jù),但大數(shù)據(jù)不是唯一的手段。
AI為什么要有不斷創(chuàng)新的能力?
AI 領(lǐng)域每年有上千甚至上萬的 paper,是不是說我們就可以躺在 open source 上面,不用創(chuàng)新了?不是的,我們很有必要不斷地創(chuàng)新。
一個例子是 GAN,它的一個作用是可以 “魚目混珠”,生成器可以創(chuàng)造出一些虛假的圖片。在金融界就發(fā)現(xiàn)有這樣的人,他們對深度學(xué)習(xí)了如指掌,并且可以用AI深度學(xué)習(xí)的這些手段去欺詐金融的安全系統(tǒng),因此我們必須要有不斷提高的反擊的能力。
第二,有些新的學(xué)科,比如遷移學(xué)習(xí),非常依賴對數(shù)據(jù)的模擬。GAN 在這個方向是非常有用的工具。
創(chuàng)新的能力也可以體現(xiàn)在跨界的AI應(yīng)用上。一個例子是斯坦福大學(xué)的一個工作,他們的任務(wù)是幫助聯(lián)合國通過衛(wèi)星圖像,讓機器自動地給非洲大陸打標(biāo)簽,這些標(biāo)簽指代地區(qū)的“貧困程度。” 但是我們看到一個衛(wèi)星圖像,由于標(biāo)簽的缺乏,我們對圖像上對應(yīng)的貧困程度是一無所知的。傳統(tǒng)的做法是派人到本地做經(jīng)濟(jì)調(diào)查,然后把數(shù)據(jù)收集起來。這樣的做法既危險,又耗時,不準(zhǔn)確,數(shù)據(jù)也非常少。
有沒有辦法自動地做這件事呢?他們想到了遷移學(xué)習(xí),而且是多步的遷移學(xué)習(xí)。第一步是拿 ImageNet 這種圖像來學(xué)一個切割模型,第二步是比對白天和晚上的衛(wèi)星圖像,以此獲得一個初步的經(jīng)濟(jì)模型。因為一般認(rèn)為晚上比較亮的地方是經(jīng)濟(jì)發(fā)展比較好的區(qū)域。由此得出一些 feature 對應(yīng)經(jīng)濟(jì)發(fā)達(dá)或不發(fā)達(dá)的地區(qū)。最后的結(jié)果,用 survey 的方法的準(zhǔn)確率是 75%,用遷移學(xué)習(xí)的方法準(zhǔn)確率是 71%。雖然沒有人工的那么好,但是非常省力。
我們現(xiàn)在已經(jīng)有了不少“遷移學(xué)習(xí)”在產(chǎn)業(yè)應(yīng)用中的實例。如果已經(jīng)有了大數(shù)據(jù)產(chǎn)生的模型,那么在一個新的領(lǐng)域,可以用小數(shù)據(jù)把大模型遷移過來找到這個領(lǐng)域的要點就是找出兩個領(lǐng)域的不變量。我們假設(shè)一個領(lǐng)域可以用上億維的特征來描述,那么我們要找兩個領(lǐng)域的特征空間共有的部分來做遷移。
AI落地
網(wǎng)約車識別
這里的一個例子是上海汽車的網(wǎng)約車識別
這個問題是:給定車輛的行駛軌跡,如何判斷車輛是否網(wǎng)約車?
我們的策略是引入外部數(shù)據(jù)來進(jìn)行遷移學(xué)習(xí)。外部數(shù)據(jù)有出租車、公交車的行車軌跡。分兩步:首先我們有兩個空間,左邊是出租車的空間,右邊是網(wǎng)約車的空間,我們的目的是把知識從左邊搬到右邊。但是很明顯兩邊的知識是有差異的,要把這些差異剔除,我們用了半監(jiān)督學(xué)習(xí) + 遷移學(xué)習(xí)。
這個例子告訴我們,AI 的落地首先要目標(biāo)清晰,清晰到可以把優(yōu)化函數(shù)用數(shù)學(xué)公式寫下來。
第二,需要去找到合適的數(shù)據(jù)。
第三,人才需要領(lǐng)域知識,同時也需要 AI 知識,這種跨界的人才才是 AI 真正需要的人才,否則談不上落地。
然后,我們也來舉一個反例。我們都知道,AI的頭幾個里程碑都是IBM創(chuàng)造的。但是在AI落地的過程中,IBM也遇到了難題。一個例子就是IBM WATSON在醫(yī)療領(lǐng)域的落地。
我們先來看一下IBM WATSON的流程。 首先,當(dāng)一個問題到來的時候,系統(tǒng)把輸入的問題和知識庫里的問題加以對比,再按照匹配的概率排序。 如果有匹配度高的問題,那就可以把對應(yīng)的答案作為輸出。 在這個流程中,需要知識庫的建立,和問題集的收集。當(dāng)然,這個流程中又很多依靠機器學(xué)習(xí)的階段,比如問題的特征抽取,特征空間的建立,匹配的相似度學(xué)習(xí),等。但整個流程的建立還是要依靠專家來進(jìn)行的。比如,知識庫的建立,知識的擴展,以及問答系統(tǒng)在整個醫(yī)療系統(tǒng)中的定位等。恰恰因為這些需要人工的地方成為瓶頸,以至于最終用戶的定位錯誤,導(dǎo)致系統(tǒng)并沒有完成既定的任務(wù)。最后,IBM只能從美國一個很大的醫(yī)療機構(gòu)撤離,也導(dǎo)致了媒體大量的負(fù)面報道。
總結(jié)起來,這個例子說明,僅僅在一個游戲領(lǐng)域成功(問答的電視大賽),并不表示在開放的實際場景(醫(yī)療)就可以取得成功。 首先,IBM Watson的目標(biāo)客戶群是醫(yī)生,還是病人? 系統(tǒng)的角色是助手還是替代? 有沒有既懂醫(yī)療又懂AI的專家在團(tuán)隊中? 系統(tǒng)有沒有做到前端和知識庫的維護(hù)的閉環(huán)?這些有關(guān)落地的問題,都有待回答。
總結(jié):
第一,人工智能是走了很長的路,但是除了深度學(xué)習(xí)以外,還有很多的領(lǐng)域有待發(fā)掘。所以千萬不要以為深度學(xué)習(xí)就是人工智能。
第二,人工智能在企業(yè)的落地是一門大學(xué)問,而且是一門藝術(shù)性的學(xué)問,因為還沒有到科學(xué)的程度。所以一個問題是,AI 是產(chǎn)品,還是技術(shù),還是解決方案?第二個問題是,AI 如果在一個領(lǐng)域落地成功,需要哪些基本條件?
最后,我覺得非常有趣的一個點,是 AI 出現(xiàn)了以后、會出現(xiàn)一個新的、以機器智能為主體的產(chǎn)業(yè)和社會。那么這個新的商業(yè)社會也可能會部分地顛覆我們已有的商學(xué)院的知識。現(xiàn)有的商學(xué)院的知識主要是針對人的管理和人的決策。那么 AI 對應(yīng)的是機器的管理和機器的決策,這個學(xué)問現(xiàn)在還是空白。
-
人工智能
+關(guān)注
關(guān)注
1804文章
48737瀏覽量
246669 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5555瀏覽量
122499 -
自然語言
+關(guān)注
關(guān)注
1文章
291瀏覽量
13608
原文標(biāo)題:【清華 AI 公開課】IJCAI理事長楊強:人工智能在企業(yè)的落地是一門大學(xué)問
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
評論