在新智元AI WORLD 2018世界人工智能峰會上,中國萬向控股有限公司副董事長兼執(zhí)行董事肖風(fēng)分享了他對AI、數(shù)據(jù)隱私保護和區(qū)塊鏈的獨到看法。 肖風(fēng)認為,區(qū)塊鏈加上加密算法是一對絕配。未來三到五年內(nèi),一個去中心化的分布式AI平臺或?qū)⒊霈F(xiàn),數(shù)據(jù)帶來的問題將能夠解決。
9月20日,在新智元AI WORLD 2018世界人工智能峰會上,中國萬向控股有限公司副董事長兼執(zhí)行董事肖風(fēng)分享了他對AI、數(shù)據(jù)隱私保護和區(qū)塊鏈的獨到看法。
肖風(fēng)認為,隨著AI迎來第三次高潮,技術(shù)對數(shù)據(jù)愈發(fā)依賴,帶來了人們對數(shù)據(jù)估值的重新發(fā)現(xiàn)。
區(qū)塊鏈加上加密算法是一對絕配。互聯(lián)網(wǎng)是“信息機器”,區(qū)塊鏈是“事實機器”。區(qū)塊鏈加上加密算法將會給AI帶來一片新的天地,它們的結(jié)合將滿足AI對數(shù)據(jù)的需求,數(shù)據(jù)隱私會得到保護,數(shù)據(jù)資產(chǎn)會得到確權(quán),數(shù)據(jù)共享會得到激勵,數(shù)據(jù)計算會得以開放,數(shù)據(jù)治理會得以有序。
未來三到五年內(nèi),一個去中心化的分布式AI平臺或?qū)⒊霈F(xiàn)。
以下是肖風(fēng)在新智元AI WORLD 2018世界人工智能峰會上的演講實錄:《AI、數(shù)據(jù)隱私保護與區(qū)塊鏈》。
分布式的AI平臺將解決數(shù)據(jù)帶來的問題
肖風(fēng):很榮幸有這樣一個機會在人工智能大會上進行分享。我自己過去五年在區(qū)塊鏈這個領(lǐng)域當中做研究、投資和應(yīng)用推廣,既然來到這里,我還是想談一談和區(qū)塊鏈有關(guān)系的一些話題,當然,首先它也是和人工智能有關(guān)系。
人工智能和區(qū)塊鏈兩個話題碰在一起,數(shù)據(jù)的產(chǎn)權(quán)意識、價值以及數(shù)據(jù)隱私保護意識的覺醒和AI的發(fā)展是密不可分的,或者可以說是AI帶來的。
隨著2016年人工智能第三次浪潮起來,人們突然發(fā)現(xiàn)原來數(shù)據(jù)有這么大的作用,數(shù)據(jù)能夠創(chuàng)造這么大的價值,人們自然要問:我的數(shù)據(jù)在哪里?我的數(shù)據(jù)得到妥善的保護了嗎?商業(yè)機構(gòu)用我們的數(shù)據(jù)創(chuàng)造了價值,這些價值難道和我一點關(guān)系都沒有嗎?
有關(guān)數(shù)據(jù)的隱私保護、數(shù)據(jù)的價值分享和數(shù)據(jù)的共享,我總結(jié)了一下,最熱門的有這樣幾個方向:
首先是數(shù)據(jù)的產(chǎn)權(quán)確認。在座的各位可能都有很多數(shù)據(jù)遺留在互聯(lián)網(wǎng)上,這些數(shù)據(jù)是屬于我們的,還是屬于互聯(lián)網(wǎng)平臺的?或者是屬于我們和互聯(lián)網(wǎng)平臺共同擁有的?怎樣確認我們遺留在互聯(lián)網(wǎng)和其它平臺產(chǎn)生的數(shù)據(jù)?比如醫(yī)療平臺上你的基因數(shù)據(jù)、病歷數(shù)據(jù),怎么確定數(shù)據(jù)的主權(quán)是屬于你還是屬于誰?
第二個方向是數(shù)據(jù)的隱私保護。大家可能不想把某些數(shù)據(jù)這么直白地、這么公開地在互聯(lián)網(wǎng)上被傳播甚至被買賣,所以我們要討論數(shù)據(jù)的隱私保護。
再就是數(shù)據(jù)的協(xié)同計算。數(shù)據(jù)如果不被使用根本就不會有價值,但現(xiàn)在我們可能沒有任何一個單一的平臺能夠擁有多維的、多元的數(shù)據(jù)滿足人工智能算法的需求。電商平臺可能有電商的數(shù)據(jù),社交平臺可能有社交關(guān)系的數(shù)據(jù),但如果這些數(shù)據(jù)能夠協(xié)同計算,那么對AI來說一定是功莫大焉。
但沒有人愿意在現(xiàn)在的互聯(lián)網(wǎng)的環(huán)境下把自己的數(shù)據(jù)交出去,因為交出去就等于斷送,別人不可能拍著胸脯保證說這些數(shù)據(jù)我絕對不會偷看,絕對不會傳播出去。即使有這種主觀的善良的意愿,技術(shù)上也不一定能夠做到,無法保證數(shù)據(jù)得到妥善的保管。那么怎樣在既打消這種不信任的念頭,同時又能夠讓這么多維、多元、多層次的數(shù)據(jù)在一起協(xié)同計算,共同共享,得出具有更大社會福利的AI成果呢?這確實也是一個話題。
第四是數(shù)據(jù)的價值分享。既然這些數(shù)據(jù)創(chuàng)造了很大的商業(yè)價值,我是不是應(yīng)該從中得到我應(yīng)該得到的那一份?現(xiàn)有的互聯(lián)網(wǎng)架構(gòu)下沒有人給你。當然,互聯(lián)網(wǎng)平臺也用另外一種方式稍微返還了一部分利益,比如免費使用,這是因為要收集你的數(shù)據(jù),你可以得到一些免費的使用,也許這是一種價值間接的體現(xiàn)。但有沒有什么更直接的體現(xiàn),能夠激發(fā)大家愿意貢獻更多的數(shù)據(jù)來幫助AI達到更好的結(jié)果?激勵機制是數(shù)據(jù)共享或協(xié)同計算必須要建立的,沒有很好的激勵機制我們就很難相信,或者很難想像別人會平白無故地把隱私數(shù)據(jù)貢獻出去,讓某個科學(xué)家或讓某個商業(yè)機構(gòu)依據(jù)這些數(shù)據(jù)來訓(xùn)練機器、優(yōu)化算法,得到一些結(jié)果。
今天很多人工智能學(xué)家都在談怎么用數(shù)據(jù)。這些問題是AI的發(fā)展帶來的,但AI本身不能解決這些問題。如果這些問題不得到解決,那么對AI來說是一個巨大的缺陷,尤其是如果我們不能用一個很好的激勵機制去激勵那些數(shù)據(jù)的持有人把自己的數(shù)據(jù)貢獻出來,這對人工智能的發(fā)展來說也是一個巨大的缺陷。
舉個例子,科學(xué)家如何征求1萬個特殊病的案例?可以去找醫(yī)院,這也是很困難的事情。但如果用區(qū)塊鏈技術(shù),用一個分布式的AI平臺,并不需要找中間商,可以用你的智能合約加上隱私保護的算法,加上基于數(shù)字貨幣的激勵機制,那些互不認識的1萬個陌生人就會愿意把自己的病歷資料貢獻給這個平臺,讓某個科學(xué)家計算出來結(jié)果,然后智能合約會保證你能得到事先承諾給你的回報,并且你的所有數(shù)據(jù)能夠得到很好的隱私保護。
如果能夠做到這樣一個分布式的AI平臺,可以想像AI技術(shù)、AI行業(yè)會和今天討論的不一樣了。今天所有人工智能學(xué)家討論的都是基于中心化的機制、中心化的數(shù)據(jù)平臺去訓(xùn)練AI算法,得到一些結(jié)果。其實這是一方面,另一方面就是能不能用分布式、去中心化的AI平臺把中心化平臺無法提供,或者不能提供的數(shù)據(jù)都搜羅出來,然后達成我們想要達到的研究目的?
有很多密碼學(xué)家在這方面做了很多努力,并且有了很好的成果。
首先,哈希函數(shù)。哈希函數(shù)能夠證明一串數(shù)字或者一本書是不是被篡改過,不管是一段話還是一本書,這么多的內(nèi)容哈希以后,得到的哈希值是一樣大小的;但如果一本書當中改變了其中的一個標點符號,最后得到新的哈希值和原來就會有巨大的不同,所以能夠證明后來的東西是不是被篡改過。哈希函數(shù)可以得到很好的保證,不需要寫保證書,也不需要簽合同,只要檢查兩個信息的哈希值是不是一樣,就知道數(shù)據(jù)是不是被篡改過。
非對稱加密。所謂的公鑰、私鑰的非對稱加密算法,能夠保證數(shù)據(jù)的安全、完整和匿名,某種程度上也能夠?qū)?shù)據(jù)的產(chǎn)權(quán)進行確認,因為區(qū)塊鏈上面唯一的產(chǎn)權(quán)確認的依據(jù)就是擁有這個數(shù)字或者密碼學(xué)帳戶的私鑰,擁有了私鑰,就擁有了帳戶里面的所有價值物和數(shù)據(jù)。
零知識證明。這種加密算法能夠在把數(shù)據(jù)加密之后,在密文的狀態(tài)下讓第三方驗證者驗證數(shù)據(jù)的真實,或者狀態(tài)是否真的存在。
同態(tài)加密也是一樣,數(shù)據(jù)加密之后,在密文的狀態(tài)下,第三方仍然可以就這些數(shù)據(jù)進行某種程度上的分析和處理,最后由擁有密鑰的人從這里得到想要得到的結(jié)果。也許這個密鑰持有者并不是數(shù)據(jù)的所有者,因此也不會碰到原始的數(shù)據(jù),或者說不會碰到明文的數(shù)據(jù)。
最后是安全多方計算。就是有一組互不信任的陌生人,比如前面講到的某種特殊病的患者。這樣一組互不信任的參與方,數(shù)據(jù)擁有者可以把自己的數(shù)據(jù)在加密以后貢獻出來,讓別人來做協(xié)同計算,最后大家可以共享計算的結(jié)果。數(shù)據(jù)永遠都不會離開本地,永遠無法推導(dǎo)出所有的原始數(shù)據(jù)。
其實密碼學(xué)算法已經(jīng)存在很長時間了,但是被用來做數(shù)據(jù)的隱私保護和隱私保護之后的數(shù)據(jù)協(xié)同計算是最近兩年蓬勃發(fā)展的一個事實。
但是光有加密算法并不能夠完整地達到幫助AI更好地利用這些數(shù)據(jù)的目的。比如數(shù)據(jù)確權(quán)方面需要借助其它的技術(shù),數(shù)據(jù)的真實性方面哈希函數(shù)可以證明是否被篡改過,但只有哈希函數(shù)并不能夠使得數(shù)據(jù)真的不可撤銷、不可篡改和可追溯。
第三,數(shù)據(jù)真正要有價值就必須把數(shù)據(jù)資產(chǎn)化,數(shù)據(jù)沒有被資產(chǎn)化就無法就數(shù)據(jù)進行交易,無法給數(shù)據(jù)確定價值,也無法收到貢獻數(shù)據(jù)以后應(yīng)該得到的回報。數(shù)據(jù)資產(chǎn)化是數(shù)據(jù)交易的基礎(chǔ),但是數(shù)據(jù)資產(chǎn)化的基礎(chǔ)是數(shù)據(jù)的確權(quán)。
數(shù)據(jù)存儲。尤其是去中心化計算,或者所謂的點對點、分布式、邊緣以及多方協(xié)同計算這樣的情形,如何建立一套激勵機制,讓那些無關(guān)但擁有某方面的數(shù)據(jù)的人交出這些數(shù)據(jù)。這時需要建立一套價值分配和激勵機制,讓他們愿意把數(shù)據(jù)貢獻出來,這種價值分配機制和激勵機制密碼學(xué)算法也不能解決。
什么新的系統(tǒng)加上密碼學(xué)算法才能解決呢?有人說互聯(lián)網(wǎng)能夠解決,但互聯(lián)網(wǎng)不能解決前面的幾個熱點問題。
首先技術(shù)上,我們不能相信一個互聯(lián)網(wǎng)平臺確實能夠確保數(shù)據(jù)的安全和數(shù)據(jù)的隱私。前段時間我們有看到新聞,一家著名的連鎖酒店,幾億的住客數(shù)據(jù)被盜取。今天的新聞好像是泄露數(shù)據(jù)的人被抓到了,公安部門說他沒有能夠完成交易,數(shù)據(jù)沒有被賣出去。所以技術(shù)上并不能夠證明互聯(lián)網(wǎng)平臺能夠做到保證這些數(shù)據(jù)的安全和隱私。
第二,在利益上,大家都在用這些數(shù)據(jù)賺錢,沒有人在意數(shù)據(jù)的隱私保護或者產(chǎn)權(quán)歸誰。
第三,意愿方面,互聯(lián)網(wǎng)平臺希望掌握數(shù)據(jù)的主權(quán),而數(shù)據(jù)的擁有者希望數(shù)據(jù)的主動權(quán)掌握在自己手里,使用數(shù)據(jù)就應(yīng)該得到許可,分配使用數(shù)據(jù)獲得利益的一部分。
最后,在管理上。這幾天也有新聞報道,一家非常著名的物流公司的一個工程師無意當中把一個數(shù)據(jù)庫刪掉了,導(dǎo)致這家很大的物流公司整個停擺了590分鐘,整個系統(tǒng)才得以恢復(fù)。
因此,密碼學(xué)算法不能解決這些問題,互聯(lián)網(wǎng)技術(shù)也一樣不能解決。
誰能解決呢?區(qū)塊鏈是可以解決的,因為區(qū)塊鏈和互聯(lián)網(wǎng)有很大的不同。有人說區(qū)塊鏈是第二代互聯(lián)網(wǎng),我覺得不是,區(qū)塊鏈和互聯(lián)網(wǎng)有巨大的區(qū)別,主要是這幾個方面:
互聯(lián)網(wǎng)剛出來的時候,美國的媒體把互聯(lián)網(wǎng)叫做“信息機器”。確實,互聯(lián)網(wǎng)使得信息的產(chǎn)生、交流、傳遞成本極低,低到邊際成本是零,傳遞速度極快,信息的獲取也極端方便。區(qū)塊鏈被人們叫做事實機器,因為它的分布式數(shù)據(jù)庫的特點,區(qū)塊鏈的數(shù)據(jù)庫上面任何數(shù)據(jù)只能添加,不能撤除,不能篡改。因此數(shù)據(jù)一旦登記到區(qū)塊鏈上面,我們完全不需要擔(dān)心是不是被改過,所以叫做事實機器。一個事實機器顯然更有利于AI。
第二,互聯(lián)網(wǎng)是一種中心化的信任機制,你必須相信互聯(lián)網(wǎng)平臺,說你的數(shù)據(jù)在我這里是得到妥善保護的,我是不會隨便碰你的數(shù)據(jù)的。但是到現(xiàn)在為止幾乎沒有人敢徹底相信任何一個互聯(lián)網(wǎng)平臺不偷看你的數(shù)據(jù),或者你的數(shù)據(jù)能夠在那里得到妥善的保護。區(qū)塊鏈是一個去中心化的信任機制,不需要信任任何人、任何機構(gòu)、任何組織,只需要信任這套數(shù)學(xué)算法,這套數(shù)學(xué)算法不會偷窺你的數(shù)據(jù),也不會擅自利用你的數(shù)據(jù)。靠著一條共識算法來建立的分布式信任機制,顯然要比一個中心化的互聯(lián)網(wǎng)機制好得多。
第三就是激勵相容。數(shù)據(jù)的擁有方、算法的提供方、算力的提供方和AI的需求方在區(qū)塊鏈上面完全能夠做到激勵相容,每個人各得其所,不會有激勵不相容的現(xiàn)象發(fā)生。所以在激勵機制上區(qū)塊鏈和互聯(lián)網(wǎng)有巨大的不同,互聯(lián)網(wǎng)平臺是多方參與的,但是我們無法在互聯(lián)網(wǎng)平臺建立很好的激勵相容機制,區(qū)塊鏈上面可以建立這樣的激勵機制。
第四,互聯(lián)網(wǎng)上的應(yīng)用叫做App,區(qū)塊鏈上的應(yīng)用叫做Dapp,D就是“去中心化”(Decentralized)。App和Dapp的最大區(qū)別是什么?比如說,如果你用出版社加上新華社的渠道來出版一本書,那么你可能得到這本書售價的10%,那是你的版稅。但如果通過互聯(lián)網(wǎng)平臺,比如騰訊的閱文平臺,出版任何的讀物,收入的25%要歸平臺。這意味著作者本人可以得到這本著作所有收入的75%。但在區(qū)塊鏈上面的Dapp上出版這樣的讀物和著作,所有的收入100%歸你,沒有任何人會在中間抽取你的費用。這是一個去中心化的商業(yè)模式,我們把它叫做分布式商業(yè)。
第五,互聯(lián)網(wǎng)在利益上希望數(shù)據(jù)獨享,所以在現(xiàn)有的技術(shù)狀況下很難看到不同的互聯(lián)網(wǎng)平臺會把數(shù)據(jù)共享出來,這實際上妨礙了AI的進一步發(fā)展。但是在區(qū)塊鏈上面是數(shù)據(jù)共享的,因為所謂分布式數(shù)據(jù)庫之上的分布式記帳系統(tǒng)本來就是一個共享記帳系統(tǒng),帳本系統(tǒng)本來就是相關(guān)參與方在一個數(shù)據(jù)庫當中記錄大家相關(guān)的所有數(shù)據(jù),可以同步給所有的參與方。
最后,區(qū)塊鏈上面跑的是數(shù)字貨幣,數(shù)據(jù)要達成交易交換,或者用來激勵數(shù)據(jù)的所有者或者提供者,算法的提供者或者算力的提供者。互聯(lián)網(wǎng)的環(huán)境中可以用微信和支付寶,但這是另外一套系統(tǒng),把數(shù)據(jù)提供之后仍然可以懷疑是不是能夠得到事先承諾的價值和利益。但是區(qū)塊鏈上面不需要擔(dān)心這個,任何一個需求的發(fā)起方建立智能合約,數(shù)字貨幣寫在智能合約里面,也把數(shù)據(jù)交給這個智能合約,運算結(jié)束以后智能化合約會自動觸發(fā)一個支付流程,所有人會依據(jù)事先約定好的計算機程序分配所得利益,所以它是可編程的智能貨幣。數(shù)字貨幣本身就是一段計算機程序,而不是一串數(shù)字。
這些是互聯(lián)網(wǎng)和區(qū)塊鏈很大的區(qū)別,可以看到區(qū)塊鏈加上加密算法可能是一對絕配。區(qū)塊鏈的鏈式數(shù)據(jù)庫可以保證數(shù)據(jù)的真實性。區(qū)塊鏈作為事實機器,它和互聯(lián)網(wǎng)這種信息機器最大的不同是,任何數(shù)據(jù)在區(qū)塊鏈上面不可能被“雙花”,所謂“雙花”就是數(shù)據(jù)可以不經(jīng)許可,沒有成本,隨便復(fù)制。
我們把區(qū)塊鏈叫做價值互聯(lián)網(wǎng)。我們在區(qū)塊鏈上面發(fā)送比特幣,如果像發(fā)送郵件一樣,一個比特幣可以發(fā)給一萬個人,本地還保存這樣的郵件,這個世界就亂了。區(qū)塊鏈技術(shù)有一套機制防止雙花,當你宣稱你要利用區(qū)塊鏈寄送一個比特幣給別人,這個系統(tǒng)會保證你的比特幣一定會被減掉,而且你的比特幣只能給你指定的那個人得到,不可能像郵件那樣一千個人、一萬個人都能得到。防止雙花,數(shù)據(jù)才能成為資產(chǎn)。如果像互聯(lián)網(wǎng)上面信息可以這樣無成本、不經(jīng)許可、隨便擴散,這種時候數(shù)據(jù)不可能成為資產(chǎn)。
再就是點對點的交易系統(tǒng)。區(qū)塊鏈就是一個點對點的交易系統(tǒng)。這種機制可以防止數(shù)據(jù)壟斷,每個人擁有自己的數(shù)據(jù),可以參與交易。
去中心化的信任機制保障了數(shù)據(jù)的安全,前面我們已經(jīng)講過了。
智能可編程貨幣帶來數(shù)據(jù)協(xié)作新的激勵機制,加上前面講的加密算法是一對絕配。
最后,簡單總結(jié)一下區(qū)塊鏈和加密算法的發(fā)展趨勢。
現(xiàn)在有越來越多大學(xué)的密碼學(xué)家開始加入到區(qū)塊鏈的創(chuàng)業(yè)團隊當中,我在今年上半年就已經(jīng)碰到過好幾個斯坦福、MIT、馬里蘭大學(xué)和伯克利大學(xué)的密碼學(xué)家,大家紛紛加入到了區(qū)塊鏈行業(yè),投身到數(shù)據(jù)的隱私保護和數(shù)據(jù)的協(xié)同計算。
通過這些密碼學(xué)家我們了解到,密碼學(xué)界研究方向正在發(fā)生巨大的轉(zhuǎn)變,明年的美國密碼學(xué)年會和歐洲密碼學(xué)年會目前為止接到的論文和議題有一半是安全多方計算MPC。數(shù)據(jù)隱私保護成為了最熱門、最重要的話題,我所發(fā)起的PlatON區(qū)塊鏈項目就是致力于用加密算法加上區(qū)塊鏈技術(shù)解決數(shù)據(jù)多方安全計算的問題。我們已經(jīng)在工程上實現(xiàn)了兩方安全計算,明年中會實現(xiàn)三方的安全計算,之后多方安全計算就不遠了。
區(qū)塊鏈加上加密算法將會給AI帶來一片新的天地,滿足AI對數(shù)據(jù)的需求,數(shù)據(jù)隱私會得到保護,數(shù)據(jù)資產(chǎn)會得到確權(quán),數(shù)據(jù)共享會得到激勵,數(shù)據(jù)計算會得以開放,數(shù)據(jù)治理會得以有序。可以期待三到五年之后,一個去中心化的分布式AI平臺會出現(xiàn),不再需要依靠中心化的機構(gòu),也不再需要中心化機構(gòu)的數(shù)據(jù)。一個科學(xué)家可以在這樣的平臺上面發(fā)布自己的需求征集數(shù)據(jù)所有者,征集算法所有者,征集算力所有者,完成自己的一項科學(xué)研究。三到五年以內(nèi)分布式的AI平臺應(yīng)該會出現(xiàn)。
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7239瀏覽量
90987 -
AI
+關(guān)注
關(guān)注
87文章
34158瀏覽量
275328 -
區(qū)塊鏈
+關(guān)注
關(guān)注
112文章
15565瀏覽量
107900
原文標題:肖風(fēng):為什么說區(qū)塊鏈將給AI帶來新天地
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
平衡創(chuàng)新與倫理:AI時代的隱私保護和算法公平
區(qū)塊鏈如何改變AI
什么是區(qū)塊鏈 區(qū)塊鏈有什么用
區(qū)塊鏈不是泡沫 馬云或?qū)?chuàng)造新的神話
區(qū)塊鏈軟件開發(fā)公司談未來區(qū)塊鏈的主要應(yīng)用方向
區(qū)塊鏈對我們的生活有什么影響
區(qū)塊鏈落地智慧城市應(yīng)用領(lǐng)域
區(qū)塊鏈技術(shù)的新用途有哪些
區(qū)塊鏈在非金融行業(yè)的應(yīng)用
基于區(qū)塊鏈的物聯(lián)網(wǎng)
基于區(qū)塊鏈的個人隱私保護機制

區(qū)塊鏈隱私保護平臺Sero超零協(xié)議介紹

如何使用區(qū)塊鏈進行GDPR的數(shù)據(jù)隱私保護
隱私計算在區(qū)塊鏈上有什么作用

評論