深度學(xué)習(xí)會是犯罪行為嗎?歐洲“史上最嚴(yán)”的數(shù)據(jù)保護(hù)條例今天實(shí)施,其中提及了對算法的可解釋性。華盛頓大學(xué)計(jì)算機(jī)科學(xué)教授Pedro Domingos曾發(fā)推特說,條例會讓深度學(xué)習(xí)成為違法行為。但實(shí)際上并非如此。
今天,歐洲“史上最嚴(yán)”的數(shù)據(jù)保護(hù)條例——通用數(shù)據(jù)保護(hù)條例(The EU General Data Protection Regulation,GDPR)生效。
GDPR有多嚴(yán)格?對于違規(guī)收集個(gè)人信息的互聯(lián)網(wǎng)公司,最高可罰款2000萬歐元或全球營業(yè)額的4%。
這個(gè)數(shù)字看上去沒什么概念。舉個(gè)例子,微軟2017年收入900億美元,4%就是36億美元;亞馬遜2017年的收入為1779億美元,若罰款4%就是70億美元。
對大公司罰再多的款看上去也跟開發(fā)者無關(guān),畢竟又罰不到開發(fā)者身上。
那就錯(cuò)了。
在今年初,華盛頓大學(xué)人工智能專家Pedro Domingos教授的發(fā)推特:GDPR要求算法有可解釋性,這讓深度學(xué)習(xí)成了違法行為!
當(dāng)時(shí)這條推特就引起了恐慌,引發(fā)各種律師出來進(jìn)行解讀。
最新的消息是,在ICAN咨詢公司的GDPR交付經(jīng)理(Delivery Manager)說,GDPR不會停止機(jī)器學(xué)習(xí)和深度學(xué)習(xí),也不會成為它們的危險(xiǎn)。
看上去松了口氣,但對AI產(chǎn)業(yè)界來講,GDPR帶來的影響才剛剛開始。
深度學(xué)習(xí)的“大敵”:你給我解釋解釋可解釋
Domingos教授認(rèn)為“深度學(xué)習(xí)違法”,是因?yàn)镚DPR中的第13至15條規(guī)定,公司有義務(wù)提供對個(gè)人算法決策的詳細(xì)解釋,或關(guān)于算法如何作出決定的一般信息——這是爭論的焦點(diǎn)。
很多人對Domingos教授的話感到擔(dān)憂:GDPR是否真的需要機(jī)器學(xué)習(xí)算法的解釋?
首先應(yīng)該區(qū)分一下“解釋”的范圍:
全局解釋(Global explanation):機(jī)器學(xué)習(xí)的算法是如何工作的(這對于深度學(xué)習(xí)等復(fù)雜方法來說可能非常困難)。
局部解釋(Local explanation):影響特定人員的某個(gè)特定決策的因素有哪些(比較容易)。已經(jīng)有一些算法,如LIME:Local Interpretable Model-Agnostic Explanations,它可以解釋任何機(jī)器學(xué)習(xí)分類器的預(yù)測。例如,如果一個(gè)人的抵押貸款被拒,TA是否應(yīng)該知道是哪些因素促成了這一決定?一方面,如果你被算法拒絕,你想知道為什么,并有機(jī)會上訴。另一方面,足夠的解釋可能會使決策邊界被反向設(shè)計(jì),并允許潛在的邪惡行為者對系統(tǒng)進(jìn)行博弈。在很多情況下這是非常不可取的(例如安全應(yīng)用)。
歐盟律師、牛津大學(xué)人工智能和機(jī)器人技術(shù)法律與倫理研究員Sandra Wachter博士認(rèn)為,GDPR要求數(shù)據(jù)控制器實(shí)施適當(dāng)?shù)拇胧﹣肀U蠑?shù)據(jù)主體的權(quán)利自由和合法權(quán)益。而第15條意味著一種更普遍的監(jiān)督形式,而不是對某一特定決定作出解釋的權(quán)利。
說起來有點(diǎn)繞,直白點(diǎn)的意思是:
在GDPR中,解釋的權(quán)利不具有法律約束力,但可以自愿提供。
Sandra Wachter博士還認(rèn)為,GDPR很可能只向個(gè)人提供關(guān)于自動決策和系統(tǒng)功能存在的信息,但是沒有關(guān)于決策基本原理的解釋。事實(shí)上,在整個(gè)GDPR中,“解釋權(quán)”只在第71章的規(guī)定中提到過一次,而這一規(guī)定缺乏建立獨(dú)立權(quán)利的法律權(quán)力。
數(shù)據(jù)研究公司MediaGamma聯(lián)合創(chuàng)始人、CEO Rael Cline認(rèn)為,深度學(xué)習(xí)僅僅是一種使用大量數(shù)據(jù)(標(biāo)記或未標(biāo)記)的算法。由于其有效性與數(shù)據(jù)的數(shù)量和質(zhì)量以及這些數(shù)據(jù)集的危害程度有關(guān),在最壞的情況下,GDPR可能影響算法的準(zhǔn)確性并限制其商業(yè)價(jià)值。
“使用未經(jīng)消費(fèi)者同意的數(shù)據(jù)在GDPR下是非法的,但深度學(xué)習(xí)的方法不違法。值得注意的是,在許多用例中,GDPR的影響非常小(例如,工廠的數(shù)據(jù)是由機(jī)器生成的,而不是終端用戶的)。”
ICAN咨詢公司GDPR交付經(jīng)理Can Huzmeli也說,GDPR不會成為機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的危險(xiǎn)。
“GDPR關(guān)注的是作為系統(tǒng)輸入的數(shù)據(jù),以及作為處理結(jié)果共享數(shù)據(jù)的人。”Huzmeli說。“只要你的數(shù)據(jù)處理方式在隱私方面是安全的,你就可以使用任何算法。”
在這種情況下,只要你有輸入的合法依據(jù),也不非法共享算法的輸出,那么就是安全的。
Huzmeli也說,這確實(shí)給機(jī)器學(xué)習(xí)系統(tǒng)帶來了額外的負(fù)擔(dān),因?yàn)樗鼈兺ǔJ褂门老x來收集數(shù)據(jù)。但是,他們已經(jīng)使用過濾器來清理數(shù)據(jù)。因此,GDPR中添加的唯一額外一項(xiàng)規(guī)定是在數(shù)據(jù)集結(jié)束之前過濾敏感數(shù)據(jù)。
“GDPR正將必要的意識引入到生態(tài)系統(tǒng)中,并通過提醒公司在隱私領(lǐng)域承擔(dān)多大的責(zé)任來引導(dǎo)它們。”
Sandra Wachter博士也認(rèn)為,基于人工智能的系統(tǒng)往往是不透明的“黑盒子”,難以仔細(xì)檢查。隨著我們越來越多的經(jīng)濟(jì)、社會和公民交互——從信貸市場和健康保險(xiǎn)應(yīng)用到招聘和刑事司法系統(tǒng)——都是通過算法進(jìn)行的,人們對技術(shù)背后缺乏透明度的擔(dān)憂越來越多,對如何做出決定的理解很少。
“我們需要適當(dāng)?shù)谋Wo(hù)措施來確保正在做出的關(guān)于我們的決定實(shí)際上是公正和準(zhǔn)確的。”
應(yīng)對“史上最嚴(yán)”條例,企業(yè)應(yīng)關(guān)注9大要點(diǎn)
之所以被稱為“史上最嚴(yán)”數(shù)據(jù)保護(hù)條例,因?yàn)镚DPR規(guī)定,對違規(guī)收集個(gè)人信息、沒有保障數(shù)據(jù)安全的互聯(lián)網(wǎng)公司,最高可罰款2000萬歐元或全球營業(yè)額的4%(以較高者為準(zhǔn))。
舉例來說,亞馬遜2017年的收入為1779億美元,如果亞馬遜非法收集用戶數(shù)據(jù),那么罰款2000萬歐元就太少了,應(yīng)該是年收入的4%,即70億美元。百度2017年的利潤是28.1億美元,對亞馬遜的罰款相當(dāng)于是2.5個(gè)百度。
罰款只是極端情況,GDPR對AI公司的影響遠(yuǎn)比罰款復(fù)雜的多,總結(jié)下來有以下九大影響:
1. 要求公司手工審查重要的算法決策增加了AI的整體成本。
在GDPR中,最直接針對AI使用的是第22條,即要求公司必須讓人類審查某些算法的決策。這一限制大大增加了人工成本,阻礙AI的使用——開發(fā)AI的一個(gè)主要?jiǎng)訖C(jī)就是自動化,如果由人類來完成的話將會更慢、更昂貴、更難以完成。
2.知情權(quán)可能導(dǎo)致降低AI的準(zhǔn)確性。
GDPR的第13至15條規(guī)定,公司有義務(wù)提供對個(gè)人算法決策的詳細(xì)解釋,或關(guān)于算法如何作出決定的一般信息。前者可能破壞算法的準(zhǔn)確性,甚至適得其反,導(dǎo)致不公平的決策。因?yàn)樵谒惴Q策中準(zhǔn)確性和透明度之間存在權(quán)衡。
GDPR規(guī)定,數(shù)據(jù)控制者必須以清楚、簡單、明了的方式向個(gè)人說明其個(gè)人數(shù)據(jù)是如何被收集處理的。可以想見的是,當(dāng)前企業(yè)普遍應(yīng)用的隱私政策必須進(jìn)行大幅改革,才能滿足合規(guī)要求。如果涉及自動化的數(shù)據(jù)處理,包括數(shù)據(jù)畫像活動,則需要提供基本的算法邏輯以及針對個(gè)人的運(yùn)算結(jié)果。
3.被遺忘權(quán)可能會破壞AI系統(tǒng)。
第17(1)條中的“被遺忘權(quán)”(right to erasure)也可能損害AI。所有使用無監(jiān)督機(jī)器學(xué)習(xí)的AI系統(tǒng)都被要求“記住”它們用來自我訓(xùn)練的所有數(shù)據(jù),以維持從那些數(shù)據(jù)中得到的規(guī)則。但是,清楚這些數(shù)據(jù)可能導(dǎo)致AI的準(zhǔn)確率降低,甚至完全失效。
4.禁止重新利用數(shù)據(jù)將限制AI的創(chuàng)新。
GDPR第6條規(guī)定,除了首次收集數(shù)據(jù)之外的任何其他目的都禁止使用數(shù)據(jù),因此企業(yè)難以利用數(shù)據(jù)進(jìn)行創(chuàng)新。
5.模糊的規(guī)則可能阻止公司使用去識別數(shù)據(jù)(de-identified data)。
雖然GDPR允許使用去識別的數(shù)據(jù),但缺乏明確的去識別標(biāo)準(zhǔn),這可能削弱公司對數(shù)據(jù)進(jìn)行去識別的動力。
6.GDPR的復(fù)雜性會提高使用AI的成本。
GDPR是一項(xiàng)非常復(fù)雜的法規(guī),可能難以遵循。開發(fā)或使用AI的公司需要有專門的人員和技術(shù)來確保它們符合GDPR,這將提高使用AI的成本。
7. GDPR增加了使用AI的企業(yè)面臨的監(jiān)管風(fēng)險(xiǎn)。
8.數(shù)據(jù)本地化的要求提高了AI成本。
GDPR第5條概述了與個(gè)人數(shù)據(jù)處理相關(guān)的原則,對歐盟以外的個(gè)人數(shù)據(jù)流動有嚴(yán)格的控制,例如要求企業(yè)必須使用歐盟國家的數(shù)據(jù)中心。這減少了云服務(wù)提供商之間的競爭,但增加了數(shù)據(jù)處理的成本。
9.“數(shù)據(jù)可攜權(quán)”將加劇服務(wù)提供商的競爭。
“個(gè)人數(shù)據(jù)可攜權(quán)”(第20條)是指用戶可以無障礙地將其個(gè)人數(shù)據(jù)從一個(gè)信息服務(wù)提供者處轉(zhuǎn)移至另一個(gè)信息服務(wù)提供者。例如,F(xiàn)acebook的用戶可以將其賬號中的照片以及其他資料轉(zhuǎn)移至其他社交網(wǎng)絡(luò)服務(wù)提供商。該權(quán)利不僅適用于社交網(wǎng)絡(luò)服務(wù),還包括云計(jì)算、網(wǎng)絡(luò)服務(wù)、手機(jī)應(yīng)用等自動數(shù)據(jù)處理系統(tǒng)。
AI公司是怎么應(yīng)對的?
GDPR對AI產(chǎn)業(yè)界的影響重大,受該條例管轄的不僅僅是傳統(tǒng)意義上的互聯(lián)網(wǎng)公司或AI公司,哪怕其從事的業(yè)務(wù)并非狹隘上的互聯(lián)網(wǎng)服務(wù),只要涉及了用戶數(shù)據(jù),也在GDPR管轄范圍之內(nèi)。
以下是將適用于歐洲用戶的一些關(guān)鍵的GDPR要求:
公司必須建立允許用戶查看他們存儲的個(gè)人信息的工具。
公司必須允許用戶刪除、糾正或移動他們的數(shù)據(jù)。
公司必須在72小時(shí)內(nèi)將數(shù)據(jù)泄露通知有關(guān)部門。
公司必須獲得肯定同意或證明他們有一個(gè)收集用戶數(shù)據(jù)的“合法依據(jù)”。
在GDPR制定過程中,一些公司就已經(jīng)開始準(zhǔn)備應(yīng)對措施。
微軟
微軟的副首席法律顧問Julie Brill在一篇官方博客中透露,微軟已經(jīng)為GDPR項(xiàng)目投入了1600多名工程師,他們將為全球客戶提供正在為歐洲建設(shè)的符合GDPR的工具,微軟的客戶可以查看、刪除和移動他們的個(gè)人數(shù)據(jù)。
亞馬遜
3月底,亞馬遜宣布AWS已經(jīng)為GDPR做好準(zhǔn)備。該公司解釋說:“AWS服務(wù)使您能夠以您需要的方式來實(shí)施您自己的安全措施,以遵守GDPR。”
扎克伯格5月22日在歐洲議會聽證會中表示,F(xiàn)acebook已經(jīng)為GDPR做好準(zhǔn)備,并且“很大一部分”用戶已經(jīng)被提示更新隱私設(shè)置。奇怪的是,F(xiàn)acebook在這個(gè)關(guān)頭在歐洲啟用了人臉識別認(rèn)證。
Facebook還將美國、加拿大和歐盟國之外的約15億用戶的注冊地從都柏林移至美國。據(jù)路透社報(bào)道,這一舉動意味著非洲、亞洲、澳大利亞和拉丁美洲的用戶不受GDPR的影響。Facebook表示,它正在向世界各地的所有人提供隱私工具,但具體的隱私政策在各個(gè)國家不一樣。
Apple
早在2011年發(fā)布的iOS 5,蘋果就在其設(shè)備之間發(fā)送的iMessage中添加了端到端加密。與Facebook和谷歌不同,蘋果公司不依賴于廣告賺錢。
對于GDPR,蘋果已更新其隱私條款并推出了新的用戶頁面。歐洲的用戶現(xiàn)在可以下載蘋果公司對其收集的所有數(shù)據(jù)。這些數(shù)據(jù)由照片、Apple Pay,聯(lián)系人等服務(wù)收集。用戶下載的個(gè)人數(shù)據(jù)以壓縮文件夾的形式出現(xiàn),其中包含可重復(fù)使用的CSV和JSON文件。
蘋果還加入了暫時(shí)停用帳戶的功能。停用后,Apple服務(wù)將停止,蘋果公司還將停止為其機(jī)器學(xué)習(xí)和AI系統(tǒng)使用客戶數(shù)據(jù)。這些功能將在未來幾個(gè)月內(nèi)推廣到全球的所有帳戶。
谷歌CEO Sundar Pichai不久前表示:“我們的大部分廣告業(yè)務(wù)都來自搜索,我們依賴非常有限的信息——基本上就是關(guān)鍵詞——來顯示相關(guān)廣告或產(chǎn)品。” 他補(bǔ)充說,他認(rèn)為GDPR對于互聯(lián)網(wǎng)用戶來說基本上是件好事。
Twitter在GDPR生效之前更新了服務(wù)條款和隱私政策。Twitter在官方博客中解釋道:“在該日或該日之后使用我們的服務(wù),您將同意這些修訂。”
但Twitter沒有清楚地說明更新的內(nèi)容,只說更新“關(guān)注我們?yōu)槟峁┑挠嘘P(guān)您的個(gè)人數(shù)據(jù)的控制措施,以及Twitter如何公開分享您的數(shù)據(jù)”。由于GDPR,Twitter還關(guān)閉了Roku,Android TV和Xbox版的Twitter應(yīng)用。
Rael Cline創(chuàng)辦的MediaGamma公司使用人工智能做出實(shí)時(shí)決策,他們的產(chǎn)品之一是幫助廣告商根據(jù)用戶的興趣為相關(guān)的用戶投放相關(guān)廣告。“我們必須做出一些改變,以確保能遵守GDPR,做法包括限制我們持有授權(quán)的數(shù)據(jù)的時(shí)間,以及確保我們可以在客戶要求的情況下刪除特定用戶的所有記錄。”Rael Cline說。
同時(shí),Rael Cline也認(rèn)為,GDPR給人們提供了一個(gè)利用人工智能填補(bǔ)空白的機(jī)會。例如,在在線廣告行業(yè)中,隨著同意(企業(yè)新隱私條款)的用戶數(shù)量的減少,我們可以應(yīng)用人工智能來對這些已同意的用戶的行為進(jìn)行建模,然后根據(jù)共享屬性找到相似的用戶,這被稱為“l(fā)ookalike”。
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7254瀏覽量
91788 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8501瀏覽量
134541 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5560瀏覽量
122763
原文標(biāo)題:【深度學(xué)習(xí)不是犯罪】歐盟祭出最嚴(yán)數(shù)據(jù)保護(hù)法:專家解讀 GDPR
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
史上最嚴(yán)電池新國標(biāo),30%企業(yè)恐出局
“史上最嚴(yán)電池安全令”落地,ZAD2108溫度采集器助力測試

嵌入式AI技術(shù)之深度學(xué)習(xí):數(shù)據(jù)樣本預(yù)處理過程中使用合適的特征變換對深度學(xué)習(xí)的意義
智慧路燈如何提升破案率

評論