女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)中的隱私保護(hù)

倩倩 ? 來(lái)源:雷鋒網(wǎng) ? 2020-04-15 16:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大數(shù)據(jù)時(shí)代的隱私泄露如達(dá)摩克利斯之劍,高懸在每個(gè)網(wǎng)民頭上,而關(guān)于如何保護(hù)數(shù)據(jù)隱私我們也走了很長(zhǎng)的路。

1977 年,統(tǒng)計(jì)學(xué)家 Tore Dalenius 給出關(guān)于數(shù)據(jù)隱私的嚴(yán)格定義:攻擊者不能從隱私數(shù)據(jù)里獲取任何在沒(méi)有拿到數(shù)據(jù)之前他們所不知道的個(gè)人信息。

2006 年,計(jì)算機(jī)學(xué)者 Cynthia Dwork 證明上述定義的隱私保護(hù)是不存在的。有一個(gè)直觀例子可以幫助理解:假設(shè)攻擊者知道 Alice 的身高比 Lithuanian 女性平均身高高 2 英寸,這樣攻擊者只需要從一個(gè)數(shù)據(jù)集里獲得 Lithuanian 女性身高平均值(在接觸數(shù)據(jù)前攻擊者并不知道),就能準(zhǔn)確獲得 Alice 的精確身高,甚至 Alice 都不需要在這個(gè)數(shù)據(jù)集里。因此,對(duì)于一份有信息量的數(shù)據(jù),不可能完全不暴露隱私信息。

2018 年,史上最嚴(yán)苛的個(gè)人隱私保護(hù)法案《通用數(shù)據(jù)保護(hù)條例》( GDPR )正式生效,開(kāi)創(chuàng)了互聯(lián)網(wǎng)誕生以來(lái)的最大變革,數(shù)據(jù)隱私問(wèn)題得到前所未有的重視。

近日,雷鋒網(wǎng)了解到,第四范式先知( Sage )企業(yè)級(jí) AI 平臺(tái)已經(jīng)完成 PrivacySeal EU 認(rèn)證工作程序,率先通過(guò)歐盟 GDPR 認(rèn)證,成為國(guó)內(nèi)第一款通過(guò)該認(rèn)證的 AI 平臺(tái)產(chǎn)品,實(shí)證基于第四范式隱私計(jì)算技術(shù)的數(shù)據(jù)安全性和可信任性,那么,他們是如何保護(hù)用戶隱私安全的?為此,雷鋒網(wǎng)和第四范式的主任科學(xué)家涂威威聊了聊。

匿名化或許是個(gè)偽命題?

不知道有多少童鞋記得去年谷歌母公司 Alphabet Inc 因違反隱私數(shù)據(jù)法被罰款 5000 萬(wàn)歐元的事情,據(jù)說(shuō)這是迄今為止歐洲范圍內(nèi),一家公司因違反隱私數(shù)據(jù)法遭受到的最高額處罰金。多家英文科技媒體報(bào)道時(shí),都用了 “record high”(破紀(jì)錄地高)描述處罰力度之狠。

為什么谷歌會(huì)受到如此嚴(yán)重的懲罰?

首先,谷歌會(huì)收集自家相關(guān)應(yīng)用和第三方網(wǎng)頁(yè)訪問(wèn)的活動(dòng)數(shù)據(jù),通過(guò)安卓設(shè)備的“設(shè)備標(biāo)識(shí)”以及“廣告標(biāo)識(shí)符”,將應(yīng)用數(shù)據(jù)上傳至谷歌服務(wù)器,并與用戶的谷歌賬戶關(guān)聯(lián),形成了完整的閉合。簡(jiǎn)單來(lái)說(shuō),谷歌通過(guò)被動(dòng)方式收集的所謂“匿名數(shù)據(jù)”與用戶的個(gè)人信息相關(guān)聯(lián) ——繞了一大圈,最后大費(fèi)周章用“合法手段”應(yīng)用用戶信息。

同樣地,Google Ad Manager 的 Cookie ID(跟蹤用戶在第三方網(wǎng)頁(yè)上的活動(dòng)緩存信息)是另一個(gè)據(jù)稱是“用戶匿名”標(biāo)識(shí)符。如果用戶在同一瀏覽器中訪問(wèn)Google應(yīng)用程序,Google 可以將其連接到用戶的 Google 帳戶之前訪問(wèn)過(guò)第三方網(wǎng)頁(yè)。

換句話說(shuō),雖然通常在用戶匿名的情況下收集信息,但 Google 明顯擁有利用從其他來(lái)源收集的數(shù)據(jù)來(lái)對(duì)此類集合進(jìn)行去匿名化的能力。

Google 之所以出現(xiàn)這類問(wèn)題,主要源于其產(chǎn)品在數(shù)據(jù)流轉(zhuǎn)及應(yīng)用上不嚴(yán)謹(jǐn)所致,同時(shí),一些常規(guī)匿名化手段的技術(shù)缺陷同樣不容忽視。

而谷歌的廣告業(yè)務(wù)幾乎覆蓋了 90% 全球用戶,200 萬(wàn)個(gè)主流網(wǎng)站,也就是說(shuō)不經(jīng)意間我們的生活已經(jīng)被谷歌的 “數(shù)據(jù)操控” 看了個(gè)清清楚楚明明白白。

2010 年,個(gè)人隱私律師 Paul Ohm 就曾在 UCLA 法律評(píng)論中刊文指出,雖然惡意攻擊者可以使用個(gè)人身份信息(如姓名或社會(huì)安全號(hào)碼)將數(shù)據(jù)與個(gè)人身份進(jìn)行關(guān)聯(lián),但事實(shí)證明,即便只擁有那些不會(huì)被歸類為“個(gè)人身份信息”的信息,他們也可以達(dá)到同樣的目的。

Ohm 參考了 Sweeney 早期的一些研究,她發(fā)現(xiàn) 1990 年美國(guó)人口普查中有 87% 的人可以通過(guò)兩條信息進(jìn)行唯一識(shí)別:他們的出生日期和他們住址的郵政編碼。Ohm 還引用了 Netflix 以及其他有關(guān)數(shù)據(jù)泄露的案例,并得出結(jié)論:在傳統(tǒng)的以個(gè)人身份信息為保護(hù)重點(diǎn)的匿名化技術(shù)下,幾乎任何數(shù)據(jù)都無(wú)法實(shí)現(xiàn)永久的完全匿名。

鏈接攻擊、同質(zhì)化攻擊等方式都可能從匿名化數(shù)據(jù)中定位個(gè)人身份。例如鏈接攻擊,通過(guò)數(shù)據(jù)的半標(biāo)識(shí)符在其他能找到的表上進(jìn)行查詢,則可能找到對(duì)應(yīng)的身份定位標(biāo)識(shí)符以及其他敏感信息。

2013 年,研究人員發(fā)現(xiàn)位置數(shù)據(jù)具有高度的獨(dú)特性,因此更加難以匿名化。許多匿名數(shù)據(jù)庫(kù)都可能間接泄露你的位置,例如刷卡消費(fèi)或前往醫(yī)院就診。研究人員發(fā)現(xiàn),通過(guò)每小時(shí)記錄4次手機(jī)連接到的信號(hào)發(fā)射塔,就可以對(duì) 95% 的設(shè)備進(jìn)行唯一識(shí)別。如果數(shù)據(jù)更精細(xì)( GPS 跟蹤而不是信號(hào)發(fā)射塔,或者實(shí)時(shí)采集而不是每小時(shí)采集),匹配則會(huì)變得更加容易。

于是,大家開(kāi)始意識(shí)到“匿名化”這東西并沒(méi)有那么安全,我們的信息還是會(huì)被竊取。

所以,一向注重用戶隱私的蘋果在 2016 的開(kāi)發(fā)者大會(huì)上提出了“差分隱私(Differential Privacy)”的概念。即通過(guò)算法來(lái)打亂個(gè)體用戶數(shù)據(jù),讓任何人都不能憑此追蹤到具體的用戶,但又可以允許機(jī)構(gòu)成批分析數(shù)據(jù)以獲得大規(guī)模的整體趨勢(shì)用于機(jī)器學(xué)習(xí)。將用戶隱私信息儲(chǔ)存在本機(jī)而非云端也是蘋果保護(hù)用戶隱私的方法之一。例如 Face ID 面容信息、Touch ID 指紋信息等都存儲(chǔ)在 iPhone 的芯片上。

不過(guò),差分隱私還是無(wú)法避免多個(gè)相關(guān)數(shù)據(jù)上報(bào)而導(dǎo)致的隱私泄露。更何況,道高一尺魔高一丈,匿名方法推陳出新的同時(shí),攻擊者們也會(huì)采用更為強(qiáng)力的識(shí)別工具。

那么,第四范式推出的差分隱私又是如何做的呢?

機(jī)器學(xué)習(xí)中的隱私保護(hù)

據(jù)涂威威介紹,目前已有差分隱私機(jī)器學(xué)習(xí)算法上的工作,往往是通過(guò)往訓(xùn)練過(guò)程內(nèi)注入噪聲來(lái)實(shí)現(xiàn)差分隱私。

常見(jiàn)的有三種:目標(biāo)函數(shù)擾動(dòng)(objective perturbation)、輸出擾動(dòng)(output perturbation)、梯度擾動(dòng)(gradient perturbation)。常見(jiàn)的機(jī)器學(xué)習(xí)算法,以最簡(jiǎn)單的 logistic regression 算法為例,已經(jīng)有成熟的差分隱私算法,以及隱私保護(hù)和學(xué)習(xí)效果上的理論保障。然而就目前的方法以及對(duì)應(yīng)的理論來(lái)看,對(duì)于隱私保護(hù)的要求越高,需要注入的噪聲強(qiáng)度越大,從而對(duì)算法效果造成嚴(yán)重負(fù)面影響。

為了改善上述問(wèn)題,第四范式基于以往 Stacking 集成學(xué)習(xí)方法的成效,將 Stacking 方法與差分隱私機(jī)器學(xué)習(xí)算法相結(jié)合。Stacking 需要將數(shù)據(jù)按照樣本分成數(shù)份。并且提出了基于樣本和基于特征切分的兩種 Stacking 帶隱私保護(hù)的機(jī)器學(xué)習(xí)算法。

在該算法中,數(shù)據(jù)按樣本被分成兩份,其中一份按特征或按樣本分割后在差分隱私的約束下訓(xùn)練 K 個(gè)子模型,并在第二份上通過(guò)差分隱私機(jī)器學(xué)習(xí)算法進(jìn)行融合。

按特征切分相比過(guò)去的算法和按樣本切分算法有更低的泛化誤差。同時(shí),按特征切分有另一個(gè)優(yōu)勢(shì),如果知道特征重要性,第四范式的差分隱私算法可以將其編入算法中,從而使得重要的特征被擾動(dòng)的更少,在保持整體的隱私保護(hù)不變的情況下,可以得到更好的效果。

此外,還可以直接拓展到遷移學(xué)習(xí)上。即在源數(shù)據(jù)集上按照特征切分后得到帶隱私保護(hù)的模型,通過(guò)模型遷移,遷移到目標(biāo)數(shù)據(jù)集上并通過(guò) Stacking 進(jìn)行融合。在這種情況下,源數(shù)據(jù)可以在不暴露隱私的情況下輸出模型幫助目標(biāo)數(shù)據(jù)提升學(xué)習(xí)效果,而目標(biāo)數(shù)據(jù)也可以在保護(hù)自身數(shù)據(jù)隱私的約束下訓(xùn)練模型。

不過(guò),值得注意的是,以差分隱私為代表的隱私保護(hù)技術(shù)仍需要在理論、效果、應(yīng)用、成本等方面進(jìn)一步解決和優(yōu)化。

涂威威介紹說(shuō):“比如,在成本方面,核心的問(wèn)題其實(shí)是人力。機(jī)器學(xué)習(xí)已經(jīng)是很復(fù)雜的技術(shù),落地需要很專業(yè)的人才。當(dāng)前的隱私保護(hù)技術(shù)使用門檻較高,在保護(hù)隱私的前提下,多方聯(lián)合數(shù)據(jù)建模的常見(jiàn)做法依然需要比較多的專家人工介入到數(shù)據(jù)預(yù)處理、特征工程、模型調(diào)參當(dāng)中,因此落地的人才門檻更高。且人力的介入又會(huì)給數(shù)據(jù)安全與隱私保護(hù)帶來(lái)一層隱患。”

因此,在差分隱私的基礎(chǔ)上,又衍生出了另一種保護(hù)隱私的自動(dòng)多方機(jī)器學(xué)習(xí)技術(shù)。第四范式綜合了差分隱私技術(shù)、自動(dòng)化機(jī)器學(xué)習(xí)技術(shù),讓機(jī)器自動(dòng)完成數(shù)據(jù)預(yù)處理、特征工程、模型調(diào)參等工作,大幅減少了專家人工的介入,一方面進(jìn)一步提升了安全性,另一方面也大幅降低了隱私保護(hù)技術(shù)的使用門檻,使得廣泛落地成為可能。該技術(shù)也將是保證技術(shù)規(guī)模化落地的關(guān)鍵。

最后,雷鋒網(wǎng)想提醒大家,雖然在隱私和便利面前,我們都抓禿了頭,但不代表這就沒(méi)法解決了。

電影《絕對(duì)控制》中有一句話:“隱私不是公民權(quán),而是特權(quán)”;隱私本應(yīng)是每個(gè)公民最基礎(chǔ)的權(quán)利,只不過(guò)在過(guò)去的很長(zhǎng)時(shí)間中,我們從未意識(shí)到行使這項(xiàng)權(quán)利,以至于隱私竟變成了“特權(quán)”,不過(guò)慶幸的是隱私權(quán)正在回歸,人們正在拾回分散在互聯(lián)網(wǎng)中的隱私

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1789

    瀏覽量

    58983
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4709

    瀏覽量

    95334
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8501

    瀏覽量

    134566
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【HarmonyOS 5】鴻蒙應(yīng)用隱私保護(hù)詳解

    【HarmonyOS 5】鴻蒙應(yīng)用隱私保護(hù)詳解 ##鴻蒙開(kāi)發(fā)能力 ##HarmonyOS SDK應(yīng)用服務(wù)##鴻蒙金融類應(yīng)用 (金融理財(cái)# 一、前言 在今天這個(gè)手機(jī)不離手的時(shí)代,我們每天用手機(jī)支付
    的頭像 發(fā)表于 07-11 18:30 ?266次閱讀

    深度自然匿名化:隱私保護(hù)與視覺(jué)完整性并存的未來(lái)!

    在科技快速發(fā)展的當(dāng)下,個(gè)人隱私保護(hù)的需求日益凸顯。如何能在隱私保護(hù)的基礎(chǔ)上,保持視覺(jué)完整性,從而推動(dòng)企業(yè)開(kāi)發(fā)與創(chuàng)新? 深度自然匿名化(DNAT)已被證明是傳統(tǒng)模糊化方法的更優(yōu)替代方案,
    的頭像 發(fā)表于 01-15 15:57 ?4488次閱讀
    深度自然匿名化:<b class='flag-5'>隱私</b><b class='flag-5'>保護(hù)</b>與視覺(jué)完整性并存的未來(lái)!

    傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

    在上一篇文章,我們介紹了機(jī)器學(xué)習(xí)的關(guān)鍵概念術(shù)語(yǔ)。在本文中,我們會(huì)介紹傳統(tǒng)機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí)和多種算法特征,供各位老師選擇。 01 傳統(tǒng)
    的頭像 發(fā)表于 12-30 09:16 ?1179次閱讀
    傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)

    如何選擇云原生機(jī)器學(xué)習(xí)平臺(tái)

    當(dāng)今,云原生機(jī)器學(xué)習(xí)平臺(tái)因其彈性擴(kuò)展、高效部署、低成本運(yùn)營(yíng)等優(yōu)勢(shì),逐漸成為企業(yè)構(gòu)建和部署機(jī)器學(xué)習(xí)應(yīng)用的首選。然而,市場(chǎng)上的云原生機(jī)器
    的頭像 發(fā)表于 12-25 11:54 ?452次閱讀

    zeta在機(jī)器學(xué)習(xí)的應(yīng)用 zeta的優(yōu)缺點(diǎn)分析

    在探討ZETA在機(jī)器學(xué)習(xí)的應(yīng)用以及ZETA的優(yōu)缺點(diǎn)時(shí),需要明確的是,ZETA一詞在不同領(lǐng)域可能有不同的含義和應(yīng)用。以下是根據(jù)不同領(lǐng)域的ZETA進(jìn)行的分析: 一、ZETA在機(jī)器
    的頭像 發(fā)表于 12-20 09:11 ?1120次閱讀

    cmp在機(jī)器學(xué)習(xí)的作用 如何使用cmp進(jìn)行數(shù)據(jù)對(duì)比

    機(jī)器學(xué)習(xí)領(lǐng)域,"cmp"這個(gè)術(shù)語(yǔ)可能并不是一個(gè)常見(jiàn)的術(shù)語(yǔ),它可能是指"比較"(comparison)的縮寫。 比較在機(jī)器學(xué)習(xí)的作用 模型
    的頭像 發(fā)表于 12-17 09:35 ?869次閱讀

    隱私與安全:動(dòng)態(tài)海外住宅IP如何保護(hù)你在線

    動(dòng)態(tài)海外住宅IP在保護(hù)用戶在線隱私與安全方面發(fā)揮著重要作用。
    的頭像 發(fā)表于 11-25 08:09 ?400次閱讀

    比亞迪獲得國(guó)家首批汽車隱私保護(hù)標(biāo)識(shí)

    近日,在2024國(guó)汽車軟件大會(huì)上,中國(guó)汽車工業(yè)協(xié)會(huì)與中國(guó)網(wǎng)絡(luò)安全產(chǎn)業(yè)聯(lián)盟汽車網(wǎng)絡(luò)安全工作委員會(huì)聯(lián)合頒發(fā)“汽車隱私保護(hù)”標(biāo)識(shí)證書,比亞迪成為首批通過(guò)測(cè)評(píng)并獲得“汽車隱私
    的頭像 發(fā)表于 11-18 16:14 ?660次閱讀

    什么是機(jī)器學(xué)習(xí)?通過(guò)機(jī)器學(xué)習(xí)方法能解決哪些問(wèn)題?

    計(jì)算機(jī)系統(tǒng)自身的性能”。事實(shí)上,由于“經(jīng)驗(yàn)”在計(jì)算機(jī)系統(tǒng)主要以數(shù)據(jù)的形式存在,因此機(jī)器學(xué)習(xí)需要設(shè)法對(duì)數(shù)據(jù)進(jìn)行分析學(xué)習(xí),這就使得它逐漸成為智能數(shù)據(jù)分析技術(shù)的創(chuàng)新源之一,
    的頭像 發(fā)表于 11-16 01:07 ?959次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過(guò)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問(wèn)題?

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    在人工智能領(lǐng)域,機(jī)器學(xué)習(xí)算法是實(shí)現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升,對(duì)計(jì)算資源的需求也在不斷增長(zhǎng)。NPU作為一種專門為深度學(xué)習(xí)機(jī)器
    的頭像 發(fā)表于 11-15 09:19 ?1205次閱讀

    eda在機(jī)器學(xué)習(xí)的應(yīng)用

    機(jī)器學(xué)習(xí)項(xiàng)目中,數(shù)據(jù)預(yù)處理和理解是成功構(gòu)建模型的關(guān)鍵。探索性數(shù)據(jù)分析(EDA)是這一過(guò)程不可或缺的一部分。 1. 數(shù)據(jù)清洗 數(shù)據(jù)清洗 是機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 11-13 10:42 ?885次閱讀

    魯棒性在機(jī)器學(xué)習(xí)的重要性

    金融風(fēng)險(xiǎn)評(píng)估。這些應(yīng)用場(chǎng)景對(duì)模型的魯棒性提出了極高的要求。 魯棒性的定義 魯棒性通常被定義為系統(tǒng)在面對(duì)不確定性和變化時(shí)仍能保持其功能的能力。在機(jī)器學(xué)習(xí),這意味著即使輸入數(shù)據(jù)包含錯(cuò)誤、噪聲或被故意篡改,模型
    的頭像 發(fā)表于 11-11 10:19 ?1257次閱讀

    IP地址安全與隱私保護(hù)

    在當(dāng)今數(shù)字化時(shí)代,IP地址作為網(wǎng)絡(luò)設(shè)備的唯一身份標(biāo)識(shí),在網(wǎng)絡(luò)安全與隱私保護(hù)扮演著至關(guān)重要的角色。然而,隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,IP地址也面臨著諸多挑戰(zhàn),對(duì)用戶的隱私和網(wǎng)絡(luò)安全構(gòu)成了潛
    的頭像 發(fā)表于 09-03 15:59 ?1087次閱讀

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 簡(jiǎn)單建議

    這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時(shí)間序列分析與機(jī)器學(xué)習(xí)融合應(yīng)用的宏偉藍(lán)圖。作者不僅扎實(shí)地構(gòu)建了時(shí)間序列分析的基礎(chǔ)知識(shí),更巧妙地展示了機(jī)器學(xué)習(xí)如何在這一領(lǐng)域發(fā)揮巨
    發(fā)表于 08-12 11:21

    平衡創(chuàng)新與倫理:AI時(shí)代的隱私保護(hù)和算法公平

    成了一把雙刃劍,其銳利的一面正逐漸指向我們的核心價(jià)值。面對(duì)這些挑戰(zhàn),制定一套有效的AI治理框架和隱私保護(hù)機(jī)制變得迫在眉睫。 確保AI決策的透明度是解決這些問(wèn)題的關(guān)鍵一步。透明度不僅要求公開(kāi)算法的運(yùn)作
    發(fā)表于 07-16 15:07