近日,27 歲的中國黃岡女孩李瓊秀,成為歐洲信號處理會議(EUSIPCO)會議年度三分鐘論文比賽的冠軍,該會議由歐洲信號處理協會(EURASIP)主辦,是歐洲信號處理領域的頂級會議。
談及拿到冠軍,她說自己的演講內容時效性較強,邏輯性也比較強。目前,她正在丹麥奧爾堡大學信息與通信工程讀博,馬上即將畢業。
演講中,她提到了前不久發表在IEEE Transactions on Signal Processing 的論文《通過子空間擾動實現隱私保護的分布式優化:一個通用框架》(Privacy-Preserving Distributed Optimization via Subspace Perturbation: A General Framework)。作為論文第一作者,她已把相關 MATLAB 代碼開源到 GitHub 上。
該研究要解決的痛點在于,在日益數字化和互聯的現代世界中,人們在處理大量數據時,一般會使用分布式信號處理技術。然而,阻礙分布式信號處理技術廣泛使用的一個難題,是在處理敏感數據時的隱私問題。
舉一個簡單的例子,比如智能電網,很多家庭會安裝智能電表,來記錄用電量等信息。通過收集這些用電量信息可以做更好的用電規劃。
但是用電量不能被隨意泄露,有研究表明很多個人信息都能通過用電量泄露,比如家里住了幾口人、身體健康情況、以及出行信息等。
李瓊秀提醒稱,用戶不要區分哪項個人信息更重要,其實跟自己相關的每項信息都重要,都有可能泄露很多敏感的個人信息。
舉例說,用戶的身體健康狀況比如是否患有帕金森綜合征可以通過語音信息泄露 。再比如說,不法分子可以通過一張匿名的十次公交車票,來推斷出乘客的身份信息。
為了保護用戶隱私,李瓊秀提出一種新型子空間擾動方法,在去中心化系統中它規避了傳統的隱私保護算法比如差分隱私和安全多方計算(SMPC)方法的局限性,該方法允許每個節點 / 用戶在保護私有數據的前提下,獲得所需的解決方案。
通過在子空間中插入擾動噪聲,這樣不僅可以保護私有數據不被泄露給他人,而且結果的準確性也不受影響。
研究中,她證明出在每個分布式優化器中引入的對偶變量,不會收斂于由圖拓撲確定的某個子空間中。此外,算法還保證優化變量收斂于所需的解,因為它與這個非收斂的子空間正交。
因此她通過對偶變量在非收斂的子空間中插入噪聲,從而保護私有數據,并且所期望的解的精度完全不受影響。
研究證明,該方法在被動(半誠實)和竊聽兩種廣泛使用的攻擊者模型下是安全的,她還考慮了一些常用的分布式優化算子如交替方向乘子法(ADMM)和 PDMM,以證明該方法的一般適用性。
最后,李瓊秀通過一組應用程序來測試性能。數值測試表明,該方法在估計精度、隱私水平、通信成本和收斂速度等參數方面都優于現有的方法。
與傳統的集中式系統相比,所有數據必須首先從不同的單元收集,然后在中央服務器上處理,而分布式信號處理利用網絡特性繞過了這一限制。
也就是說,每個節點 / 單元不依賴于單一的集中協調,而是能夠從鄰居那里收集信息,并對整個網絡數據的子集進行計算。這種分布式處理有許多優點,例如允許節點數量的靈活可伸縮性,以及對圖拓撲的動態變化的魯棒性。
目前,分布式系統中的計算單元 / 節點資源往往比較有限,因為平板電腦和手機成為多數用戶使用的主要計算設備。
這些設備通常包含可使用無線通信形成所謂的臨時網絡的傳感器,因此這些設備可通過共享計算資源和傳感器數據來協作解決問題。
然而,從 GPS、照相機和麥克風等傳感器收集到的信息中,通常包括個人數據,這很讓人擔憂,因為這些數據本質上是私有的。
分布式優化算法在各個領域有廣泛應用,因為分布式系統中的許多傳統信號處理問題,可以等價形成凸優化問題。
由于分布式優化的普遍適用性和靈活性,優化已經出現在聲學信號處理、控制理論和圖像處理等廣泛的應用中。
通常,分布式優化的范式是將網絡上的全局目標函數,分離為幾個局部目標函數,即只能通過與鄰居交換數據來解決全局目標優化問題。
這種數據交換是引起隱私問題的主要原因,因為交換的數據通常包含敏感信息,而傳統的分布式優化方案并不能解決這個隱私問題。因此,如何設計一個能夠處理敏感數據的分布式優化器,是該領域需要克服的挑戰。
兼容可通用,可解決所有凸的分布式優化問題
李瓊秀告訴 DeepTech,基于分布式優化的子空間擾動算法是一個可兼容的通用的隱私保護算法, 可以解決所有凸的分布式優化問題。
此前在該領域主流算法有兩種:差分隱私算法和安全多方計算算法。以差分隱私算法為例,其主要缺點在于結果不太準確,而本算法的結果非常準確。
談及研究步驟,她表示,在做隱私保護的研究時,很多學者的初始想法是從密碼學中尋找已經合適并且成熟的工具來應用到自己的研究領域中,所以主流的隱私保護分布式優化算法主要包括差分隱私和安全多方計算這兩種已有算法。
而李瓊秀則另辟蹊徑,從分布式優化算法本身出發,發現了該問題本身存在一種子空間特性。
基于該特性,她提出如果把噪聲擾動放在不受影響的子空間中,可達到既不影響最后結果準確度、還能隱私保護的效果。她說,正因為自己的想法,完全區別于主流算法,所以才能被 IEEE TSP 收錄論文。
研究中,她用 MATLAB 語言做了仿真,為了證明猜想的正確性,她首先模擬一個分布式(去中心化)的系統,系統中每個用戶 & 節點都只與和自己足夠接近的鄰居相連接,只有連接的用戶之間才能交流通信。
然后在這個分布式系統試驗解決一些常見的分布式優化問題,接著再通過提出的隱私保護算法來解決這些問題,最終通過仿真結果嚴重算法性能。
該算法具有兩大優點,李瓊秀表示,這兩大優點是和前文提到的兩種算法對比后得出的。其一是相比于差分隱私,它的優點是不需要在隱私和算法準確度之間權衡取舍;
其二,相比于安全多方計算里的同態加密和秘密共享技術,其計算和傳輸復雜度都很小。她說,整個算法非常優雅,只是對其進行初始化,即可進行隱私保護。
在前文提到的三分鐘演講中,她提到一個新冠追蹤 App 的案例,由于歐盟的通用數據保護條例(GDPR),歐洲這邊開發此類追蹤 App 同時必須遵守此類隱私保護法律。
比如在她的留學所在國丹麥,在推出新館追蹤 App 之前花了很久的時間嵌入隱私保護算法來保證用戶隱私信息不被泄露。
無需經過第三方權威的去中心化信號處理
她還講到分布式信號處理,事實上這也是一種去中心化信號處理。不同于中心化信號處理,去中心化信號處理無需經過一個第三方權威。
以手機使用的谷歌服務為例,所有用戶都是依賴谷歌,谷歌角色為權威第三方。而去中心化,則無需依賴谷歌,通過用戶 A 和用戶 B 之間的直接一對一交流,即可形成分布式網絡。
也就是無需完全依賴于第三方權威。中心化的缺點在于要完全依賴(很多時候也需要信任)第三方,但是第三方是否值得依賴和信任還得另說。
而在去中心化系統中做隱私保護,正是李瓊秀研究的課題。但是在去中心化信號處理,用戶 A 要面對很多其他用戶,這時要做隱私保護,一是不能直接把秘密告訴別人。
這時最常用的做法,是設計一個加密方程,然后在上面做一個噪聲擾動,把秘密變得 “不像秘密”,這時向外界展示被擾動的東西,其他人就無法獲悉真正的秘密。
而之后的計算比如機器學習、跟蹤優化等,都是在被擾動的數據上面計算,由此達到保留秘密、合作雙贏的目的。
說起自己研究的分布式優化,李瓊秀說可能很多人覺得和自己的研究領域沒關系,但其實很多領域都沒辦法離開優化,分布式優化可應用到很多領域,比如機器學習,聯邦學習等。
基于上次論文,李瓊秀正在對算法做量化,即在減少算法傳輸帶寬的同時,還能保證收斂速度和算法準確度。
堅持讀博夢,工作后重新踏入校園
李瓊秀生于 1993 年,來自湖北省黃岡市浠水縣的一個小村莊,大學考上東北大學秦皇島分校,學習電子信息工程,本科總成績排名專業第一。
大學畢業后拿到全額獎學金(學費+生活費)進入韓國仁荷大學學習信息與通信工程,攻讀碩士學位。談及為什么選擇韓國攻讀碩士學位,她表示主要是由于經濟原因,其實她本身是希望去歐洲讀碩士。
2016 年底,在碩士第三學期時李瓊秀嘗試申請丹麥奧爾堡大學信息與通信工程馬德?格拉斯布爾?克里斯滕森(Mads Gr?sb?ll Christensen)教授的博士生,但是很遺憾由于碩士還沒有畢業所以沒有入學資格。
碩士畢業后, 她選擇來到杭州工作。大約半年后,收到克里斯滕森教授的邀請,說他有一個新項目需要招募博士生,問其是否還愿意來丹麥讀博。
這點燃了李瓊秀心中的博士夢,抱著對學術的憧憬和向往,她很快飛到丹麥讀書,并在讀博期間,來到代爾夫特理工大學的 Richard Heusdens 教授的研究組做了幾個月的訪問學者。
談及未來,她計劃前往新加坡國立大學和美國普林斯頓大學做博后,并且會繼續做隱私保護去中心化相關的研究,之后再考慮到底去業界還是去高校工作的問題。
責任編輯:haq
-
數據
+關注
關注
8文章
7255瀏覽量
91816 -
信號
+關注
關注
11文章
2851瀏覽量
78258
原文標題:27歲黃岡女生提出新型子空間擾動方法,打破數據流動壁壘!獲歐洲信號處理會議論文大賽冠軍 | 專訪
文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
打破協議壁壘,CAN轉EtherCAT連接工業相機秒變跨國CP”!
雙定子直線振蕩電機動子位移自傳感技術研究
PROFINET轉EtherCAT網關模塊:打破工業通訊協議壁壘的利刃

永磁同步電機新型矢量控制
飛凌嵌入式ElfBoard ELF 1板卡-內核空間與用戶空間的數據拷貝之數據拷貝介紹
工業網關:打破數據壁壘,實現多源數據高效互聯互通
秒驗三網合一,打破運營商壁壘的用戶增長加速器
使用ADS1281做調制器,兩個調制器都是輸出1位的數據流,那合并之后數據流是幾位的呢?
理解ECU數據流的分析方法
請問TLV320AIC3254EVM-K怎么讀取音頻數據流?
解密DMA:加速數據流動的關鍵
把好事辦好:工業設備更新上云難題與破解
怎樣減小或消除擾動產生的穩態誤差
無擾動快切裝置是什么?無擾動快切裝置原理是什么?無擾動快切裝置有哪些功能?

評論