有人說(shuō),智能手機(jī)就如同一部竊聽(tīng)器,無(wú)論你開(kāi)機(jī)或者關(guān)機(jī),它都會(huì)無(wú)時(shí)不刻地監(jiān)聽(tīng)著用戶的一舉一動(dòng),而隨著車(chē)聯(lián)網(wǎng)的發(fā)展,汽車(chē)會(huì)越來(lái)越智能化,就像是一部“裝著四個(gè)輪子的手機(jī)”,可想而知,智能車(chē)輛上的信息安全問(wèn)題可能比智能手機(jī)更加嚴(yán)重。比如車(chē)輛的定位信息、相機(jī)所記錄下的路端畫(huà)面、車(chē)艙內(nèi)的乘客錄音錄像等等,這些數(shù)據(jù)作為智能車(chē)發(fā)展的“燃料劑”,既是不可或缺的,又需要去避免敏感數(shù)據(jù)的泄露風(fēng)險(xiǎn)。
政府監(jiān)管部門(mén)也開(kāi)始關(guān)注到了智能車(chē)的數(shù)據(jù)風(fēng)險(xiǎn),比如去年10月發(fā)布的《汽車(chē)數(shù)據(jù)安全管理若干規(guī)定(試行)》規(guī)定就提到車(chē)上攝像頭所采集到的人臉、車(chē)牌等信息需要進(jìn)行匿名化處理,意味著車(chē)上產(chǎn)生的敏感信息必須要進(jìn)行脫敏處理。筆者也了解到,自動(dòng)駕駛發(fā)展至今,數(shù)據(jù)脫敏處理在今年引起了大部分主機(jī)廠的重點(diǎn)關(guān)注。
那么,數(shù)據(jù)脫敏具體指的是什么?又是如何進(jìn)行數(shù)據(jù)脫敏?數(shù)據(jù)脫敏在自動(dòng)駕駛的應(yīng)用中又面臨什么樣的挑戰(zhàn)?帶著這些問(wèn)題,有幸與行業(yè)內(nèi)的專家進(jìn)行了交流,包括但不限于中國(guó)汽車(chē)技術(shù)研究中心首席專家兼中汽數(shù)據(jù)車(chē)聯(lián)網(wǎng)業(yè)務(wù)部部長(zhǎng)張亞楠、中汽數(shù)據(jù)信息安全室主管劉天宇、木衛(wèi)四科技的解決方案總監(jiān)李浩文、信大捷安的IoT事業(yè)部總經(jīng)理王建偉、整數(shù)科技的創(chuàng)始人兼CEO林群書(shū)等。
一、何謂數(shù)據(jù)脫敏
1.1 數(shù)據(jù)脫敏的定義一般來(lái)說(shuō),數(shù)據(jù)脫敏技術(shù)指的是在對(duì)敏感數(shù)據(jù)進(jìn)行處理的過(guò)程中,通過(guò)數(shù)據(jù)變形(將數(shù)據(jù)變成模型想要的結(jié)構(gòu),如1234->1**4)的方式來(lái)降低數(shù)據(jù)的敏感程度的一種數(shù)據(jù)處理技術(shù)。
有時(shí)候,數(shù)據(jù)脫敏也會(huì)有一些相近的概念,比如去標(biāo)識(shí)化、匿名化及假名化,但數(shù)據(jù)脫敏與去標(biāo)識(shí)化和匿名化的相關(guān)技術(shù)本質(zhì)上是沒(méi)有任何區(qū)別的,而假名化則是匿名化和去標(biāo)識(shí)化的一種技術(shù)實(shí)現(xiàn)方式。
總的來(lái)說(shuō),在一定層面上,去標(biāo)識(shí)化、匿名化及假名化,都可以歸為數(shù)據(jù)脫敏。
在大數(shù)據(jù)時(shí)代下,數(shù)據(jù)脫敏技術(shù)并不是什么新鮮技術(shù),它在其它領(lǐng)域中已經(jīng)被廣泛應(yīng)用,比如政務(wù)、金融、醫(yī)療、電信等。
在自動(dòng)駕駛領(lǐng)域,中汽協(xié)發(fā)布的《汽車(chē)傳輸視頻及圖像脫敏技術(shù)要求與方法》也定義了數(shù)據(jù)脫敏,其主要指通過(guò)一定方法在車(chē)端數(shù)據(jù)處理設(shè)備上消除原始環(huán)境數(shù)據(jù)中的敏感信息,使得信息主體無(wú)法被識(shí)別或者關(guān)聯(lián),且處理后的信息不能被復(fù)原,同時(shí)保留目標(biāo)環(huán)境業(yè)務(wù)所需的數(shù)據(jù)特征或內(nèi)容的數(shù)據(jù)處理過(guò)程。
為了讓讀者更好地理解,我們以人臉脫敏為例做個(gè)解釋:數(shù)據(jù)脫敏就是將人臉的關(guān)鍵信息隱去或者模糊化(通俗點(diǎn)說(shuō),就是在臉部打了個(gè)馬賽克),甚至不能讓別人通過(guò)其它關(guān)聯(lián)信息(比如習(xí)慣性出沒(méi)的地方、本人所穿的衣服等等)來(lái)識(shí)別出這個(gè)人“具體是誰(shuí)”,并且整個(gè)過(guò)程是不可逆的,但該人臉的基礎(chǔ)語(yǔ)義信息仍然存在,即自動(dòng)駕駛系統(tǒng)還是能識(shí)別出“這是一個(gè)人”。
1.2 數(shù)據(jù)脫敏的類(lèi)型從數(shù)據(jù)脫敏的類(lèi)型來(lái)看,主要可分為靜態(tài)數(shù)據(jù)脫敏和動(dòng)態(tài)數(shù)據(jù)脫敏。 靜態(tài)數(shù)據(jù)脫敏指的是數(shù)據(jù)的管理方將數(shù)據(jù)抽取進(jìn)行脫敏處理后,下發(fā)給下游環(huán)節(jié),供下游隨意取用和讀寫(xiě),脫敏后數(shù)據(jù)與生產(chǎn)環(huán)境相隔離,滿足業(yè)務(wù)需求的同時(shí)保障生產(chǎn)數(shù)據(jù)庫(kù)的安全,例如自動(dòng)駕駛車(chē)輛的系統(tǒng)開(kāi)發(fā)、仿真測(cè)試等。 動(dòng)態(tài)數(shù)據(jù)脫敏指的是數(shù)據(jù)使用方直接訪問(wèn)生產(chǎn)數(shù)據(jù)的使用場(chǎng)景,其特點(diǎn)為在處理敏感數(shù)據(jù)時(shí),需要實(shí)時(shí)進(jìn)行脫敏,并且也可以實(shí)時(shí)修改脫敏規(guī)則。 兩者最大的區(qū)別在于,靜態(tài)數(shù)據(jù)脫敏是在脫離數(shù)據(jù)生產(chǎn)環(huán)境后進(jìn)行的,而動(dòng)態(tài)數(shù)據(jù)脫敏則是直接在數(shù)據(jù)生產(chǎn)環(huán)境中進(jìn)行的。 在智能汽車(chē)的行駛過(guò)程中,車(chē)上的大部分敏感數(shù)據(jù)的產(chǎn)生及處理都是實(shí)時(shí)的,所以,在自動(dòng)駕駛領(lǐng)域中,數(shù)據(jù)脫敏主要是采取動(dòng)態(tài)數(shù)據(jù)脫敏。
1.3 自動(dòng)駕駛中數(shù)據(jù)脫敏的痛點(diǎn)
在中央計(jì)算平臺(tái)的趨勢(shì)下,智能汽車(chē)產(chǎn)生的敏感數(shù)據(jù)量會(huì)比手機(jī)更大,甚至無(wú)法估量。以感知為例,車(chē)端的傳感器越來(lái)越多,傳感器的性能也越來(lái)越好,這就造成整個(gè)感知系統(tǒng)能夠獲取到的數(shù)據(jù)也會(huì)越來(lái)越豐富。
李浩文說(shuō):“如今單車(chē)的智能化水平越來(lái)越高,從某種意義上來(lái)說(shuō),車(chē)輛實(shí)際上已經(jīng)具備了一定的地圖測(cè)繪能力”。 也就是說(shuō),如果一輛自動(dòng)駕駛車(chē)輛跑完全中國(guó)的道路,在某種程度上,它就能夠把一張中國(guó)地圖繪制下來(lái),而這里面必然會(huì)包含大量的敏感地理位置信息、道路標(biāo)識(shí)信息甚至個(gè)人隱私等。 這還僅僅只是感知系統(tǒng)帶來(lái)的敏感數(shù)據(jù),但自動(dòng)駕駛系統(tǒng)又何止感知這一塊。不同的系統(tǒng)會(huì)有不同的敏感數(shù)據(jù)產(chǎn)生,并且數(shù)據(jù)的格式也會(huì)非常多樣化,這些都會(huì)造成日后數(shù)據(jù)脫敏難度的增加。面對(duì)如此大規(guī)模的敏感數(shù)據(jù),行業(yè)早期在數(shù)據(jù)應(yīng)用方面,做得并不規(guī)范。在行業(yè)發(fā)展初期,車(chē)企在數(shù)據(jù)的采集、存儲(chǔ)、處理等過(guò)程中,沒(méi)有做到任何數(shù)據(jù)脫敏措施,數(shù)據(jù)在采集前是否征得用戶允許、數(shù)據(jù)資產(chǎn)的歸屬問(wèn)題等始終處于未解決的狀態(tài)。。第一,數(shù)據(jù)的確權(quán)問(wèn)題非常嚴(yán)重。行業(yè)早期階段,車(chē)企認(rèn)為車(chē)內(nèi)外的數(shù)據(jù)都是車(chē)企自己的資產(chǎn),并且車(chē)上獲取的數(shù)據(jù)可以被傳輸?shù)阶约旱乃接性浦小5诙麄€(gè)數(shù)據(jù)運(yùn)轉(zhuǎn)流程不規(guī)范。用戶在車(chē)內(nèi)的信息(如視頻、音頻等)是在不經(jīng)允許的情況下被采集,或者是在用戶不知情的狀態(tài)下,默認(rèn)勾選了數(shù)據(jù)采集的“同意選項(xiàng)”。再者,整個(gè)車(chē)聯(lián)網(wǎng)系統(tǒng)缺少數(shù)據(jù)的保護(hù)意識(shí),容易被黑客入侵,造成用戶的隱私信息被盜竊。 歸根結(jié)底,造成行業(yè)內(nèi)數(shù)據(jù)應(yīng)用不規(guī)范的主要原因是數(shù)據(jù)脫敏相應(yīng)的政策法規(guī)不成熟導(dǎo)致的。 雖然,近兩年,從國(guó)家法規(guī)層面到行業(yè)標(biāo)準(zhǔn)層面,智能汽車(chē)數(shù)據(jù)脫敏的相關(guān)政策頻繁出臺(tái)。值得注意的是,如《汽車(chē)數(shù)據(jù)安全管理若干規(guī)定(試行)》,除了列舉出了6大類(lèi)敏感數(shù)據(jù)外,也規(guī)定了敏感數(shù)據(jù)處理的標(biāo)準(zhǔn)原則,例如車(chē)內(nèi)處理原則、默認(rèn)不收集原則等,這些規(guī)定讓行業(yè)對(duì)智能汽車(chē)的數(shù)據(jù)脫敏有了大致的方向。
表:數(shù)據(jù)脫敏相關(guān)政策的進(jìn)展情況(按發(fā)布機(jī)構(gòu)層級(jí)劃分)
個(gè)別政策法規(guī)對(duì)敏感數(shù)據(jù)進(jìn)行了劃分,明確了具體哪些數(shù)據(jù)屬于敏感數(shù)據(jù)。直至中汽協(xié)在今年8月發(fā)布的《汽車(chē)傳輸視頻及圖像脫敏技術(shù)要求與方法》,該行業(yè)標(biāo)準(zhǔn)細(xì)化了對(duì)于車(chē)外的人臉、車(chē)牌的脫敏技術(shù)細(xì)節(jié)。但縱觀這些政策法規(guī),現(xiàn)階段的政策法規(guī)僅屬于一種大的框架,并沒(méi)有嚴(yán)格地去定義如何去做數(shù)據(jù)脫敏、又該脫敏到什么程度。 再者,人臉和車(chē)牌僅僅是自動(dòng)駕駛系統(tǒng)中感知環(huán)節(jié)所產(chǎn)生的敏感數(shù)據(jù),而感知環(huán)節(jié)產(chǎn)生的敏感數(shù)據(jù)又不僅限于這些數(shù)據(jù)。甚至,在定位、決策、控制環(huán)節(jié)中,車(chē)輛也會(huì)產(chǎn)生大量的敏感數(shù)據(jù),比如道路定位信息、車(chē)輛的操控習(xí)慣等等,而針對(duì)這些數(shù)據(jù),行業(yè)內(nèi)目前并沒(méi)有相關(guān)政策或者技術(shù)標(biāo)準(zhǔn)要求的出臺(tái)。 不少專家也提到,現(xiàn)階段關(guān)于數(shù)據(jù)脫敏的政策法規(guī)相對(duì)比較粗淺,各家主機(jī)廠都是在一個(gè)大的框架下去完善自己的數(shù)據(jù)管理規(guī)范。 關(guān)于數(shù)據(jù)脫敏的技術(shù)要求和方法的出臺(tái)時(shí)間,張亞楠說(shuō):“目前還在制定當(dāng)中,預(yù)計(jì)很快就會(huì)面世。” 二、如何進(jìn)行數(shù)據(jù)脫敏
那么,了解了何為數(shù)據(jù)脫敏后,智能汽車(chē)中具體是如何進(jìn)行數(shù)據(jù)脫敏的?在數(shù)據(jù)脫敏的過(guò)程中,又需要注意哪些事項(xiàng)?
關(guān)于數(shù)據(jù)脫敏的具體步驟,某主機(jī)廠信息安全工程師介紹道:“數(shù)據(jù)脫敏主要處于數(shù)據(jù)全生命周期的處理環(huán)節(jié),首先,技術(shù)人員需要對(duì)數(shù)據(jù)做好分類(lèi)分級(jí),并把敏感數(shù)據(jù)識(shí)別出來(lái),要確定哪些數(shù)據(jù)屬于敏感數(shù)據(jù)字段;其次,需要確定具體的脫敏策略;再者,將制定好的脫敏方案給到執(zhí)行者,執(zhí)行設(shè)定好的脫敏方案;最后,在數(shù)據(jù)脫敏執(zhí)行完畢后,對(duì)于整個(gè)數(shù)據(jù)的執(zhí)行過(guò)程也會(huì)有一些審計(jì)工作。”
2.1 敏感數(shù)據(jù)的分類(lèi)分級(jí)
既然數(shù)據(jù)脫敏的第一步是要先對(duì)敏感數(shù)據(jù)進(jìn)行分類(lèi)分級(jí),但智能汽車(chē)上所產(chǎn)生的數(shù)據(jù)龐大且復(fù)雜,那么,在理清楚這些數(shù)據(jù)資產(chǎn)時(shí),就需要整理出一份數(shù)據(jù)資產(chǎn)的目錄清單。
那么,哪些數(shù)據(jù)是敏感數(shù)據(jù)?又該按照什么樣的邏輯或者標(biāo)準(zhǔn)來(lái)進(jìn)行分類(lèi)分級(jí)? 從宏觀層面來(lái)看,敏感數(shù)據(jù)主要可分為3類(lèi):結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)及半結(jié)構(gòu)化數(shù)據(jù)。
結(jié)構(gòu)化數(shù)據(jù)是指可通過(guò)二維表結(jié)構(gòu)來(lái)表達(dá)和實(shí)現(xiàn)的數(shù)據(jù),比如銀行賬號(hào)、身份證號(hào)碼、手機(jī)號(hào)、日期等;
非結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整,沒(méi)有預(yù)定義的數(shù)據(jù)模型,比如圖像、聲音、文本等;
半結(jié)構(gòu)化數(shù)據(jù)是指介于完全結(jié)構(gòu)化數(shù)據(jù)和完全無(wú)結(jié)構(gòu)的數(shù)據(jù)之間的數(shù)據(jù),比如HTML文檔、JSON、XML等。
但智能汽車(chē)上的數(shù)據(jù)量非常大,數(shù)據(jù)類(lèi)型也非常雜,不能單純以這三個(gè)維度來(lái)對(duì)敏感數(shù)據(jù)進(jìn)行分類(lèi)分級(jí)。 某主機(jī)廠信息安全工程師說(shuō):“國(guó)內(nèi)的《網(wǎng)絡(luò)安全法》提出了數(shù)據(jù)需要做到分類(lèi)分級(jí),隨后出臺(tái)的《數(shù)據(jù)安全法》也更加明確數(shù)據(jù)需要做到分類(lèi)分級(jí),但各行各業(yè)的數(shù)據(jù)類(lèi)型比較豐富,國(guó)內(nèi)沒(méi)有一個(gè)統(tǒng)一的標(biāo)準(zhǔn)去對(duì)數(shù)據(jù)進(jìn)行分類(lèi)分級(jí), 2021年,汽車(chē)行業(yè)內(nèi)出臺(tái)了《車(chē)聯(lián)網(wǎng)信息服務(wù) 數(shù)據(jù)安全技術(shù)要求》對(duì)數(shù)據(jù)分類(lèi)分級(jí)做出了一定標(biāo)準(zhǔn),但它并不是一個(gè)強(qiáng)制性標(biāo)準(zhǔn)。”
圖:《車(chē)聯(lián)網(wǎng)信息服務(wù)數(shù)據(jù)安全技術(shù)要求》中數(shù)據(jù)分類(lèi)標(biāo)準(zhǔn)
李浩文也提到,智能汽車(chē)領(lǐng)域未來(lái)必然會(huì)有更細(xì)的數(shù)據(jù)分類(lèi)分級(jí)規(guī)范,但現(xiàn)階段已出臺(tái)的規(guī)范也僅僅做到概念級(jí)的建設(shè)指引,恐怕對(duì)于主機(jī)廠來(lái)說(shuō),僅憑這些標(biāo)準(zhǔn)來(lái)做一些實(shí)操工作,其難度會(huì)有些大。 結(jié)合多位專家的觀點(diǎn)來(lái)看,智能汽車(chē)行業(yè)目前尚未形成細(xì)化的數(shù)據(jù)分類(lèi)分級(jí)標(biāo)準(zhǔn),主機(jī)廠需要根據(jù)自身的實(shí)際業(yè)務(wù)需求,從不同場(chǎng)景、不同功能等維度出發(fā),去做敏感數(shù)據(jù)的分類(lèi)。同時(shí),在分類(lèi)完后,主機(jī)廠仍需要根據(jù)不同等級(jí)的敏感程度,對(duì)數(shù)據(jù)進(jìn)行分級(jí)(如一般、重要、敏感),并對(duì)不同級(jí)別采取不同的脫敏策略。
2.2 選擇合適的脫敏策略
在梳理完數(shù)據(jù)資產(chǎn)后,又該如何選擇脫敏策略?
脫敏規(guī)則指的是在原始脫敏算法的基礎(chǔ)上,將一種或者多種脫敏算法進(jìn)行組合,并應(yīng)用于特定場(chǎng)景下的敏感數(shù)據(jù),而脫敏策略指的是在不同場(chǎng)景下選擇怎樣的的脫敏規(guī)則。
表:脫敏算法、脫敏規(guī)則、脫敏策略概念示例
在智能汽車(chē)行業(yè)中,目前還沒(méi)有形成統(tǒng)一的脫敏技術(shù)規(guī)范,各家主機(jī)廠在采用相關(guān)技術(shù)或策略時(shí),都借鑒了一些已出臺(tái)的信息安全相關(guān)標(biāo)準(zhǔn)規(guī)范,如《信息安全技術(shù)個(gè)人信息去標(biāo)識(shí)化指南》。
一方面,不同類(lèi)型的數(shù)據(jù)所對(duì)應(yīng)的脫敏算法和脫敏策略都不同。 根據(jù)《汽車(chē)傳輸視頻及圖像脫敏技術(shù)要求與方法》中的介紹,非結(jié)構(gòu)化數(shù)據(jù)(如人臉、車(chē)牌)一般采用的是統(tǒng)一色塊的脫敏算法,即用統(tǒng)一色塊對(duì)視頻中每一幀中的人臉和車(chē)牌位置信息進(jìn)行替換,通過(guò)色塊替換直接擦除原圖上像素級(jí)別數(shù)據(jù),確保擦除后的數(shù)據(jù)信息不可逆和不可復(fù)原。
而掩碼、取整等脫敏算法主要用于車(chē)主的身份信息、自車(chē)的車(chē)牌號(hào)、車(chē)控?cái)?shù)據(jù)等結(jié)構(gòu)化數(shù)據(jù)。以車(chē)主的個(gè)人姓名為例,需要應(yīng)用映射技術(shù)(Hashing)將車(chē)主名“張三”變?yōu)閷?duì)應(yīng)的hash值“456684923”。
圖:部分結(jié)構(gòu)化數(shù)據(jù)相關(guān)的脫敏算法示例
(數(shù)據(jù)來(lái)源:《數(shù)據(jù)脫敏技術(shù)的探究與實(shí)現(xiàn)》)
另一方面,為了滿足特定場(chǎng)景的需求,更多地是需要有針對(duì)性且多樣化的脫敏算法和脫敏策略。 在不同的場(chǎng)景下,車(chē)輛的感知系統(tǒng)所獲取到的敏感信息是不同的,比如在高速場(chǎng)景下,自車(chē)感知系統(tǒng)獲取到的敏感信息大部分是前方車(chē)輛的車(chē)牌,那需要對(duì)這些車(chē)牌采用統(tǒng)一色塊的脫敏算法;而在城區(qū)場(chǎng)景下,除了前方車(chē)牌需要脫敏外,可能還會(huì)有很多行人和周邊建筑物信息等敏感數(shù)據(jù),需要對(duì)人臉采用統(tǒng)一色塊的脫敏算法的同時(shí),也要給敏感建筑信息采用偏轉(zhuǎn)的脫敏算法。 也就是說(shuō),面對(duì)不同的場(chǎng)景特性,敏感數(shù)據(jù)的差異就會(huì)導(dǎo)致脫敏策略的不同。此外,脫敏策略不僅僅是采用一種脫敏算法,而是會(huì)采用兩種以上的脫敏算法。 王建偉說(shuō):“在不同的場(chǎng)景下,數(shù)據(jù)脫敏相關(guān)供應(yīng)商一定會(huì)給主機(jī)廠提供很多模型,主機(jī)廠會(huì)根據(jù)不同的場(chǎng)景、不同的業(yè)務(wù)需求、不同的監(jiān)管要求來(lái)做針對(duì)性的處理。” 總的來(lái)說(shuō),脫敏策略的選擇必然不是“一招吃遍天下”,而是需要針對(duì)不同數(shù)據(jù)、不同業(yè)務(wù)場(chǎng)景等,做有針對(duì)性的開(kāi)發(fā)。
2.3 讓脫敏對(duì)自動(dòng)駕駛系統(tǒng)的影響最小化
自動(dòng)駕駛的首要原則是安全,而數(shù)據(jù)脫敏是否會(huì)造成過(guò)度脫敏,從而影響自動(dòng)駕駛系統(tǒng)整體的安全水平,又如何讓脫敏對(duì)自動(dòng)駕駛系統(tǒng)的影響最小化?
首先,數(shù)據(jù)脫敏的最終目的是減少或消除敏感信息,從而減小數(shù)據(jù)安全帶來(lái)的風(fēng)險(xiǎn),而不是阻礙自動(dòng)駕駛的發(fā)展,敏感數(shù)據(jù)在進(jìn)行脫敏后仍然需要保留目標(biāo)的基礎(chǔ)語(yǔ)義信息。 李浩文說(shuō):“車(chē)輛在采集完數(shù)據(jù)后,數(shù)據(jù)并不一定需要存儲(chǔ)或者傳輸?shù)胶蠖耍詣?dòng)駕駛系統(tǒng)只需要識(shí)別出前方目標(biāo)物具體是什么,根本沒(méi)必要識(shí)別出目標(biāo)物中的人的面部特征、年齡甚至性別,或者這輛車(chē)是什么品牌、車(chē)型或車(chē)身細(xì)節(jié)。”其次,現(xiàn)階段先感知融合、再做數(shù)據(jù)脫敏是較為可行的方案。 如果數(shù)據(jù)是先融合后再脫敏,不僅不會(huì)降低融合的效果,也可以減少時(shí)延的影響。此外,融合后甚至可以直接銷(xiāo)毀敏感信息,減少不必要的存儲(chǔ)空間占用,但從感知到控制的整個(gè)過(guò)程中,由于數(shù)據(jù)未脫敏,數(shù)據(jù)傳輸過(guò)程需要加入一些數(shù)據(jù)加密的措施,這對(duì)加密算法的強(qiáng)度要求較高,最終會(huì)導(dǎo)致數(shù)據(jù)處理難度會(huì)加大。 如果數(shù)據(jù)是先脫敏后再融合,自動(dòng)駕駛系統(tǒng)對(duì)敏感信息的保護(hù)難度會(huì)降低很多,但也會(huì)影響自動(dòng)駕駛系統(tǒng)的算法訓(xùn)練。另外,若要先做數(shù)據(jù)脫敏,傳感器在獲取數(shù)據(jù)時(shí)就需要先對(duì)敏感數(shù)據(jù)進(jìn)行脫敏,而這意味著需要對(duì)傳感器芯片做一定改造(比如加入某些安全芯片或者植入某些特定算法),這會(huì)造成傳感器功耗上升,從而降低傳感器的耐久性。 相反,在域控制器上處理數(shù)據(jù)脫敏,可以使用安全芯片(配有相應(yīng)算法)或者SDK(數(shù)據(jù)脫敏軟件包),讓整個(gè)數(shù)據(jù)脫敏更加標(biāo)準(zhǔn)化,這對(duì)相關(guān)軟硬件架構(gòu)的影響是最小的。 劉天宇說(shuō):“理論上來(lái)說(shuō),傳感器芯片或者域控制器處理都可以做數(shù)據(jù)脫敏,只要算力能夠滿足要求即可。一般來(lái)說(shuō),我們建議是在域控制器上處理,這樣可以避免對(duì)傳感器芯片的改造,而且域控制器能夠使用傳感器獲取的原始數(shù)據(jù)進(jìn)行融合,然后再進(jìn)行脫敏處理,可以實(shí)現(xiàn)對(duì)自動(dòng)駕駛系統(tǒng)的干擾最小化。” 綜合來(lái)看,先做感知融合、再做數(shù)據(jù)脫敏的方案是對(duì)整個(gè)自動(dòng)駕駛系統(tǒng)的影響是最小的,也是較為可行的方案。
2.4 數(shù)據(jù)在全生命周期中需要加密
通常來(lái)說(shuō),數(shù)據(jù)脫敏僅在數(shù)據(jù)處理環(huán)節(jié)出現(xiàn),但實(shí)際上,數(shù)據(jù)脫敏其實(shí)在數(shù)據(jù)的整個(gè)生命周期中都是存在的。
數(shù)據(jù)的全生命周期包括采集、傳輸、存儲(chǔ)、使用、共享、銷(xiāo)毀。如果主機(jī)廠先做融合再去做脫敏,那數(shù)據(jù)也會(huì)經(jīng)歷傳輸、存儲(chǔ)等,要么數(shù)據(jù)是直接脫敏后再去傳輸或者存儲(chǔ),要不然在些環(huán)節(jié)中數(shù)據(jù)也是有一定的安全風(fēng)險(xiǎn)。 王建偉說(shuō):“數(shù)據(jù)從某個(gè)ECU到域控制器的過(guò)程中,在每個(gè)數(shù)據(jù)處理節(jié)點(diǎn)都會(huì)伴隨著一定的被攻擊的風(fēng)險(xiǎn),所以每個(gè)節(jié)點(diǎn)都需要做加密處理來(lái)保證數(shù)據(jù)的安全,并且還需要做整個(gè)車(chē)聯(lián)網(wǎng)的身份認(rèn)證。再者,未來(lái)車(chē)內(nèi)無(wú)線通信可能會(huì)逐漸增多,比如通過(guò)藍(lán)牙、WiFi及UWB的方式,而這種通信方式是最容易被黑客攻擊的。” 李浩文說(shuō):“加密算法在應(yīng)用上不像數(shù)據(jù)脫敏算法那么豐富,它嚴(yán)格遵循的是數(shù)學(xué)方法,而最常用的則是對(duì)稱加密、非對(duì)稱加密和摘要算法等,并且通常情況下,密鑰長(zhǎng)度會(huì)與加密強(qiáng)度呈正相關(guān)。” 針對(duì)不同類(lèi)型的數(shù)據(jù),在加密策略的選擇上也是有區(qū)別的。某主機(jī)廠信息安全工程師說(shuō):“對(duì)于一些不敏感的數(shù)據(jù),只需要采用一些弱的加密;對(duì)于一些非常敏感的數(shù)據(jù),比如車(chē)控的數(shù)據(jù)或者藍(lán)牙鑰匙信號(hào),可能需要采取較強(qiáng)的加密措施。”
三、自動(dòng)駕駛數(shù)據(jù)脫敏的市場(chǎng)格局 3.1 玩家類(lèi)型
數(shù)據(jù)脫敏的主要玩家是主機(jī)廠和第三方數(shù)據(jù)服務(wù)商,并且主機(jī)廠會(huì)是數(shù)據(jù)脫敏業(yè)務(wù)的主導(dǎo)方。
(1)主機(jī)廠優(yōu)勢(shì):主機(jī)廠業(yè)務(wù)部門(mén)會(huì)更了解自身業(yè)務(wù),在法律法規(guī)的指導(dǎo)下,區(qū)分哪些是敏感數(shù)據(jù),哪些是非敏感數(shù)據(jù)。 李浩文說(shuō):“對(duì)于主機(jī)廠來(lái)說(shuō),通常情況下數(shù)據(jù)脫敏是需要從內(nèi)部做起的,某些主機(jī)廠的整個(gè)自動(dòng)駕駛系統(tǒng)都是自己寫(xiě)的,或者至少是由相關(guān)供應(yīng)商提供,如果工作到位的話,是很容易識(shí)別哪些數(shù)據(jù)是敏感數(shù)據(jù)。對(duì)于數(shù)據(jù)脫敏算法,業(yè)內(nèi)的相關(guān)公開(kāi)方案也有很多,這并不是難點(diǎn)。” 挑戰(zhàn):數(shù)據(jù)脫敏所面對(duì)的數(shù)據(jù)量非常龐大,是一個(gè)系統(tǒng)性的大工程,需要大量技術(shù)人員,而主機(jī)廠相關(guān)人員儲(chǔ)備不足。 李浩文繼續(xù)說(shuō)道:“當(dāng)前,某些主機(jī)廠確實(shí)缺少相應(yīng)的復(fù)合型人才,比如那些能理解數(shù)據(jù)脫敏的法律條文,也能夠?qū)φ諚l文將敏感數(shù)據(jù)一一梳理出來(lái)的人才。再者,現(xiàn)階段主機(jī)廠也確實(shí)人手不夠,或者缺少數(shù)據(jù)梳理工作,所以主機(jī)廠才需要第三方數(shù)據(jù)服務(wù)商來(lái)幫助他們梳理數(shù)據(jù)資產(chǎn)。” 再者,一些主機(jī)廠認(rèn)為,若將敏感數(shù)據(jù)交由第三方服務(wù)商處理,可能存在數(shù)據(jù)泄露的風(fēng)險(xiǎn)。(2)第三方數(shù)據(jù)服務(wù)商(比如木衛(wèi)四科技、信大捷安、中汽數(shù)據(jù)等)優(yōu)勢(shì):專業(yè)性較強(qiáng),有一定的人才儲(chǔ)備。 第三方的數(shù)據(jù)服務(wù)商無(wú)論是在專業(yè)能力上,還是在技術(shù)人才的儲(chǔ)備上,都會(huì)優(yōu)于主機(jī)廠。他們?cè)谄渌袠I(yè)內(nèi)有過(guò)豐富的數(shù)據(jù)脫敏項(xiàng)目經(jīng)驗(yàn),相關(guān)脫敏技術(shù)的應(yīng)用熟練度也較高。 挑戰(zhàn):第三方在為主機(jī)廠提供數(shù)據(jù)脫敏服務(wù)時(shí),還需要做一些脫敏模型的二次開(kāi)發(fā)。 某主機(jī)廠信息安全工程師說(shuō):“第三方數(shù)據(jù)安全廠商在其他行業(yè),如政務(wù)、金融行業(yè),可以做一些常見(jiàn)的數(shù)據(jù)字段類(lèi)型的脫敏業(yè)務(wù)(如姓名、身份證號(hào)、手機(jī)號(hào)等),但汽車(chē)行業(yè),車(chē)端的數(shù)據(jù)類(lèi)型非常多,比如車(chē)內(nèi)語(yǔ)音圖像數(shù)據(jù)、車(chē)控?cái)?shù)據(jù)、環(huán)境感知數(shù)據(jù)等等。所以,智能汽車(chē)上會(huì)有一些新的數(shù)據(jù)類(lèi)型,對(duì)于這些數(shù)據(jù),數(shù)據(jù)安全廠商可能沒(méi)有現(xiàn)成的方案可以直接適配,需要對(duì)現(xiàn)有的數(shù)據(jù)進(jìn)行人工打標(biāo)簽,再對(duì)脫敏工具進(jìn)行二次開(kāi)發(fā)和調(diào)試。”
3.2 商業(yè)模式
目前,主機(jī)廠在數(shù)據(jù)脫敏業(yè)務(wù)上缺人也缺經(jīng)驗(yàn),所以仍然會(huì)選擇以外部合作為主,那么,具體合作模式是什么樣?
首先,第三方數(shù)據(jù)服務(wù)商會(huì)連同tier1(比如T-box、傳感器等供應(yīng)商)為主機(jī)廠提供咨詢服務(wù),幫助其梳理數(shù)據(jù)資產(chǎn),并給出咨詢方案。 王建偉說(shuō):“主機(jī)廠也不會(huì)直接去向第三方數(shù)據(jù)服務(wù)商進(jìn)行采購(gòu),還是會(huì)先去找自己的零部件供應(yīng)商或者tier 1(畢竟數(shù)據(jù)最終還是這些零部件產(chǎn)生的),告訴他們對(duì)于數(shù)據(jù)脫敏業(yè)務(wù)的需求細(xì)節(jié),包括需要做到什么樣的脫敏效果,同時(shí)會(huì)給與零部件供應(yīng)商或者tier 1幾個(gè)可供選擇的第三方數(shù)據(jù)服務(wù)商。” 其次,在給出咨詢方案后,第三方數(shù)據(jù)服務(wù)商也會(huì)提供相應(yīng)的軟硬件產(chǎn)品:安全芯片+數(shù)據(jù)脫敏SDK,而這些都會(huì)集成在T-box上,一同提供給主機(jī)廠。 其中,安全芯片主要是針對(duì)汽車(chē)的信息安全,提供相應(yīng)密鑰或者數(shù)據(jù)保護(hù)算法的硬件產(chǎn)品,可應(yīng)用于T-BOX、數(shù)字車(chē)鑰匙、V2X等; 數(shù)據(jù)脫敏SDK是指集成了脫敏算法,預(yù)留脫敏數(shù)據(jù)輸入和輸出接口的軟件開(kāi)發(fā)包。算法SDK一般具有一定的兼容性,多種圖片格式可以做轉(zhuǎn)化,劉天宇說(shuō)。 關(guān)于對(duì)數(shù)據(jù)脫敏SDK的理解,李浩文說(shuō):“數(shù)據(jù)脫敏SDK作為附屬軟件,它并不是獨(dú)立存在的,一般跟自動(dòng)駕駛的主程序或者其它數(shù)據(jù)處理程序融合在一起,往往以庫(kù)的形式存在,就好比是微信軟件中的某一個(gè)細(xì)分功能。并且,數(shù)據(jù)脫敏SDK內(nèi)部的脫敏策略都是可配置甚至在線升級(jí)調(diào)整的,就如自動(dòng)駕駛的主程序一樣,它也會(huì)定期升級(jí)。” 最后,在盈利模式上,第三方數(shù)據(jù)服務(wù)商通過(guò)收取咨詢服務(wù)費(fèi)及出售軟硬件產(chǎn)品來(lái)獲取收益。
四、數(shù)據(jù)脫敏在自動(dòng)駕駛應(yīng)用中的挑戰(zhàn)
4.1 敏感數(shù)據(jù)來(lái)源的多樣化
自動(dòng)駕駛車(chē)端的敏感數(shù)據(jù)會(huì)來(lái)自于自動(dòng)駕駛系統(tǒng)的感知、定位、決策、控制各個(gè)環(huán)節(jié)。
比如在感知系統(tǒng)中,傳感器可不止是相機(jī)。其它的傳感器也同樣會(huì)有一些敏感信息出現(xiàn)。以FMCW激光雷達(dá)為例,除了可以獲取到一些測(cè)速測(cè)距的深度信息外,激光雷達(dá)甚至可以配合其它傳感器,實(shí)現(xiàn)三維的實(shí)時(shí)建圖。當(dāng)前,炙手可熱的4D毫米波雷達(dá),相比于傳統(tǒng)的毫米波雷達(dá)來(lái)說(shuō),它具備了如同激光雷達(dá)的一樣的點(diǎn)云生成能力,并能夠獲取到物體的高度信息,比如橋墩的高度信號(hào)等。一方面,不同類(lèi)型的傳感器會(huì)帶來(lái)不同的敏感數(shù)據(jù);另一方面,不同類(lèi)型的傳感器所能提供的敏感數(shù)據(jù)等級(jí)也略有不同。
相機(jī)帶來(lái)的是幀圖像的數(shù)據(jù)格式,而激光雷達(dá)和毫米波雷達(dá)帶來(lái)的則是點(diǎn)云形式的數(shù)據(jù)格式,在數(shù)據(jù)脫敏時(shí),必須要在理解傳感器的前提下,才可能更好地處理敏感數(shù)據(jù)。
即使同一類(lèi)型的傳感器,由于來(lái)自不同供應(yīng)商,傳感器帶來(lái)的數(shù)據(jù)格式也有可能不同,需要對(duì)它們各自的數(shù)據(jù)分別進(jìn)行脫敏處理。
一般來(lái)說(shuō),相機(jī)所能獲取到的敏感數(shù)據(jù)量會(huì)多于激光雷達(dá),更多于毫米波雷達(dá),而數(shù)據(jù)敏感程度上,相機(jī)的數(shù)據(jù)敏感程度也更高于其它二者。
表:各傳感器之間的敏感數(shù)據(jù)情況
雖然,《汽車(chē)傳輸視頻及圖像脫敏技術(shù)要求與方法》對(duì)人臉和車(chē)牌的脫敏處理做了一定的規(guī)范,比如圖片的大小、清晰度等,但對(duì)于其它類(lèi)型的數(shù)據(jù)或者其它傳感器所帶來(lái)的敏感數(shù)據(jù),行業(yè)內(nèi)并沒(méi)有做出任何指引規(guī)范,各家主機(jī)廠也都是處于摸索中,或者干脆就不去關(guān)注這方面。
4.2 數(shù)據(jù)脫敏的程度較難把控
敏感數(shù)據(jù)到底需要脫敏到什么程度,才可以真正實(shí)現(xiàn)敏感信息的完全脫敏?同時(shí),數(shù)據(jù)脫敏是否會(huì)由于過(guò)度脫敏而造成某些關(guān)鍵信息的損失?
以人臉或者車(chē)牌的脫敏為例,相關(guān)的規(guī)定也做出了一定的約束,從技術(shù)上來(lái)說(shuō),要把這類(lèi)圖像脫敏到“剛剛好”,或許并不會(huì)有很大的難點(diǎn),但事物之間是有一定的聯(lián)系存在的,當(dāng)數(shù)據(jù)量級(jí)達(dá)到一定程度時(shí),也可以通過(guò)某些信息來(lái)推斷出某人的個(gè)人信息。 李浩文說(shuō):“雖然通過(guò)脫敏技術(shù)對(duì)某個(gè)人的人臉進(jìn)行了脫敏處理,但還是可以從他的衣服、步態(tài)或者他個(gè)人經(jīng)常性出沒(méi)的位置等交叉信息,來(lái)推斷出他的個(gè)人信息。再比如,我們?cè)谧鍪謾C(jī)號(hào)碼的脫敏時(shí),會(huì)常去把中間4位號(hào)碼隱去,但那也只有1萬(wàn)種排列組合的可能性,數(shù)據(jù)仍然有被推演出的風(fēng)險(xiǎn)。”
4.3 車(chē)端硬件性能的占用智能汽車(chē)上的硬件性能非常有限,也非常寶貴,那么算力在保證自動(dòng)駕駛系統(tǒng)安全運(yùn)行的同時(shí),是否也會(huì)滿足數(shù)據(jù)脫敏的需求?對(duì)此,筆者在與各個(gè)專家進(jìn)行了探討,專家們的結(jié)論各不同,形成了兩種不同的答案。 先給出結(jié)論:短期內(nèi),數(shù)據(jù)脫敏不會(huì)對(duì)車(chē)端的硬件造成過(guò)多的性能占用,但長(zhǎng)期方向上,隨著敏感數(shù)據(jù)的不斷增加,數(shù)據(jù)脫敏對(duì)車(chē)端硬件性能的占用可能會(huì)成為一個(gè)挑戰(zhàn)。 從短期來(lái)看,如果只做圖像脫敏處理,對(duì)于帶有浮點(diǎn)運(yùn)算的SoC芯片來(lái)說(shuō),脫敏對(duì)硬件的消耗并不大。 目前的脫敏規(guī)范僅限于車(chē)外的人臉及車(chē)牌信息,對(duì)于其它的敏感數(shù)據(jù)是否要進(jìn)行脫敏,甚至如何進(jìn)行脫敏,其實(shí)并沒(méi)有相關(guān)標(biāo)準(zhǔn)出臺(tái),這也在一定程度上將車(chē)輛上所需脫敏的數(shù)據(jù)范圍縮小到了一個(gè)當(dāng)前算力所能承受的范圍內(nèi)。 根據(jù)已落地的項(xiàng)目經(jīng)驗(yàn),劉天宇說(shuō):“以高通8155芯片為例,部署脫敏算法后,CPU占用率低于10% (不需要使用GPU算力),其余占用資源為:模型參數(shù)量<3M、FLOPS<5G、運(yùn)行ROM< 30MB、運(yùn)行RAM<100MB、運(yùn)行CPU<10kDMIPS。” 從長(zhǎng)期來(lái)看,隨著敏感數(shù)據(jù)的定義不斷明朗化及中央計(jì)算的電氣架構(gòu)趨勢(shì)下,車(chē)端敏感數(shù)據(jù)的范圍會(huì)被擴(kuò)大,同時(shí)如果大量的數(shù)據(jù)都集中在中央控制器上處理,現(xiàn)有的SoC性能未必能在保證自動(dòng)駕駛系統(tǒng)正常運(yùn)行的情況下,再去處理數(shù)據(jù)脫敏,顯然到那時(shí)候就需要更多的算力支持。
審核編輯:郭婷
-
智能手機(jī)
+關(guān)注
關(guān)注
66文章
18612瀏覽量
183328 -
智能汽車(chē)
+關(guān)注
關(guān)注
30文章
3064瀏覽量
108246
發(fā)布評(píng)論請(qǐng)先 登錄
智慧路燈的推廣面臨哪些挑戰(zhàn)?
雙核鎖步技術(shù)在汽車(chē)芯片軟錯(cuò)誤防護(hù)中的應(yīng)用詳解
電阻焊技術(shù)在汽車(chē)鋁合金焊接中的電子應(yīng)用研究
電動(dòng)汽車(chē)電池焊接技術(shù)進(jìn)展與挑戰(zhàn)
電子技術(shù)在智能電網(wǎng)中的應(yīng)用
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)在具身人工智能中的價(jià)值
MEMS技術(shù)在自動(dòng)駕駛汽車(chē)中的應(yīng)用
UWB技術(shù)在智能資產(chǎn)管理中的應(yīng)用

鑒源實(shí)驗(yàn)室·加密技術(shù)在汽車(chē)系統(tǒng)中的應(yīng)用

數(shù)字孿生技術(shù)實(shí)施中的挑戰(zhàn)
《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得
【?嵌入式機(jī)電一體化系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)?閱讀體驗(yàn)】+磁力輸送機(jī)系統(tǒng)設(shè)計(jì)的創(chuàng)新與挑戰(zhàn)
灌區(qū)信息化面臨的挑戰(zhàn)分析

開(kāi)啟報(bào)名!智能座艙與智能駕駛現(xiàn)狀與挑戰(zhàn)研討會(huì)

評(píng)論