作者:徐順利
本文由麥姆斯咨詢(xún)經(jīng)徐順利授權(quán)發(fā)布,如需轉(zhuǎn)載請(qǐng)注明來(lái)源
蘋(píng)果公司剛剛發(fā)布了最新一代的iPhone X產(chǎn)品,其中最引人注目的就是以深度攝像頭(True Depth)技術(shù)為硬件基礎(chǔ)的人臉識(shí)別應(yīng)用, 短短幾天得到人們的廣泛關(guān)注。這里,僅發(fā)表個(gè)人觀(guān)點(diǎn),希望拋開(kāi)各種專(zhuān)業(yè)術(shù)語(yǔ),用最簡(jiǎn)單語(yǔ)言讓廣大消費(fèi)者理解人臉識(shí)別的技術(shù)背景和給手機(jī)帶來(lái)的改變。
1. 最自然的識(shí)別方式蘋(píng)果產(chǎn)品一貫以最佳的用戶(hù)體驗(yàn)著稱(chēng), 從第一代iPhone支持觸摸屏開(kāi)始,每一代產(chǎn)品都力圖在最自然的交互方式上有所創(chuàng)新。無(wú)疑,人臉識(shí)別是繼觸摸屏后的又一大革命性創(chuàng)新。人類(lèi)互相認(rèn)識(shí)的最直接最自然的方式就是通過(guò)記住人臉的各種屬性和各種姿態(tài),比如我認(rèn)識(shí)你,并不是通過(guò)指紋、虹膜或者互相交換密碼。那么一部智能的機(jī)器也應(yīng)該用同樣的方式認(rèn)識(shí)一個(gè)人,這樣才最接近人類(lèi)的自然屬性。所以,好的人臉識(shí)別技術(shù),會(huì)帶給人們最舒服的體驗(yàn),非常容易被接受。2. 可靠的感知系統(tǒng)正如人類(lèi)的雙眼獲得的是三維空間中的物體圖像,對(duì)于機(jī)器來(lái)說(shuō),最佳的識(shí)別方式就是擁有像人類(lèi)一樣的眼睛。這里的關(guān)鍵技術(shù)就是深度攝像頭(或稱(chēng)3D攝像頭)。iPhone X為了達(dá)成極致體驗(yàn),不惜在外觀(guān)設(shè)計(jì)上多開(kāi)了若干個(gè)孔,為的就是給手機(jī)加上真正好的深度視覺(jué)感知。
大家對(duì)2D攝像頭已經(jīng)非常熟悉了,那么如何評(píng)價(jià)一個(gè)深度攝像頭呢?蘋(píng)果公司稱(chēng)之為T(mén)rue Depth。我給各位一些比較具體的概念:第一,當(dāng)你判斷一個(gè)人臉的時(shí)候,看到的是一個(gè)人在三維空間中的臉以及臉上的細(xì)節(jié),有人化妝、戴眼鏡、部分遮擋臉部、或者是側(cè)面對(duì)著你、甚至對(duì)你做鬼臉,大部分情況下你都可以認(rèn)得出一個(gè)人。如果機(jī)器要獲得這樣的能力,必須依靠精準(zhǔn)的深度攝像頭以及強(qiáng)大的算法(具體細(xì)節(jié)會(huì)在本文下節(jié)講到)。 第二,如果有人拿著一張照片、一個(gè)人臉模型、面具、或者一段視頻冒充某個(gè)人站在你面前是,你一定一眼識(shí)破。那么機(jī)器需要利用深度信息才能達(dá)到人類(lèi)的智慧。 第三,手機(jī)每天需要被喚醒幾十次甚至上百次,你需要在室內(nèi)、戶(hù)外、黑暗中,以各種姿勢(shì)都可以輕易解鎖手機(jī),這就要求深度攝像頭具備很強(qiáng)的抗干擾能力、很快的反應(yīng)速度、提供專(zhuān)門(mén)的紅外LED進(jìn)行“照明”,以便在黑暗環(huán)境下依然可以識(shí)別到人臉,而且, 它需要有足夠長(zhǎng)的壽命(畢竟,帶著這種高科技的手機(jī)都不便宜啊…)。
3. 數(shù)據(jù)和算法的重要性人類(lèi)的認(rèn)識(shí)過(guò)程是在不斷地自我學(xué)習(xí)的,并不是每一個(gè)視力正常的人都擁有相同的識(shí)別能力。孩子記住人臉的能力不如成人,一個(gè)外國(guó)人初到中國(guó),有可能覺(jué)得中國(guó)人長(zhǎng)得都差不多,生活一段時(shí)間后,才可以很容易地辨別每個(gè)中國(guó)人,而一個(gè)經(jīng)過(guò)特殊訓(xùn)練的間諜可以在很短的時(shí)間內(nèi)就記住一個(gè)陌生的面孔并且準(zhǔn)確識(shí)別。這就是學(xué)習(xí)的過(guò)程。機(jī)器也是一樣,通過(guò)對(duì)大量人臉樣本的學(xué)習(xí)以及好得算法來(lái)增強(qiáng)自己的識(shí)別能力。目前的大部分人臉識(shí)別方案的數(shù)據(jù)來(lái)源都是2D照片,我們每個(gè)人的身份證照片、各種公開(kāi)場(chǎng)合的照片、注冊(cè)在各個(gè)網(wǎng)站或者系統(tǒng)的照片等等,都可以成為計(jì)算機(jī)識(shí)別人臉的樣本,通過(guò)大量的技術(shù)積累,目前的2D人臉識(shí)別技術(shù)能夠達(dá)到0.1~0.2% 的錯(cuò)誤接受率,但在某些條件下可能有所限制(比如光照、墨鏡、角度、表情等等)。而且最關(guān)鍵的一點(diǎn),基于2D圖像的人臉識(shí)別,容易被高清逼真的照片攻擊,所以高級(jí)別的安全應(yīng)用(比如支付),往往不敢只用2D信息做認(rèn)證。為了克服2D數(shù)據(jù)的限制和攻擊漏洞,在3D攝像頭普及之前,業(yè)內(nèi)人士想了很多辦法來(lái)彌補(bǔ)其中的不足,主要思路就是首先確認(rèn)使用者是一個(gè)真正的人,不是照片或者錄像, 然后利用已有的2D數(shù)據(jù)和算法進(jìn)一步識(shí)別人臉。最典型的兩種方式:
一、用戶(hù)驗(yàn)證時(shí)被機(jī)器要求做一個(gè)表情,比如眨眼、微笑、或者點(diǎn)頭等等,目前的支付寶登錄就用了這樣的方法,這樣避免了照片攻擊,如果不是頻繁操作,用戶(hù)可以接受, 但是如果需要在各種場(chǎng)合頻繁解鎖,那么你可能由于表情包太豐富被人注意。
二、利用深度攝像頭判斷是否是活體人臉,然后用2D算法做人臉識(shí)別。形象點(diǎn)說(shuō),當(dāng)你通過(guò)一個(gè)具有人臉識(shí)別功能的安檢閘口的時(shí)候,機(jī)器用你的2D 圖像數(shù)據(jù)進(jìn)行識(shí)別,同時(shí)需要有一位工作人員站在旁邊確認(rèn)你沒(méi)有用照片作弊(但工作人員并不認(rèn)識(shí)你)。如果機(jī)器本身能夠利用深度攝像頭判斷你的臉是否是真的人臉還是照片,那么就不需要額外的工作人員了。 這樣做確實(shí)避免了攻擊而且對(duì)使用者沒(méi)有表情要求,很多場(chǎng)合下這就是很不錯(cuò)的方案了。但是這臺(tái)機(jī)器其實(shí)還是不認(rèn)識(shí)三維空間的你,距離真正人類(lèi)智慧還有不小差距,沒(méi)有從本質(zhì)上突破2D數(shù)據(jù)的限制。
iPhone X的3D人臉識(shí)別技術(shù)遠(yuǎn)遠(yuǎn)超越了2D識(shí)別的認(rèn)知極限,達(dá)到了百萬(wàn)份之一的錯(cuò)誤接受率。 如何做到呢?最關(guān)鍵的就是數(shù)據(jù)和算法。最佳的3D人臉識(shí)別技術(shù),樣本數(shù)據(jù)來(lái)源就應(yīng)該是真正的3D人臉, 也就是用通過(guò)深度攝像頭獲取人臉模型作為機(jī)器學(xué)習(xí)的樣本,這是最接近人類(lèi)認(rèn)識(shí)過(guò)程的方式。不過(guò),因?yàn)樯疃葦z像頭技術(shù)最近幾年才開(kāi)始在一定范圍內(nèi)推廣,過(guò)去的幾年當(dāng)中,除了蘋(píng)果公司,業(yè)內(nèi)只有幾家著名的公司在做這方面的投入,第一個(gè)被人們熟知的消費(fèi)類(lèi)3D人臉識(shí)別應(yīng)用是基于Intel RealSense的Windows Hello, 用于PC平臺(tái)Windows操作系統(tǒng)解鎖,至今大概僅僅有4年的歷史。這種情況下,公開(kāi)的3D人臉的樣本數(shù)據(jù)量非常有限,想必蘋(píng)果公司從收購(gòu)深度攝像頭公司PrimeSense(2013年)那一刻起,就投入大量資源收集數(shù)據(jù)樣本了。
隨之而來(lái)的就是兩個(gè)問(wèn)題。 問(wèn)題一: iPhone X之后,會(huì)是誰(shuí)呢?我們能否在其它手機(jī)上獲得同樣的體驗(yàn)?zāi)? 我的理解是 – 數(shù)據(jù)和算法是關(guān)鍵,誰(shuí)能夠在短期內(nèi)獲得大量的3D人臉數(shù)據(jù)、并且運(yùn)用最好的學(xué)習(xí)方法 (專(zhuān)業(yè)術(shù)語(yǔ)叫做機(jī)器學(xué)習(xí), 哈哈),誰(shuí)就可以擁有iPhone X的人臉識(shí)別能力。對(duì)于這一行業(yè)的公司來(lái)說(shuō),這將是一個(gè)巨大的投入。 問(wèn)題二:iPhone X每天都在讀取我的信息作為樣本嗎?不得而知。 可以明確的是,隨著使用者和使用次數(shù)的增多,很多新的數(shù)據(jù)會(huì)被當(dāng)作是樣本的補(bǔ)充,不斷完善機(jī)器對(duì)人臉的認(rèn)知,甚至是對(duì)你本人的更多的理解,這就好像你領(lǐng)養(yǎng)的小狗,跟你越來(lái)越親近。好的人臉識(shí)別算法,都會(huì)以不斷增強(qiáng)的方式學(xué)習(xí)數(shù)據(jù),給用戶(hù)以更好的反饋。4. 安全問(wèn)題關(guān)于人臉識(shí)別的安全已經(jīng)有過(guò)很多的爭(zhēng)論。 首先是關(guān)于黑客攻擊的, iPhone X用了百萬(wàn)分之一的錯(cuò)誤識(shí)別率以保證你的設(shè)備不會(huì)被其它人輕易解鎖,并且超越指紋識(shí)別達(dá)到了支付級(jí)別,這也是給生物識(shí)別行業(yè)重新定義了衡量的標(biāo)準(zhǔn)。相信未來(lái)以深度攝像技術(shù)和優(yōu)秀算法為基礎(chǔ)的技術(shù)可以很快跟進(jìn)了。其次是關(guān)于人臉識(shí)別的安全規(guī)范, 如果人臉作為重要的安全憑證用在方方面面,你的臉部信息將被如何獲取、如何存儲(chǔ)以及如何使用,會(huì)變成這個(gè)行業(yè)的又一大難題。試想,如果今天你的臉上長(zhǎng)出了青春痘,明天就有化妝品公司向你推銷(xiāo)祛痘產(chǎn)品,你是否會(huì)有被偷窺的感覺(jué)呢?(當(dāng)然這是玩笑話(huà))我們期待業(yè)內(nèi)的領(lǐng)軍企業(yè)發(fā)揮社會(huì)責(zé)任感,促進(jìn)整個(gè)生態(tài)的安全和健康。總之,目前的人臉識(shí)別領(lǐng)域,只有同時(shí)具備強(qiáng)大的硬件、軟件、數(shù)據(jù)等技術(shù)實(shí)力和足夠安全保障的公司或者方案商, 才能給消費(fèi)者提供舒適的體驗(yàn)和信心保證。iPhone X的發(fā)布,似乎是出了一道關(guān)于人臉識(shí)別的命題作文,不單單是針對(duì)手機(jī)相關(guān)行業(yè),也影響了更廣泛的領(lǐng)域,甚至我們每個(gè)人。無(wú)論你喜歡還是拒絕,刷臉時(shí)代的序幕已經(jīng)拉開(kāi)了,你準(zhǔn)備好了嗎?
-
人臉識(shí)別
+關(guān)注
關(guān)注
76文章
4068瀏覽量
83572
原文標(biāo)題:用最簡(jiǎn)單的語(yǔ)言描述人臉識(shí)別技術(shù)的核心問(wèn)題
文章出處:【微信號(hào):MEMSensor,微信公眾號(hào):MEMS】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
機(jī)器視覺(jué)技術(shù)應(yīng)用之人臉識(shí)別
泰山哥分享——人臉識(shí)別實(shí)現(xiàn)技術(shù)大解析
人臉識(shí)別技術(shù)原理解析
奇谷人臉識(shí)別技術(shù)
別怕,人臉識(shí)別技術(shù)帶你回家
人臉識(shí)別技術(shù)的60年發(fā)展史
facexx解析:人臉識(shí)別技術(shù)市場(chǎng)在哪些領(lǐng)域?
人臉識(shí)別技術(shù)的優(yōu)缺點(diǎn)
人臉識(shí)別技術(shù)入門(mén)資料
基于瑞芯微高性能核心板的人臉識(shí)別方案
淺析人臉辨識(shí)的技術(shù)環(huán)節(jié)
人臉識(shí)別是什么_人臉識(shí)別技術(shù)原理

評(píng)論