這兩年人工智能的火熱,已經從概念進入到落地的階段,尤其是語音的人工智能音箱和機器視覺人臉識別的相關產品。早在人工智能技術興起之前,其實業內對人臉識別技術就研發了很久,早期的技術是通過普通的攝像頭,抓取圖像和視頻上傳到到服務器,所有的識別工作由前端電腦或者服務器完成,但這樣服務器的壓力是巨大大,這種技術在越來越多應用場景下,效率相對較低,甚至是不合理的, 大面積推廣也收到一定的限制。由于智能攝像頭技術的成熟,攝像頭前端具備音視頻解碼、傳輸功能之外,也集成了一些具有智能算法能力的硬件,能夠識別并抓取到人臉圖像,甚至通過算法提取完整的人臉特征數據(而不是圖片),然后上傳到服務器供后端處理,這樣服務器的壓力大大減小,識別的效率也就大大提升。
人臉識別系統的應用普及,尤其在機場、高鐵站、銀行等系統的人臉驗證,大部分的老百姓,甚至一些行業從業人員,以為現在的人臉識別技術無所不能,其實應用的局限性還是很大,上個月因為工作原因,比較頻繁接觸了這行的兄弟,有些認知和想法給大家分享一下。
一、人臉識別技術基本現狀
人臉識別技術其實早在人工智能概念之前,業內就研發了很久,早期的技術是通過普通的攝像頭,抓取圖像和視頻上傳到到服務器,所有的識別工作由前端電腦或者服務器完成,但這樣服務器的壓力是巨大大,這種技術在越來越多應用場景下,效率相對較低,甚至是不合理的。 因此人臉識別在前端攝像頭除了具備視頻傳輸錄像功能之外,也植入了一定的智能算法,能夠識別并抓取到人臉圖像,并且通過算法提取完整的人臉特征數據(而不是圖片),然后上傳到服務器供后端處理,這樣無論是服務器的壓力還是識別的效率都會大大提升。目前人臉識別技術主要是如下幾種情況。
1:1的比對識別
1:1比對主要是使用在身份驗證上,減少人工審核,人、證合一的問題。攝像頭抓到的頭像與身份證中預存的頭像信息進行確認,是否為同一個人。 主要場景就是機場、酒店、銀行等場所,這類應用對準確率要求高,但技術的難度其實比較低,因為被驗證的人都是強配合的,有充分的拍照條件,能夠提供正面高清人臉圖片,通過身份證號碼從公安系統內部調取到人臉特征數據,這兩部分數據進行一對一比對,只要達到一個重合率就通過。
產品的難點是能夠獲得公安部的數據授權, 目前只用公安部二所旗下的中盾公司具有獨家資質,他們提供一個身份證和人臉數據讀寫模塊,模塊直接可以對接到公安部數據庫, 模塊的售價800~900元,絕大部分利潤在這里被吃掉了。
1:N的人臉識別
這個這比較容易理解,就是從一堆的預存的人臉中,識別是對應的身份出來。最典型的就是門禁、考勤類的應用,首先要預登記每個人的人臉,攝像頭抓取的圖片與登記的一堆人臉進行逐個比對,判斷出是哪個人。這個比對可以放在本地的服務器(通常叫識別網關),也可以放在云端進行比對,由于云服務器和萬物互聯的概念,所有公司一定會把人臉也保存在云端。這類系統比較重要的指標就是這個N的值(人臉數據量)。在100張人臉識別出每個人,和1萬張,甚至百萬張人臉去識別一個人,難度上有本質的區別。
1:∞ 無窮的識別
這個其實與1:N類似,只是這個N數量巨大,通常是公安部的數據庫,通過拍照,或者人經過攝像頭, 系統可以快速提取到這個人的身份信息。這個這種應用場景相對較少,技術難點也是最高的,即使人臉照片很清晰的情況下,也很難識別準確。通常用來測試系統。 通過攝像頭拍照,上傳圖片或者人臉特征數據, 與通過公安部門的數據庫比對,告知這個人是誰,相當于要在10幾億的人群中找出相同的人臉,這個并不容易,而且特征相似的人臉其實還是蠻多的,能夠做按照相似度排列返回一個人員清單。我看到比較牛逼的就是深圳的警察手機APP很多都裝了這個應用,通過拍照,然后自動識別出這個人是誰,身份證號碼多少等等個人信息。
二、人臉識別的準確率
現在很多人臉識別算法或者產品都有一個重要的的指標,就是識別準確率有多高。其實單純地講這個準確率其實是沒有意義的。
首先是這個準確率是要有前提的,攝像頭的圖像抓取質量高度相關,高清的正臉圖片識別率肯定很高, 但如果在光線不夠好,角度不是完全正面的情況下呢,這個準確率肯定是大打折扣的。
其次準確率的說法也是不嚴謹的。在人臉識別的時候,主要是對人臉特征數據重合率的比較,重合率達到一個閾值(例如80%),就算驗證通過,這就可以通過調節這個重合率的閾值來提高準確率。 例如門禁系統,把重合率閾值設置比較低,就很容易驗證通過,這樣也很容易給人準確率很高的印象。但同時帶來的問題就是,很多相似的臉會被錯誤認為驗證通過。 如果調高重合率閾值,可以拒絕掉很多相似的臉,但同時本人的真臉也容易被拒絕,這個時候容易給人準確率低的印象。
這就是我們驗真率和拒假率,這個指標有點類似指紋。這兩個指標也基本上是矛和盾的關系。但如果一個好的算法,就會在這個點上達到一個平衡出一個最好的結果,同時在評估性能的時候,也是應該同時參照這二個指標的。
三、人工智能技術的應用
目前具有人臉算法的公司不少, 除了一些開放平臺之外,提供標準算法SDK,也有很多公司自己的算法,盡管算法原理大同小異,但各家還是自己一套封閉大系統,相互并不兼容。這些算法很多得益于老美們將很多人臉數據庫的特征值和算法公開后,大大降低了研發的難度。
但總體感覺上,當前大多數的人臉算法只能是一個智能系統,而不是人工智能系統,所謂的人工智能,是指能夠模擬人的思維過程,通過神經網絡的深度學習技術去逐漸學習,逐漸提升人臉識別的準確性。 這有點類似人的思維,當你多次使用了這個人臉識別系統后,你的數據越來越多,系統對你越來越熟悉,從而逐漸提高識別準確率。
機器學習最核心的是數據,未來這些算法公司,可能最核心的不是算法有多牛,而是你擁有多少數據,這個主要體現在二個方面,第一就是人臉數據庫的量,就是擁有多少人的人臉數據,另外就是就是人臉驗證的使用數據,當你的系統被使用越多,各種狀態,各種光線的情況下使用,人工智能系統的算法對你越熟悉,識別將會越來越準確。
目前公安部有全國最大的人臉數據庫,主要是頭像圖片,但數據庫沒有開放,必須要有甲級保密資質,一般公司沒有,針對人證驗證目前只用公安部二所旗下的中盾公司獨家資質。對于非公安體系的民間公司來說,各家的算法公司收集人臉數據庫, 除公安外的政府部門的工商,交通等也都在收集人臉,現在去銀行,政府辦個什么事情,都是要微信小程序預約,并且上傳自己的人臉數據,騰訊,滴滴,阿里等也都在通過各種方式積累人臉數據量,例如通過手機中照片抓取人臉,你發布在QQ空間,朋友圈的自拍招聘都會被這些公司收集人臉數據庫。
四、開放硬件平臺的設想
當人臉識別進入到了人工智能階段,又會進入到互聯網公司的標準規則,就是強者逾強。無論是機器學習的人工智能平臺,還是大數據的運營,也會變成幾家公司獨大,第二梯隊的公司難以維系。首先通過技術形成了門檻,然后引入資金,形成資金壁壘,通過資金形成了市場壁壘,然后閉環回到繼續加強了技術壁壘,造成強者恒強的局面。
剛才上文提到,人臉識別系統不是一個簡單互聯網系統, 而是一個軟硬件高度結合的系統,既要后端服務器的算法和神經網絡的機器學習能力,同時要需要前端攝像頭硬件集成高度配合。這就我對硬件標準平臺的攝像。
既然是開放的硬件平臺,首先要滿足的二個條件:
1.極大降低系統開發的難度,提供了標準的硬件和服務器數據平臺的接口。
2.盡量是一個公立平臺, 只提供標準配件,不涉及到一些具體的行業應用。
3.有機會成為標準配件,能夠快速撲向市場,收集用戶和數據。
1.標準人臉攝像頭的配件
●攝像頭可以直接輸出電子門鎖控制信號,例如韋根接口。
●內置人臉抓取和特征數據提取上傳。
● 攝像頭接入網絡后,會自動在平臺注冊,注冊內容有UUID,Product-Key等信息。●后臺操作,將注冊用戶與注冊的攝像頭進行關系綁定。
●內置門禁接口,直接輸出標準門禁控制信號。
● 從人臉識別到發出開門指令應該要小于1秒。
2.服務器標準接口
管理后臺和用戶客戶端為第三方合作伙伴提供標準API接口,例如:
●通過輸入攝像頭系列號以及時間段,能夠返回攝像頭的人臉識別記錄’
●通過輸入人員用戶名、手機號等參數能夠返回人員經過那些攝像頭編號及經過時間的記錄。
●通過手機登陸注冊,或者微信小程序,將個人信息和照片上傳到服務器,生成人臉特征數據庫。
●用戶注冊人臉后,管理員可以通過后臺,將注冊人員與所屬攝像頭綁定。
●當用戶經過綁定攝像頭的時候會產生相應的控制數據。
當然這些接口只是拋磚引玉,需要根據不同的行業屬性完善相應的接口。
五、門禁行業的應用
上述的開放硬件接口將大大降低人臉識別行業的開放難度,一些傳統的軟硬件公司在這樣的開放硬件平臺上,能夠很快完成自己的系統。
目前的人臉識別攝像頭應用逐漸普及,主要分為二大類,一類是與公安部門系統對接,例維穩安保體系的人臉和身份證的驗證,疑犯追逃等,另一類企業內部的獨立系統,例如考勤、門禁等等。人臉識別前期最大的應用領域都是與政府部門高度相關,但這塊的市場門檻很高,這個門檻可能并不是技術,而是一些大家都懂的原因。因此大量的公司都擁擠在民用領域,尤其是門禁的領域。這幾年來,車輛進出的車牌識別徹底取代了IC卡,尤其在深圳幾乎已經很難看到刷卡停車的地方了,在一些三四線城市,也基本上被車牌識別攝像頭取代。 隨著人臉識別技術的成熟,我相信禁人臉的身份識別也將會徹底取代門卡。畢竟現在連錢包和銀行卡都懶得帶的,更何況門禁卡,用手機APP去開門又太麻煩,而且有些老年人也不會用,因此人臉識別門禁將是一個強烈的剛需了。
現有舊小區,無論是小區大門還是單元門,都有很強烈的改造意向,但改造現有的門禁對講系統的成本又不能太高,如果只需要在門口頭頂安裝一個人臉識別的攝像頭,攝像頭輸出信號控制電鎖。業主經過的時候,在1~2秒鐘,攝像頭識別人臉與數據庫比對成功后,輸出開門信號,這將會有巨大的市場。
目前有技術能力的公司都看到這市場的潛力,但還是各自為政,軟件硬件都在用自己的一套,完全是自己的封閉系統,這樣的研發成本很高,落地成本也很高。最近我調研了這個這塊市場,我相信很快有人會要做一個開放性的人臉識別攝像頭硬件,可以提供給考勤和安全門禁的行業提供基礎的解決方案,從而降低研發成本和落地成本,對這市場的硬件公司也將會有一個大的洗牌。
六、后記
經過這幾周的業內調研了解,這樣的開放標準硬件和服務器平臺其實有極大的市場,硬件平臺不只提供標準模塊和算法,不做自己的行業應用,提供一個簡單易用的解決方案賦能給這些傳統行業,依賴傳統行業的渠道和落地實施。不僅僅可以在標準硬件上能夠有一個大規模的銷售量,同時能夠大量收集到人臉數據庫和使用數據,為真正的人工智能識別系統提供大數據支持,這才是算法公司的核心價值。歡迎一些有算法能力和神經網絡機器學習的兄弟或者公司一起交流探討。
作者介紹:黃小良, 深圳智安物聯科技有限公司 CEO ,電子圈資深成員,5年產品研發,10年半導體分銷, 5年創業,從事物聯網智能家居。個人微信號“iSuren”,歡迎交流。
由ELEXCON深圳國際電子展暨嵌入式系統展和百度攜手舉辦的“Hello AI科技聯展”即將于12月20-22日在深圳會展中心2號館舉辦。此前,百度AI科普大巴先后走過北京、廈門、重慶、武漢等城市,每到一處都能掀起“HELLO AI”人工智能熱潮,給千萬民眾展示AI核心技術,感受AI生活的便利神奇。
此次ELEXCON深圳國際電子展暨嵌入式系統展上,更有人工智能/大數據專區,讓市民身臨其境體驗未來科技生活!
-
服務器
+關注
關注
13文章
9693瀏覽量
87292 -
人工智能
+關注
關注
1804文章
48717瀏覽量
246543 -
人臉識別
+關注
關注
76文章
4069瀏覽量
83679
發布評論請先 登錄

評論