前陣子刷屏了的網易云音樂刷臉推歌著實讓大家內心又騷動了一把。
「上傳一張個人照片,AI會分析你的面部特征并推薦你一首歌。識別二維碼即可體驗」
利用網易AI的人臉關鍵點定位技術,對自己的照片進行了一番掃描計算,邊掃還邊向你發射糖衣炮彈:
“很治愈的長相,看著就會覺得幸福”
“恩,一雙自帶浪漫BGM的眼睛”
“這是一張連AI都心動的臉”
嘖嘖嘖,這情話值Max的小AI,社交媒體上的小姐姐們表示根本停不下來了。
雖然情話AI稍微有點拍馬屁的嫌疑,但是肩負“傳播正能量,弘揚真善美”光榮使命的它,其背后還是有科學依據的。
01
美學依據:
『美丑看比例,拒絕強行帥』
雖然隨著社會和流行文化的更迭發展,人們的審美會存在一定差異,比如有人會為某亮和某晗,創造了“丑帥”、“陰柔美”之類的新名詞,這類“強行帥”都是粉絲中了明星人格buff后創造的,也就是常說的情人眼里出西施。如果單純從藝術角度判斷美丑,千百年來的標準并沒有太多變化,那就是比例論。
大家都知道達芬奇非常尊崇黃金分割(黃金比例),在他的人像畫中很好地踐行了這個理論,也正是他提出了人的完美面孔比例,比如臉部的寬高比、內眼角角度、眼間距占比、嘴巴占臉寬比等等維度。
但是這套理論太不方便了,不利于傳播,老百姓總不能為了判斷美丑隨身帶一把尺去量人的鼻翼有多寬大吧。于是一位整形醫生根據這套比例結合自己十多年的整容經驗,打造了一個據說只有最美的人才能完美嵌套的面部比例面具-馬夸特面具。
你不要覺得玄乎,這個面具其實經歷了很多驗證的。你可以嘗試拿明星的正面照去套,好看的往往不會偏差太多。比如章子怡,面部線條和五官與這個面具無縫對接。除了國際章,我還拿了其他在常人眼中好看的明星的正面照去比對,也相差無幾。
「國際章和“凡間天使”奧黛麗的臉,真的是百看不厭」
圖片來源 百度圖片
至此,馬夸特面具和達芬奇的人臉比例就構成了情話AI的美學理論基礎。
但是這里有個bug:人是會動的。為什么幾乎所有主播的鏡頭總是放在側上方?因為這個角度人臉看起來最好看,面部比例最匹配馬夸特面具。所以這就出現了對情話AI的另一個要求:測量真實性。
02
數據依據:
『良心AI,童叟無欺』
為了保證全民公平測量,本次H5調用了網易AI的人臉分析接口,通過對面部關鍵點的定位,無論照片處于什么角度或者什么環境都能準確識別。無論你是正拍
還是側拍,
都能準確捕捉到你的面部數據。
另外,此次H5在發布當天就輕松達到千萬級的PV,這意味著情話AI在一天內要識別分析千萬級的人臉圖像,并且至少說1000萬次情話。
當然這不算什么,利用分布式技術,網易AI的日常廣告服務就可以支撐2000萬日訪問量,現在的千萬PV,還能再來一輪。
03
AI人臉分析的普及和『bug』
可能直至這次的刷臉推歌,很多人才意識到人臉分析技術居然有這功效,但事實上,人臉分析已經不是什么高科技技術了,iPhone X的人臉解鎖、支付寶的人臉驗證、還有每次張學友演唱會警察叔叔都能通過人臉識別抓到逃犯,這些都是人臉分析技術的一種。
早幾年谷歌就利用這項技術做了一個腦回路清奇的應用-看看你的照片和博物館的哪副畫作最像。
識別效果大家可以感受下。左上角是匹配度,右下角是畫作來源。(圖片來源 Twitter)
先來一組低分的。
再來一組高分的。
準確度幾分我不知道,傳神度可以說是滿分了。
為什么會出現如此奇葩的匹配結果呢?
要解釋這個問題,我們首先要知道人臉識別的兩個過程:采集(特征提取)、匹配(模型構建+特征比對)。
谷歌的“人與畫像”就是先采集你的照片,再與博物館的畫作匹配;iPhone X在新機設置Face ID時會讓你在鏡頭前轉來轉去以及眨眼睛,目的也是采集你的面部信息,為了之后每次解鎖屏幕的時候做匹配。
所以識別結果的準確率主要受制于兩個因素,
一、采集準確率,
二、用于模型構建的訓練人臉庫的大小。
解釋下:用兒童玩具相機拍的你和Canon 5D拍的肯定不一樣,前者拍的可能你爸媽都不一定認得出,這就是「采集準確率低」;但是如果用兒童相機全程跟蹤連拍你一整天最后形成一個照片集,你爸媽或許能從一些“招牌動作”(特征)辨別出這就是你,這就是因為「訓練人臉庫很龐大」。
所以為了做好人臉識別,AI工程師們一邊需要用更高級的設備采集人臉圖像,一邊需要擴充用于模型構建的訓練人臉庫。
比如iPhone X采用了 TrueDepth 攝像系統,雙攝像頭,其中一個為紅外攝像頭,還包含各種傳感器。它跟2D人臉識別的區別就是使用了結構光,通過右邊一個小投影儀投射帶形狀信息的紅外光斑到人臉上,左邊的攝像頭采集光斑的信息,根據形變和大小等逐一確定各個位置的深度和方向信息,最后得到人臉的點云生成3D模型。這樣的結果就是以防壞人拿著你的平面照片就解鎖你的手機了。
圖片來源 站長之家
在擴充訓練人臉數據庫上,出于對個人隱私信息的保護,AI工程師通常使用的是志愿者提供的人臉圖片數據(只有約1萬人),可想而知這個人臉信息有多稀缺。不過也不用擔心,AI工程師們還會利用數據擴增技術對這些原始數據進行擴增,一般能夠把數據規模提升數十倍甚至上百倍。
-
AI
+關注
關注
88文章
35320瀏覽量
280790 -
人工智能
+關注
關注
1807文章
49062瀏覽量
250160
原文標題:云音樂刷屏H5背后的神秘力量,原來是個會說“情話”的人工智能
文章出處:【微信號:gh_70d0cce81c74,微信公眾號:網易人工智能】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
云計算和人工智能有什么區別和聯系
華為云 Flexus 云服務器 X 實例搭建部署 H5 美妝護膚分銷商城、前端 uniapp

評論