外媒,自2014年亞馬遜發(fā)布智能音箱Echo以來(lái),亞馬遜Echo、谷歌Home和Apple HomePod等“智能音箱”設(shè)備已經(jīng)銷(xiāo)售了數(shù)以百萬(wàn)臺(tái),大科技公司正在將亞馬遜Alexa、蘋(píng)果Siri、谷歌Assistant、微軟Cortana,以及Facebook的類(lèi)似服務(wù)整合到人們生活中。咨詢(xún)公司Juniper Research估計(jì),到2023年,全球智能音箱年市場(chǎng)規(guī)模將達(dá)到110億美元,全球約有74億部語(yǔ)音控制設(shè)備。
科技公司表示智能音箱只有在用戶(hù)激活時(shí)才會(huì)錄音,但事實(shí)上正在把永遠(yuǎn)開(kāi)著的麥克風(fēng)引入私密空間。亞馬遜及其競(jìng)爭(zhēng)對(duì)手表示,絕大多數(shù)語(yǔ)音請(qǐng)求都是由電腦自動(dòng)執(zhí)行的,無(wú)需人工審核。然而,這些智能設(shè)備都在依賴(lài)成千上萬(wàn)的低薪員工進(jìn)行人工轉(zhuǎn)錄,用戶(hù)私密對(duì)話(huà)已經(jīng)成為他們最有價(jià)值的數(shù)據(jù)集之一。所有科技公司都認(rèn)為,這是改善他們產(chǎn)品的一種合理方式。
其實(shí)我們一直在被偷聽(tīng)
Ruthy Hope Slatis簡(jiǎn)直不敢相信她所聽(tīng)到的。她曾被波士頓郊外的一家臨時(shí)機(jī)構(gòu)雇用,為亞馬遜轉(zhuǎn)錄音頻文件,這是一項(xiàng)被亞馬遜所模糊的工作。作為每小時(shí)只拿12美元薪酬的合同工,她和同事(正式名稱(chēng)為數(shù)據(jù)助理)需要聽(tīng)取隨機(jī)交談的片段,并在自己的筆記本電腦里記下聽(tīng)到的每個(gè)單詞。
亞馬遜對(duì)外只會(huì)說(shuō)這項(xiàng)工作對(duì)其絕密的語(yǔ)音識(shí)別產(chǎn)品至關(guān)重要,然而,這些語(yǔ)音片段中卻包含著用戶(hù)親密時(shí)刻的錄音。
2014年秋天,亞馬遜推出了Echo智能音箱,該設(shè)備帶有語(yǔ)音激活虛擬助手軟件Alexa。亞馬遜在其首個(gè)Echo廣告中將Alexa視為人工智能的奇跡。在該廣告中,一個(gè)幸福的家庭正在命令A(yù)lexa接收新聞更新、回答問(wèn)題答案,并幫助孩子們做作業(yè)。但是,Slatis很快就開(kāi)始意識(shí)到人類(lèi)在這款產(chǎn)品背后的影響力。
她記得當(dāng)時(shí)自己在想:“天哪,這就是我正在做的事情。”亞馬遜會(huì)捕獲云中的每個(gè)語(yǔ)音命令,并依靠像她這樣的數(shù)據(jù)助理來(lái)訓(xùn)練系統(tǒng)。一開(kāi)始,Slatis認(rèn)為自己所聽(tīng)取的片段來(lái)自有酬勞的測(cè)試人員,這些測(cè)試人員自愿用自己的語(yǔ)音模式來(lái)?yè)Q取幾美元的獎(jiǎng)勵(lì)。然而,她很快意識(shí)到這個(gè)想法是錯(cuò)誤的。
她和她的同事正在聽(tīng)取的錄音通常很激烈、很尷尬,而用戶(hù)也會(huì)在音箱面前承認(rèn)自己的秘密和恐懼。隨著轉(zhuǎn)錄項(xiàng)目的發(fā)展以及Alexa的流行,錄音中透露的私人信息也隨之增加。其他合同工回憶說(shuō),自己聽(tīng)過(guò)孩子分享了他們的家庭住址和電話(huà)號(hào)碼,聽(tīng)到一名男子試圖訂購(gòu)性玩具,甚至聽(tīng)到一名晚宴客人大聲地想知道亞馬遜當(dāng)時(shí)是否正在偷聽(tīng)。Slatis說(shuō):“用戶(hù)往往只是開(kāi)玩笑,但其實(shí)完全不知道自己正在被偷聽(tīng)。”她于2016年選擇了辭職。
科技公司們說(shuō)他們正在改正
雷鋒網(wǎng)了解到,自從Slatis第一次感到毛骨悚然以來(lái)的五年中,四分之一的美國(guó)人購(gòu)買(mǎi)了“智能音箱”設(shè)備,例如Echo、Google Home和Apple HomePod。到目前為止,亞馬遜已經(jīng)贏(yíng)得了這場(chǎng)銷(xiāo)售大戰(zhàn),據(jù)報(bào)道,用戶(hù)已經(jīng)購(gòu)買(mǎi)了超過(guò)1億個(gè)Alexa設(shè)備。
但是如今,這些全球最大的公司之間正在展開(kāi)一場(chǎng)新的戰(zhàn)爭(zhēng),通過(guò)將麥克風(fēng)內(nèi)置于手機(jī)、智能手表、電視、冰箱、SUV等各種物品中,把Alexa、Siri、Google Assistant和Cortana嵌入到人們的生活中。咨詢(xún)公司Juniper Research估計(jì),到2023年,全球智能音箱的年市場(chǎng)規(guī)模將達(dá)到110億美元,語(yǔ)音控制設(shè)備將達(dá)到約74億個(gè),這相當(dāng)于地球上的每個(gè)人都擁有一個(gè)設(shè)備。
而現(xiàn)在的問(wèn)題是,我們要如何處理這樣的規(guī)模呢?
按照科技公司的聲明,這些機(jī)器并沒(méi)有每時(shí)每刻創(chuàng)建音頻文件,因?yàn)橹悄芤粝鋬H在用戶(hù)激活它們時(shí)才錄制音頻。但是,當(dāng)始終在線(xiàn)的麥克風(fēng)被引入廚房和臥室中時(shí),它們可能會(huì)無(wú)意間捕獲到用戶(hù)不想共享的聲音。
然而,這些所謂的智能設(shè)備無(wú)疑需要依賴(lài)成千上萬(wàn)的低薪人群,他們需要在這些聲音片段中添加注釋?zhuān)员慵夹g(shù)公司可以升級(jí)其“電子耳朵”。至此,我們最微弱的耳語(yǔ)竟成為科技公司最有價(jià)值的數(shù)據(jù)集之一。
今年早些時(shí)候,彭博社首先報(bào)道了技術(shù)行業(yè)使用人類(lèi)來(lái)審查從用戶(hù)那里收集的音頻(并且沒(méi)有向用戶(hù)披露這一事實(shí))。這其中就包括了蘋(píng)果、亞馬遜和Facebook。相關(guān)高管和工程師表示,建立龐大的人類(lèi)監(jiān)聽(tīng)網(wǎng)絡(luò)會(huì)帶來(lái)問(wèn)題或干擾,盡管這一直是改善其產(chǎn)品的明顯方法。
除此之外,雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng))也注意到,在過(guò)去的幾年中,蘋(píng)果在收集和分析人們的聲音方面變得更加激進(jìn),擔(dān)心Siri的理解力和速度落后于A(yíng)lexa和Google Assistant。蘋(píng)果將Siri視為語(yǔ)音搜索引擎,因此它必須做好準(zhǔn)備以應(yīng)付無(wú)休止的用戶(hù)查詢(xún),并加大對(duì)音頻分析的依賴(lài)。
2015年,當(dāng)蘋(píng)果首席執(zhí)行官蒂姆·庫(kù)克宣稱(chēng)隱私是一項(xiàng)“基本人權(quán)”之時(shí),蘋(píng)果的機(jī)器每周需要處理超過(guò)十億次請(qǐng)求。當(dāng)時(shí),用戶(hù)可以開(kāi)啟一項(xiàng)功能,保持語(yǔ)音助手始終在線(xiàn),這樣他們就不再需要按下按鈕來(lái)激活語(yǔ)音助手。蘋(píng)果在其用戶(hù)協(xié)議法律條款中表示,可能會(huì)記錄和分析語(yǔ)音數(shù)據(jù)以改善Siri,但沒(méi)有任何地方提到會(huì)是人類(lèi)員工在監(jiān)聽(tīng)。一位前合同工說(shuō):“監(jiān)聽(tīng)別人的語(yǔ)音,讓我感到非常不舒服。曾在Siri高級(jí)開(kāi)發(fā)團(tuán)隊(duì)工作的John Burkey說(shuō)。“這不是間諜行為。這與應(yīng)用崩潰并詢(xún)問(wèn)是否要將報(bào)告發(fā)送給蘋(píng)果的行為是相同的。”
許多合同工表示,盡管大多數(shù)Siri要求都是很普通的,但他們?nèi)匀粫?huì)聽(tīng)到的色情化的語(yǔ)音,以及種族歧視或恐同性言論。
蘋(píng)果表示,只有不到0.2%的Siri請(qǐng)求需要進(jìn)行人類(lèi)分析。前任經(jīng)理將合同工的指控視為夸張。曾帶領(lǐng)開(kāi)發(fā)團(tuán)隊(duì)的Siri聯(lián)合創(chuàng)始人Tom Gruber說(shuō):“實(shí)際上,我們要處理的很多都是噪音,并不是說(shuō)機(jī)器打算錄制某些聲音,這只是某種意義上的概率問(wèn)題。”
到2019年,蘋(píng)果將Siri引入其無(wú)線(xiàn)耳機(jī)和HomePod揚(yáng)聲器等產(chǎn)品后,每月需要處理150億條語(yǔ)音命令。0.2%意味著每月,人類(lèi)合同工需要處理3000萬(wàn)條語(yǔ)音命令,一年下來(lái)就會(huì)是3.6億條。Siri團(tuán)隊(duì)的前首席研究科學(xué)家Mike Bastian說(shuō),隨機(jī)錄制的風(fēng)險(xiǎn)隨著用例的增加也在不斷增長(zhǎng)。他提到了Apple Watch的“抬起激活”功能,該功能在檢測(cè)到佩戴者的手腕被抬起時(shí)會(huì)自動(dòng)激活Siri。他說(shuō):“這就導(dǎo)致假陽(yáng)性率很高。”
2016年,亞馬遜創(chuàng)建了Frequent Utterance Database(FUD),以幫助Alexa為常見(jiàn)請(qǐng)求添加答案。與FUD合作的前員工表示,渴望更積極挖掘數(shù)據(jù)的產(chǎn)品團(tuán)隊(duì)與負(fù)責(zé)保護(hù)用戶(hù)信息的安全團(tuán)隊(duì)之間存在緊張關(guān)系。2017年,亞馬遜推出了配備攝像頭的Echo Look,該產(chǎn)品被稱(chēng)為AI造型師,可以推薦服裝搭配。知情人士說(shuō),它的開(kāi)發(fā)者考慮將相機(jī)編程為在用戶(hù)要求Alexa講笑話(huà)時(shí)自動(dòng)開(kāi)機(jī)。他們的想法是錄制用戶(hù)面部的視頻并評(píng)估用戶(hù)是否在笑。這些人說(shuō),亞馬遜最終擱置了這個(gè)想法。該公司表示,Alexa目前沒(méi)有使用面部識(shí)別技術(shù)。
該公司已在世界各地設(shè)立了轉(zhuǎn)錄“農(nóng)場(chǎng)”。今年,它舉行了多次面向海外轉(zhuǎn)錄員的入門(mén)招聘活動(dòng)。一位花了數(shù)十年時(shí)間為科技公司開(kāi)發(fā)識(shí)別系統(tǒng)的語(yǔ)音技術(shù)專(zhuān)家說(shuō),最近的招聘規(guī)模暗示亞馬遜音頻數(shù)據(jù)分析的規(guī)模令人震驚。亞馬遜表示,它“認(rèn)真對(duì)待客戶(hù)及其錄音的安全性”,并且需要全面了解區(qū)域性口音和口語(yǔ)化才能使Alexa走向全球。
微軟在今年8月承認(rèn),它使用人類(lèi)幫助審查通過(guò)語(yǔ)音識(shí)別技術(shù)生成的語(yǔ)音數(shù)據(jù)。寶馬、惠普和Humana等企業(yè)正在將這一技術(shù)集成到自己的產(chǎn)品和服務(wù)中。包括阿里巴巴、搜索巨頭百度和手機(jī)制造商小米在內(nèi)的中國(guó)科技公司每個(gè)季度都在收集數(shù)百萬(wàn)個(gè)智能音箱的語(yǔ)音數(shù)據(jù)。
谷歌搜索向Google Assistant提供了來(lái)自數(shù)十億種可用設(shè)備的查詢(xún),這些設(shè)備包括Android智能手機(jī)和平板電腦、Nest恒溫器和Sony TV。谷歌已經(jīng)雇用了海外的臨時(shí)工來(lái)轉(zhuǎn)錄片段,以提高系統(tǒng)的準(zhǔn)確性。谷歌已承諾,審閱的錄音不會(huì)與任何個(gè)人信息相關(guān)聯(lián)。但是今年夏天,一家谷歌承包商向比利時(shí)廣播公司VRT NWS分享了1000多個(gè)用戶(hù)記錄。這家媒體能夠根據(jù)用戶(hù)所說(shuō)的話(huà)找出錄音中的某些人是誰(shuí),這讓那些被查明的用戶(hù)感到震驚。這些記錄中的10%,是因?yàn)樵O(shè)備錯(cuò)誤地檢測(cè)到激活詞,并在未經(jīng)用戶(hù)同意的情況下進(jìn)行了錄音。
在相關(guān)新聞報(bào)道不斷出現(xiàn)之后,這些大型科技公司于今年調(diào)整了他們的虛擬助手項(xiàng)目。
谷歌暫停了人類(lèi)對(duì)Assistant音頻的轉(zhuǎn)錄,蘋(píng)果開(kāi)始允許用戶(hù)刪除他們的Siri歷史記錄并選擇不共享更多內(nèi)容,使共享錄音成為可選內(nèi)容,并直接雇用了許多前承包商來(lái)增強(qiáng)其對(duì)人類(lèi)監(jiān)聽(tīng)的控制力。
Facebook和微軟在其隱私政策中添加了更明確的免責(zé)聲明。
亞馬遜也引入了類(lèi)似的披露方式,并開(kāi)始允許Alexa用戶(hù)選擇不進(jìn)行人工審核。
一些研究人員說(shuō),智能手機(jī)處理能力的提高和一種稱(chēng)為聯(lián)合學(xué)習(xí)的計(jì)算機(jī)建模形式可能最終會(huì)淘汰這些監(jiān)聽(tīng)行為,因?yàn)檫@些機(jī)器將變得足夠聰明,可以在沒(méi)有合同工幫助的情況下解決問(wèn)題。目前,由于沒(méi)有更嚴(yán)格的法律或消費(fèi)者的強(qiáng)烈反對(duì),隨著語(yǔ)音設(shè)備的激增,人類(lèi)音頻審核隊(duì)伍幾乎肯定會(huì)繼續(xù)增長(zhǎng)。
評(píng)論