自蘋果Siri問世以來(lái),智能語(yǔ)音似乎就是一場(chǎng)持續(xù)不斷的技術(shù)戰(zhàn)。亞馬遜推出自然生態(tài)語(yǔ)音操控產(chǎn)品Echo智能揚(yáng)聲器,通過(guò)整合Alexa智能語(yǔ)音助手,進(jìn)一步推動(dòng)智能語(yǔ)音嵌入式平臺(tái)發(fā)展,微軟緊隨其后推出自家Cortana小娜語(yǔ)音助理。為了追趕亞馬遜的步伐,谷歌今年I/O大會(huì)上也推出了新一代智能語(yǔ)音Assistant,三星在今年年終的時(shí)候也加緊推出Bixby。各家智能語(yǔ)音應(yīng)用對(duì)第三方開發(fā)者開發(fā)更是在年底集體爆發(fā),智能語(yǔ)音大戰(zhàn)一觸即發(fā),未來(lái)誰(shuí)會(huì)在智能語(yǔ)音嵌入式平臺(tái)獲得長(zhǎng)足的進(jìn)展?
?
蘋果(Siri)
Siri是一家語(yǔ)音公司,成立于2007年,2010年被蘋果以2億美金收購(gòu),最初是以文字聊天服務(wù)為主,隨后通過(guò)與全球最大的語(yǔ)音識(shí)別廠商Nuance合作,Siri實(shí)現(xiàn)了語(yǔ)音識(shí)別功能。
2011年,蘋果發(fā)布Siri語(yǔ)音助理,并集成到iPhone 4S中,作為iOS移動(dòng)操作系統(tǒng)的一部分。
2012年6月12日,蘋果正式發(fā)布Siri中文版本,這是一款定位蘋果產(chǎn)品上的智能語(yǔ)音應(yīng)用軟件(語(yǔ)音助手),產(chǎn)品涵蓋蘋果iPhone4S、iPad3及以上版本。通過(guò)使用Siri語(yǔ)音助手,用戶可以通過(guò)聲控、文字輸入方式快速讀取文字語(yǔ)音短信、了解附近餐廳、詢問天氣情況、設(shè)置語(yǔ)音鬧鈴等等。
據(jù)悉,iPhone 4S、iPad3、The new iPad的Siri支持中文語(yǔ)音需要iOS6.0及以上版本。
Siri可以支持自然語(yǔ)言輸入,并且可以調(diào)用系統(tǒng)自帶的天氣預(yù)報(bào)、日程安排、搜索資料等應(yīng)用,還能夠不斷學(xué)習(xí)新的聲音和語(yǔ)調(diào),提供對(duì)話式的應(yīng)答。
在人機(jī)互動(dòng)方面,Siri提供十分生動(dòng)的對(duì)話接口,其針對(duì)用戶詢問所給予的回答,也不至于答非所問,有時(shí)候更是讓人有種心有靈犀的驚喜。例如使用者如果在說(shuō)出、輸入的內(nèi)容包括了『喝了點(diǎn)』、『家』這些字(甚至不需要符合語(yǔ)法,相當(dāng)人性化、、、),Siri 則會(huì)判斷為喝醉酒、要回家,并自動(dòng)建議是否要幫忙叫出租車。
具體來(lái)說(shuō),Siri有以下幾大功能:
1、用 Siri 播放隨機(jī)音樂
通過(guò)用戶導(dǎo)入本機(jī)音樂到“最愛”播放列表,開始播放音樂并告訴Siri播放哪一首歌、哪一個(gè)歌手曲目,Siri將會(huì)自動(dòng)匹配最愛歌曲列表,實(shí)現(xiàn)歌曲隨機(jī)播放功能。
2、告訴Siri想去哪
查找路線還需要手動(dòng)輸入文字?Siri會(huì)自動(dòng)根據(jù)用戶語(yǔ)音調(diào)取Google地圖來(lái)尋找最優(yōu)路線方案,并及時(shí)反饋給用戶。
3、Siri代替手輸發(fā)送短訊
在外走路的時(shí)候不方便手動(dòng)輸入短信息,想輸入短訊內(nèi)容時(shí)調(diào)取Siri語(yǔ)音即可。
4、Siri天氣預(yù)報(bào)
想知道最近天氣如何?問問Siri就知道了,一般情況Siri都能夠正確理解。
5、Siri智能鬧鐘
按住蘋果Home鍵并告訴Siri幾點(diǎn)叫醒,到預(yù)定時(shí)間Siri將會(huì)準(zhǔn)點(diǎn)叫醒。
6、支持新浪微博發(fā)送
7、Siri地點(diǎn)提醒
Siri除了“家”和“上班”兩個(gè)地點(diǎn)精準(zhǔn)定位外,用戶途徑某個(gè)經(jīng)常光顧的地方,說(shuō)“這里”并設(shè)置好提醒,Siri在往后預(yù)定時(shí)間內(nèi)將會(huì)再次提醒。
8、使用Google日歷安排日程
9、Siri進(jìn)行答疑解惑
比如說(shuō):珠穆朗瑪峰現(xiàn)在多高?美國(guó)去年的GDP是多少?等諸如此類的科普、生活問題,Siri都會(huì)通過(guò)知識(shí)引擎尋找答案并給你反饋?zhàn)罱K結(jié)果。
10、尋找一家合適的咖啡廳
另外,在今年6月的WWDC 2016大會(huì)上,蘋果發(fā)布了面向開發(fā)者的最新語(yǔ)音助手SiriKit,Siri不再局限于剛開始的基本聊天、打電話發(fā)短信基礎(chǔ)功能。SiriKit演進(jìn)到用戶可以通過(guò)喚醒語(yǔ)音
,并能把用戶語(yǔ)音識(shí)別及語(yǔ)意分析后,進(jìn)行應(yīng)用調(diào)取、聯(lián)系人郵件匹配發(fā)送、照片搜索、個(gè)人照片搜索、個(gè)人付款、外出打車車載語(yǔ)音應(yīng)用控制等多種應(yīng)用,用戶語(yǔ)音意圖識(shí)別度方面也會(huì)更精確、更加匹配。
今年10月份,蘋果Siri在iOS10發(fā)布時(shí),正式開放了部分第三方應(yīng)用。
亞馬遜(Alexa)
亞馬遜開發(fā)Echo以及Alexa服務(wù)的項(xiàng)目可以追溯到2011年,這遠(yuǎn)遠(yuǎn)早于產(chǎn)品公之于眾的時(shí)間。Alexa機(jī)器學(xué)習(xí)的副主管兼首席科學(xué)家Rohit Prasad表示:“創(chuàng)建Alexa的靈感來(lái)源于Star Trek計(jì)算機(jī)?!睋Q句話說(shuō),亞馬遜希望創(chuàng)造出一個(gè)可以與有智慧的人類進(jìn)行交流的計(jì)算機(jī)界面。
亞馬遜認(rèn)為,Echo不應(yīng)當(dāng)僅成為一個(gè)聲控?fù)P聲器,而是應(yīng)該要徹底摒棄顯示屏。這意味著Alexa不單強(qiáng)調(diào)通過(guò)聲音進(jìn)行控制,還依靠聲音進(jìn)行100%控制。同時(shí),Alexa項(xiàng)目的開發(fā)要求Alexa需要增強(qiáng)在機(jī)器學(xué)習(xí)及人工智能領(lǐng)域的專業(yè)技能。
2014年11月6日,亞馬遜正式推出Echo智能揚(yáng)聲器以及聲控助手服務(wù)Alexa。據(jù)悉,Echo智能揚(yáng)聲器是亞馬遜第一款引進(jìn)支持Alexa語(yǔ)音助手設(shè)備。與當(dāng)時(shí)蘋果推出Siri語(yǔ)音助理不同的是,亞馬遜將Echo定位為一款可以回應(yīng)簡(jiǎn)單指令的智能揚(yáng)聲器。用戶通過(guò)重復(fù)喚醒詞匯來(lái)叫醒Alexa,通過(guò)Echo遠(yuǎn)場(chǎng)麥克風(fēng)的作用,捕捉每一個(gè)任何位置發(fā)出的正常對(duì)話聲音,并在Alexa獲取相關(guān)語(yǔ)音指令之后作出相應(yīng)回復(fù)。
Alexa設(shè)備相比于從口袋中拿出手機(jī)更加方便,只需要在房間內(nèi)直接配備麥克風(fēng)即可。
2015年7月,亞馬遜正式對(duì)所有用戶公開出售Echo智能揚(yáng)聲器,如今Echo已經(jīng)成為一個(gè)炙手可熱的消費(fèi)類電子設(shè)備。根據(jù)第三方市場(chǎng)研究表示,Echo市場(chǎng)份額已經(jīng)已經(jīng)超越了頂尖的揚(yáng)聲器制造商,如Bode、Logitech以及Sonos等。
從2016年1月份開始,Alexa掌握的技能已經(jīng)從原來(lái)的135個(gè),增加到如今的4000個(gè)。譬如:你可以支付Capital One信用卡賬單,你可以要求獲得BBC的新聞簡(jiǎn)訊,你可以詢問Good Housekeeping如何去除地毯上的紅酒污漬,你還可以讓Alexa假裝發(fā)出放屁聲。
亞馬遜推出Echo之后,繼續(xù)大力推廣Alexa。這跟谷歌的做法類似:在推出開發(fā)系統(tǒng)安卓平臺(tái)以后,就相繼推出了谷歌Nexus系列手機(jī)。谷歌做手機(jī)的目的從來(lái)就不是要成為智能手機(jī)的主要制造商,而是想利用Nexus來(lái)證明安卓的出色性能,并鼓勵(lì)其他手機(jī)制造商也使用安卓系統(tǒng)。Alexa智能揚(yáng)聲器的新設(shè)計(jì),將Alexa智能語(yǔ)音控制嵌入到許多智能音箱產(chǎn)品中,未來(lái)也會(huì)在很多電子設(shè)備上面看到嵌入的Alexa語(yǔ)音界面。
Alexa在無(wú)須打開屏幕或是按下按鈕就可以啟動(dòng),但同時(shí)也存在一系列的使用問題。如克服一些技術(shù)、設(shè)計(jì)以及社會(huì)性的難題。比如隱私問題,為了確保Alexa能被喚醒詞匯時(shí)候能夠聽到,就必須保持一直聆聽的狀態(tài),雖然亞馬遜方面表示用戶在說(shuō)出“喚醒詞匯”之前的任何對(duì)話都不會(huì)被記錄及存儲(chǔ)下來(lái)。而且Alexa目前還無(wú)法獲悉能完成多少技能,這或多或少需要Alexa變得更加人工智能后可以準(zhǔn)確預(yù)測(cè)用戶需要的技能,并在對(duì)話中直接告訴你。
微軟(Cortana)
Cortana中文名字叫做“小娜”,是微軟隨win10系統(tǒng)推出的個(gè)人語(yǔ)音助理。
據(jù)悉,安卓版“小娜”公測(cè)beta版早在2015年8月的時(shí)候已經(jīng)推出,針對(duì)iPhone版的Cortana app測(cè)試也在當(dāng)年11月初開始公眾測(cè)試版本。
2015年12月10日,微軟小娜Cortana的iOS、Android以及CM系統(tǒng)版本正式版已經(jīng)在國(guó)內(nèi)5家主要應(yīng)用商店——騰訊應(yīng)用寶、百度手機(jī)助手、小米手機(jī)助手、華為應(yīng)用市場(chǎng)和360手機(jī)助手聯(lián)合首發(fā)。Cortana推送僅限于中國(guó)和美國(guó)兩國(guó)使用,并且僅支持iOS 8及以上版本的iPhone,以及Android 4.1.2及以上版本的Android設(shè)備。
根據(jù)微軟官方表示,智能機(jī)跟PC端的小娜一樣,擁有同樣的智能。既可以查收各類信息,又可以提供有用的建議。不過(guò)在iOS和Android系統(tǒng)上,Cortana在部分功能和喚醒方式上還是打了折扣。例如iOS系統(tǒng)上無(wú)法實(shí)現(xiàn)Windows手機(jī)包括控制系統(tǒng)設(shè)置的選項(xiàng)、打開各類應(yīng)用程序、以及在系統(tǒng)內(nèi)的任意位置通過(guò)“你好,小娜”的語(yǔ)音來(lái)喚醒微軟小娜。
微軟小娜“能夠了解用戶的喜好和習(xí)慣”,“幫助用戶進(jìn)行日程安排、問題回答等”。Cortana 可以說(shuō)是微軟在機(jī)器學(xué)習(xí)和人工智能領(lǐng)域方面的嘗試。它會(huì)記錄用戶的行為和使用習(xí)慣,利用云計(jì)算、搜索引擎和“非結(jié)構(gòu)化數(shù)據(jù)”分析,讀取和“學(xué)習(xí)”包括手機(jī)中的文本文件、電子郵件、圖片、視頻等數(shù)據(jù),來(lái)理解用戶的語(yǔ)義和語(yǔ)境,從而實(shí)現(xiàn)人機(jī)交互。
2016年12月9日,微軟發(fā)布了安卓版Cortana2.0.1版本更新,新的安卓版微軟小娜采用了全新的UI設(shè)計(jì),更加簡(jiǎn)潔易用。此外在功能上,可以關(guān)聯(lián)手機(jī)日歷賬戶,同步日程安排等。
全球四大科技巨頭都在爭(zhēng)食智能語(yǔ)音控制市場(chǎng),微軟小娜Cortana自然也不會(huì)落后,在今年12月中旬,微軟Alexa已經(jīng)對(duì)第三方硬件正式開放,這意味著外部設(shè)備也能夠利用Alexa進(jìn)行操控。
微軟宣布將面向外部設(shè)備廠商提供相關(guān)的開發(fā)包(New Devices SDK),從而讓他們植入小娜。比如外部廠商Harmon Kardon將會(huì)在明年推出基于小娜的智能音箱產(chǎn)品。
此處Cortana對(duì)外開放,微軟Cortana推出New Skills Kit和Devices SDK,兩者基本對(duì)應(yīng)于亞馬遜Alexa的技能工具包和語(yǔ)音服務(wù)。第三方硬件制造商也可以利用Cortana Devices SDK,來(lái)構(gòu)建包含Cortana板載的小工具,從而開發(fā)出其定制化的設(shè)備。
谷歌助手(Assistant)
谷歌今年在智能語(yǔ)音方面發(fā)生了一個(gè)非常重要的大事,大家猜猜看是什么?沒錯(cuò),就是2016年谷歌I/O大會(huì)上,谷歌正式發(fā)布了其首款智能語(yǔ)音系統(tǒng)Google Assistant(谷歌助手),此處發(fā)布也是谷歌史上的一個(gè)重要轉(zhuǎn)折點(diǎn)。Assistant正式登場(chǎng),也為谷歌接下來(lái)的新產(chǎn)品,奠定了語(yǔ)音識(shí)別與人工智能的基調(diào)。
Google Assistant 可以控制智能手機(jī)、智能手表以及其他設(shè)備,通過(guò)使用自然語(yǔ)言與用戶對(duì)話,用于尋找信息、播放媒體內(nèi)容、執(zhí)行買電影票等任務(wù)。它能夠在不斷對(duì)話之中為你解決問題,而不像之前那樣只能用簡(jiǎn)單的提問和回答。它還能完整地理解上下文語(yǔ)境,圍繞一個(gè)話題陪你一直聊下去,而不是你問一句它回一句。應(yīng)該說(shuō),這是目前最為智能的語(yǔ)音助手。從發(fā)表的 DEMO 來(lái)看 Google Assistant 能幫你尋找頭條新聞,幫你尋找最快的路徑,打電話給聯(lián)絡(luò)人,甚至直接在照片應(yīng)用 app 中尋找并向朋友分享照片。
其中一個(gè)例子是,當(dāng)你問 Google 今晚有什么電影時(shí),Google Assistant 先會(huì)告訴你答案,緊接著當(dāng)你說(shuō)會(huì)有孩子要去看電影時(shí),Google 還會(huì)自動(dòng)排除限制級(jí)的影片,當(dāng)你口頭確定后,Google 不僅把取票二維碼發(fā)給你,還會(huì)為你呈現(xiàn)電影的影評(píng)。
Google Assistant 可以兼容第三方服務(wù),包括 Ticketmaster、Spotify、Uber 以及 Whatsapp 等,但是亞馬遜的 Alexa在這個(gè)領(lǐng)域已經(jīng)占據(jù)優(yōu)勢(shì)。分析師認(rèn)為 Google Assistant 可以幫助谷歌更有效地與亞馬遜Echo設(shè)備對(duì)抗,同時(shí)與其他個(gè)人助理 Siri、Cortana 以及 Alexa 競(jìng)爭(zhēng)。
12月8日,谷歌還推出了Conversation Actions系統(tǒng)工具,該工具可以幫助開發(fā)者構(gòu)建與Google Assistant配合使用的聊天機(jī)器人。據(jù)了解,通過(guò)讓第三方與聊天機(jī)器人進(jìn)行與Google用戶互動(dòng)的方式,聊天機(jī)器人可以進(jìn)行問答,最終則能幫助銷售,做一些預(yù)訂方面的事。
12月9日,谷歌正式準(zhǔn)備面向第三方應(yīng)用程序開發(fā)商開放其語(yǔ)音助手Assistant。通過(guò)與第三方應(yīng)用程序整合,會(huì)讓谷歌Assistant在迅猛發(fā)展的語(yǔ)音助手領(lǐng)域變得更有競(jìng)爭(zhēng)力。
三星(Bixby)
本來(lái)只有蘋果、亞馬遜、微軟、谷歌四家科技巨頭在智能語(yǔ)音領(lǐng)域方面占據(jù)主導(dǎo),但不得不提的是三星今年在智能語(yǔ)音控制方面也投入了不少的精力,在人工智能領(lǐng)域,發(fā)力的可不僅僅只是老生常談的幾家,眾多廠商已經(jīng)意識(shí)到智能語(yǔ)音領(lǐng)域未來(lái)潛在的無(wú)限能力和發(fā)展前景。
今年10月份,三星正式收購(gòu)美國(guó)機(jī)器學(xué)習(xí)虛擬助手初創(chuàng)公司Viv Labs Inc。同時(shí),還收購(gòu)了Harman,位于美國(guó)紐約哈曼集團(tuán)旗下一個(gè)專門生產(chǎn)家用及車用音響的品牌,這些舉措進(jìn)一步表明三星未來(lái)在人工智能語(yǔ)音方面做大的決心。
Viv Labs是蘋果Siri創(chuàng)始團(tuán)隊(duì)之一,也是一家專做人工智能和虛擬助手的公司。被三星收購(gòu)后,Viv Labs也帶去了最新的人工智能語(yǔ)音助手產(chǎn)品Viv。
據(jù)了解,Viv Labs由Siri 之父”戴格·吉特勞斯創(chuàng)辦,是一家致力于打造開放式人工智能助理平臺(tái)。
在三星的一份未來(lái)計(jì)劃報(bào)告中顯示,2017年Viv Labs旗下人工智能平臺(tái)Viv即將整合到蓋樂世智能手機(jī)中,并將語(yǔ)音輔助服務(wù)拓展至家電及可穿戴高科技設(shè)備。
根據(jù)最新消息稱,三星明年4月發(fā)布的三星Galaxy S8將使用上全新人工智能語(yǔ)音助手Bixby,Bixby基于Viv人工智能引擎,并會(huì)出現(xiàn)在Galaxy S8幾乎所有預(yù)裝應(yīng)用中,實(shí)現(xiàn)系統(tǒng)級(jí)的整合,全面取代現(xiàn)在的S Voice。
同時(shí),Galaxy S8人工智能助理將面向開發(fā)者開放,從而能夠集成更多的新功能,并與第三方服務(wù)進(jìn)行交互。
屆時(shí),Bixby語(yǔ)音助手更加先進(jìn)和智能,可以根據(jù)使用環(huán)境提供答案、輔助,比如在相冊(cè)中,你可以讓它展示滿足特定條件的照片和視頻。
小編總結(jié)
隨著四大科技巨頭蘋果Siri、亞馬遜Alexa、微軟Cortana、谷歌Assistant,還有后來(lái)者三星Bixby紛紛入局智能語(yǔ)音控制,智能語(yǔ)音嵌入式界面將會(huì)是打通語(yǔ)音控制的一個(gè)重要的接入點(diǎn)。智能語(yǔ)音開源將是未來(lái)語(yǔ)音平臺(tái)發(fā)展的下一代計(jì)算平臺(tái),人工智能技術(shù)的崛起也將進(jìn)一步帶動(dòng)智能語(yǔ)音的迅速發(fā)展。
評(píng)論