這是BAT下半年的其中一個(gè)“戰(zhàn)場(chǎng)”。
2014年底,亞馬遜在官網(wǎng)悄悄地發(fā)布了Echo,但估計(jì)就連亞馬遜自己也沒想到,這個(gè)看上去“簡(jiǎn)潔得有點(diǎn)簡(jiǎn)陋”的奇怪音箱,居然能夠在日后賣出800多萬臺(tái),不僅直接給亞馬遜帶來將近10億美元營(yíng)收,甚至在Kindle之后成為又一款消費(fèi)者所認(rèn)可的終端。
Echo之后所代表的技術(shù)趨勢(shì)并不“隱晦”:智能語(yǔ)音技術(shù)落地點(diǎn),全新交互方式,全新服務(wù)接口這種概念的分析早就被寫了幾百遍。但另外一邊卻是赤裸裸的現(xiàn)實(shí)——一貫緊跟全球消費(fèi)電子市場(chǎng)的中國(guó),在智能語(yǔ)音的具體商業(yè)化這件事上卻“落后”了。
好在,“落后”并不意味著錯(cuò)過,反之因?yàn)椤奥浜蟆保屨麄€(gè)行業(yè)積聚了非常強(qiáng)大的力量,隨時(shí)有可能爆發(fā)出來。換句話說,2017年很可能會(huì)成為中國(guó)智能音箱市場(chǎng)最難得的“黃金發(fā)展期”。
兩個(gè)星期,BAT全部進(jìn)入戰(zhàn)場(chǎng)
雖然這早已不是BAT在同一個(gè)領(lǐng)域中爭(zhēng)高下,但在兩周內(nèi)讓3家巨頭同時(shí)進(jìn)入“戰(zhàn)場(chǎng)”,智能語(yǔ)音的魅力的確很大。第一個(gè)有動(dòng)作的是騰訊,在兩周之前的騰訊云峰會(huì)上,騰訊云就發(fā)布了全新的智能語(yǔ)音產(chǎn)品“騰訊云小微”。
而小微主要包括了3個(gè)開放性的平臺(tái):能夠通過SDK接入硬件的硬件開放平臺(tái);包含騰訊各種自由內(nèi)容、應(yīng)用資源的Skill開放平臺(tái);以及能夠讓機(jī)器不斷學(xué)習(xí)和決策的小微服務(wù)機(jī)器平臺(tái)。
有趣的是,在官方資料中,騰訊還提到了自己的一點(diǎn)優(yōu)勢(shì),小微的所有能力來自于微信AI團(tuán)隊(duì)。后者之前實(shí)際上已經(jīng)將語(yǔ)音識(shí)別、加入語(yǔ)義分析技術(shù)的語(yǔ)音輸入、語(yǔ)音轉(zhuǎn)文字、等功能添加到微信當(dāng)中。
“BA”則顯得更為默契,將自己的智能音箱產(chǎn)品的發(fā)布都定在了7月5號(hào)。
在前日上午的百度“Creat 2017”AI開發(fā)者大會(huì)中,更新的DuerOS成為了最重要的發(fā)布環(huán)節(jié)。百度在這次大會(huì)上也祭出了大手筆——聯(lián)合數(shù)家音箱生產(chǎn)、語(yǔ)音交互技術(shù)提供商,為其他第三方產(chǎn)品制造商、開發(fā)者提供軟硬件一體化解決方案。
百度同時(shí)還在開發(fā)者大會(huì)現(xiàn)場(chǎng)宣布了對(duì)KITT.AI的收購(gòu),后者在“熱詞檢測(cè)(喚醒)”、“智能語(yǔ)音對(duì)話”這兩項(xiàng)與智能語(yǔ)音息息相關(guān)的技術(shù)上有很不錯(cuò)的積累。但同時(shí)百度并沒有打算“獨(dú)吞”這些先進(jìn)技術(shù),而是將其語(yǔ)音能力和自然語(yǔ)言能力融入平臺(tái),向合作伙伴免費(fèi)開放,官方將其稱之為“賦能開放”。
短暫的午休之后,阿里終于“最后一個(gè)”加入進(jìn)來,畫風(fēng)略微不同的他們發(fā)布了“天貓精靈 X1”智能音箱。值得稍微提一嘴的是,有業(yè)內(nèi)人士爆料:“阿里這款智能音箱實(shí)際是來自思必馳的方案。”但硬件本身或許并不是“天貓精靈 X1”最為重要的特點(diǎn),關(guān)鍵還是在于阿里已經(jīng)在其之上實(shí)現(xiàn)了聲紋識(shí)別以及支付環(huán)節(jié)的打通。
這也符合業(yè)內(nèi)對(duì)于阿里進(jìn)軍智能音箱的一貫預(yù)期:阿里智能音箱的最大挑戰(zhàn)、同時(shí)最大的優(yōu)勢(shì)是購(gòu)物。依托電商建立龐大帝國(guó)的阿里不可能不做購(gòu)物,但這項(xiàng)服務(wù)本身放在語(yǔ)音上面來進(jìn)行有挑戰(zhàn),像Echo Show那樣帶有顯示屏的智能音箱或許更適合這種任務(wù),但那樣的產(chǎn)品同樣需要繼續(xù)等待。
對(duì)于BAT的新動(dòng)向,Rokid智能音箱負(fù)責(zé)人文杰也接受了采訪:
BAT進(jìn)軍智能音箱這件事對(duì)于我們來說算不上威脅,倒不如說是一種機(jī)遇。我們很期待他們接下來在這方面的服務(wù)端口開放。
對(duì)此,喜馬拉雅副總裁李海波也有著類似的觀點(diǎn):
雖然我們有打造自己的音箱,但是我們也會(huì)將自己的服務(wù)開放出去,別的智能音箱產(chǎn)品也能夠調(diào)用我們的音頻內(nèi)容資源。因?yàn)槲覀冴P(guān)心的只是單個(gè)用戶在喜馬拉雅中停留的時(shí)間。”
先期引爆的英文語(yǔ)音市場(chǎng)
早前,美國(guó)市場(chǎng)研究公司Statista曾做過相關(guān)的統(tǒng)計(jì),2016年美國(guó)的智能家居市場(chǎng)銷售額為97億美元,而中國(guó)僅有5.2億美元。普及率的增長(zhǎng)更是驚人,美國(guó)的數(shù)值為5.8%,而中國(guó)僅為0.1%。
外國(guó)調(diào)研機(jī)構(gòu)給出的亞馬遜官方硬件產(chǎn)品銷售情況圖
但由于是大洋彼岸的關(guān)系,也有不少人曾經(jīng)對(duì)亞馬遜Echo“夸張”的銷售數(shù)據(jù)提出過質(zhì)疑,就此也詢問了國(guó)內(nèi)某智能音箱生產(chǎn)商:
去年亞馬遜Echo智能音箱的銷售效果的確不錯(cuò),在國(guó)內(nèi)它總的生產(chǎn)量剛超過800萬臺(tái),其中初期的Echo和簡(jiǎn)化版Echo Dot差不多對(duì)半。國(guó)內(nèi)銷售量第一名可能只有它的1/100。
參考目前Echo和Echo Dot分別定價(jià)179/49美元,光是這800萬臺(tái)設(shè)備就已經(jīng)能夠給亞馬遜帶來10億美元的營(yíng)收,這還不算在使用音響之后所帶來的服務(wù)訂購(gòu)、網(wǎng)上購(gòu)物等二次消費(fèi)。
從原理上說,智能音箱的代表產(chǎn)品,亞馬遜Echo背后的Alexa,以及它的前輩Siri,實(shí)際上都屬于智能語(yǔ)音技術(shù)。其核心非常簡(jiǎn)要——要讓機(jī)器在語(yǔ)音對(duì)話這一環(huán)節(jié)擁有近似于人的能力。
盡管語(yǔ)音對(duì)話是人類平日做得最多的動(dòng)作之一,它的難度卻不可小覷。從語(yǔ)音到文字的轉(zhuǎn)換、機(jī)器語(yǔ)音的發(fā)聲、再到多句語(yǔ)音的上下文理解,這些環(huán)節(jié)在沒有人工智能技術(shù)之前遲遲未能取得進(jìn)展。
載體則是另外一個(gè)因素,雖然擁有基礎(chǔ)對(duì)話能力的Siri早在6年前就登陸了手機(jī)。但智能手機(jī)的主要操作依然停留在觸摸和顯示之上,所以大家并不會(huì)經(jīng)常使用這一功能,甚至只會(huì)在不小心長(zhǎng)按Home鍵的時(shí)候才會(huì)想起這一功能。
相比之下,將語(yǔ)音交互能力獨(dú)立出來,并且只能通過語(yǔ)音交互的Echo。則“斷絕”了用戶返回到觸控操作的可能性的,這才讓人們終于開始正視智能語(yǔ)音交互本身。
另外一點(diǎn)關(guān)鍵是亞馬遜對(duì)于語(yǔ)音交互場(chǎng)景的深入理解——語(yǔ)音交互雖好,但是在公共場(chǎng)合比較吵的環(huán)境中并不適用,智能音箱就該成為小家電一般的存在,滲入人們的日常生活空間。為此,李志飛簡(jiǎn)單也講述了出門問問曾在美國(guó)做過的相關(guān)調(diào)研:
我們?cè)稍L了大量亞馬遜Echo和Google Home的使用者,同時(shí)也對(duì)美國(guó)智能家居需求與中國(guó)用戶對(duì)智能家居的需求進(jìn)行深度調(diào)研。在美國(guó),由于智能家居生態(tài)比較完善,用戶對(duì)智能音箱可以便捷控制家居的需求尤其強(qiáng)烈。實(shí)際上,中國(guó)人也有著這樣的需求。
國(guó)外咨詢公司Statista統(tǒng)計(jì)的Echo用戶具體使用情況
至此,人們終于整體感受到智能語(yǔ)音技術(shù)的“不同”,或者說是在體驗(yàn)層面達(dá)到了“讓用戶買單,并且不后悔”的程度。
問題來了,智能音箱在外國(guó)這么火,為什么國(guó)內(nèi)卻遲遲發(fā)展不起來?
“落后”明顯的中國(guó)市場(chǎng)
雖然隔著太平洋,但是中國(guó)在3C電子產(chǎn)品消費(fèi)市場(chǎng)上之前從未發(fā)生大的“脫節(jié)”,智能音箱卻是一個(gè)罕見的例子。一位國(guó)內(nèi)智能音箱從業(yè)者透了個(gè)底:
而國(guó)內(nèi)智能音箱目前的產(chǎn)量和銷量還在千、萬之間浮動(dòng),賣得最好的還是京東的叮咚,但實(shí)際數(shù)量仍遠(yuǎn)遠(yuǎn)小于Echo。數(shù)量最多的還是很多小廠商生產(chǎn)的低劣的智能音箱產(chǎn)品,那種產(chǎn)品10句話中有2句話有反應(yīng)就不錯(cuò)了。
那么究竟是什么原因?qū)е铝诉@樣的現(xiàn)象?打造智能音箱的技術(shù)基礎(chǔ)差異應(yīng)該是最主要的原因。對(duì)此出門問問CEO李志飛表示:
如果只是單單做一個(gè)演示(Demo)版的智能音箱是沒有門檻的,但如果做一款用戶體驗(yàn)好,性價(jià)比高的智能音箱是存在很高門檻的。
比如產(chǎn)品需要不停迭代完善,以確保穩(wěn)定的網(wǎng)絡(luò)連接;比如一款精美的音箱需要反復(fù)磨合外觀設(shè)計(jì);又比如語(yǔ)音交互需要良好的收聲效果,而揚(yáng)聲器本身會(huì)發(fā)聲,在遠(yuǎn)場(chǎng)喚醒智能音箱時(shí),就需要消除揚(yáng)聲器本身的聲音;甚至音量大時(shí)的震動(dòng)也會(huì)影響收聲,所以音腔和麥克風(fēng)之間的距離都需要考量。
喜馬拉雅副總裁李海波在采訪中也表達(dá)了類似的看法:
我們之前在打造自己的智能音箱的時(shí)候也花了不少時(shí)間。為了能正常使用,硬件部分足足微調(diào)了40天,音箱如何才能理解人類指令這件事花的時(shí)間就更久了,大概用了400多天,這還是應(yīng)用場(chǎng)景高度集中化的情況下。
這也從另外一個(gè)方面映射出智能音箱市場(chǎng)所存在的“分裂發(fā)展”問題:看起來簡(jiǎn)單的智能音箱想要真正實(shí)現(xiàn)日常語(yǔ)音交互,實(shí)際上全是技術(shù)難題。也正是這些難題讓中國(guó)智能語(yǔ)音市場(chǎng)發(fā)展遲緩,而其中影響最大的就是機(jī)器對(duì)于中文的理解,也就是我們俗稱的NLP。
為了說明中文的NLP在智能音箱上面有多難,李海波舉了一個(gè)例子:
我們?cè)?jīng)統(tǒng)計(jì)過,一個(gè)簡(jiǎn)單的‘下一曲’,用中文來表達(dá)就有60多種方式,而且這還是不考慮方言差異的前提下。
這也成為了智能音箱一個(gè)實(shí)打?qū)嵉钠琳希瑫r(shí)也是很多人對(duì)于BAT能夠加入到這場(chǎng)戰(zhàn)斗中感到高興的原因——這3家手中都有著大量可供機(jī)器學(xué)習(xí)的數(shù)據(jù),同時(shí)也有充足的人手和資源來支撐這個(gè)反復(fù)調(diào)試的過程。
另外一個(gè)層面來看,中國(guó)其實(shí)有很多人、公司已經(jīng)在智能語(yǔ)音的探索上先行一步,但是往往僅限于一些碎片化的問題,就像百度這次收購(gòu)的KITT.AI一樣。利用自己其他業(yè)務(wù)線相對(duì)雄厚的資金收入來整合社會(huì)能力,反過來再將這些能力打包給消費(fèi)者。這也是BAT自己所熟悉和擅長(zhǎng)的事情。
總結(jié):人工智能“商業(yè)化ing”
人類歷史上曾經(jīng)出現(xiàn)無數(shù)種技術(shù)、發(fā)明,究竟人們什么時(shí)候才會(huì)認(rèn)真對(duì)待它們呢?答:只要它們能夠給人類帶來大幅度的利益。
這條法則對(duì)于人工智能技術(shù)同樣適用,正如馬云之前曾經(jīng)公開表示的那樣:“AlphaGo 贏了,So TM What?”這句話雖然聽起來偏激,但從對(duì)于人類實(shí)際影響這個(gè)角度出發(fā),AlphaGo的確沒有留下足夠深的印記。
相反,看起來不起眼的智能音箱反倒有可能實(shí)現(xiàn)這個(gè)目標(biāo)。
百度談開源、騰訊曬內(nèi)容體系、阿里想打造新消費(fèi)入口,新入場(chǎng)的BAT雖然在方向策略上有所分歧,但有一點(diǎn)是確定的,他們都不會(huì)錯(cuò)過首先實(shí)現(xiàn)人工智能商業(yè)化的目標(biāo)。最好的證明就是三家發(fā)布智能音箱產(chǎn)品的場(chǎng)合。:百度AI開發(fā)者大會(huì)、騰訊“云+未來”技術(shù)峰會(huì)、阿里AI Labs人工智能實(shí)驗(yàn)室對(duì)外公布。
拋開BAT中誰能成為最終贏家這個(gè)目前仍無法確定的終極問題不談,3家大力下注人工智能的舉動(dòng)卻是再清晰不過的。統(tǒng)治了中國(guó)的“互聯(lián)網(wǎng)”時(shí)代的BAT,已經(jīng)充分意識(shí)到了人工智能將會(huì)帶來的趨勢(shì)和變革,才會(huì)如此“默契”地同時(shí)進(jìn)入這個(gè)戰(zhàn)場(chǎng)。
短期來看,圍繞著智能語(yǔ)音和音樂、語(yǔ)音類內(nèi)容服務(wù)仍是主要的路線。其后智能音箱的市場(chǎng)爭(zhēng)奪將圍繞這各家的差異化展開,屆時(shí)擁有更多用戶和場(chǎng)景資源的騰訊或許會(huì)擁有一定的優(yōu)勢(shì)。而阿里的電商優(yōu)勢(shì)仍需要面對(duì)如何轉(zhuǎn)化的問題。至于百度嘛,還得看相關(guān)開源項(xiàng)目的進(jìn)展情況。
當(dāng)然,這僅僅是個(gè)開始,人工智能的好戲還在后頭。
評(píng)論