Alexa Speech副總裁Manoj Sindhwani與我分享了他的團(tuán)隊(duì)在使兩個(gè)單詞短語(yǔ)“ Hey Samuel”與單個(gè)喚醒單詞Alexa,Amazon,Echo和Computer共存時(shí)遇到的工程難題。由于“ Alexa”具有數(shù)十億個(gè)需要培訓(xùn)的客戶(hù)呼叫對(duì)話(huà),但“ Hey Samuel”相對(duì)較少,因此需要?jiǎng)?chuàng)建一個(gè)多喚醒單詞模型,該模型可以在幾乎沒(méi)有數(shù)據(jù)的情況下進(jìn)行預(yù)測(cè)。
為此,他解釋說(shuō):“我們能夠開(kāi)發(fā)傳輸學(xué)習(xí)和數(shù)據(jù)增強(qiáng)技術(shù),以訓(xùn)練一種新的多喚醒單詞模型,該模型對(duì)所有受支持的喚醒單詞和條件都適用。我們還使用多目標(biāo)學(xué)習(xí)來(lái)減輕分別為每個(gè)喚醒詞訓(xùn)練模型的需求,并進(jìn)行多區(qū)域訓(xùn)練,以使新的多喚醒詞模型能夠接受發(fā)音中廣泛的細(xì)微差別。”
對(duì)于未來(lái)的應(yīng)用程序,Sindhwani補(bǔ)充說(shuō):“多喚醒單詞檢測(cè)的創(chuàng)新意義重大,因?yàn)樗菍?shí)現(xiàn)多種代理交互并跨設(shè)備訪(fǎng)問(wèn)不同角色的第一步。”
人工智能的這一突破使亞馬遜朝著實(shí)現(xiàn)杰夫·貝索斯(Jeff Bezos)的愿景邁進(jìn)了一步,該愿景是一個(gè)智能角色可以跨平臺(tái)交互的世界。在去年9月的亞馬遜大型硬件活動(dòng)上,語(yǔ)音互操作性倡議(VII)被引入以創(chuàng)建行業(yè)標(biāo)準(zhǔn)。
盡管蘋(píng)果,谷歌和三星尚未簽署協(xié)議,但一年后該計(jì)劃有近80家公司,包括埃森哲,宏cer,AMD,奧迪,百度,BBC,寶馬,博世,博斯,杜比,F(xiàn)acebook,Garmin,哈曼,海信,英特爾,Kakao,羅技,微軟,Orange,高通,Salesforce,Sonos,索尼,Spotify,騰訊,Verizon,大眾和雅馬哈。
-
人工智能
+關(guān)注
關(guān)注
1804文章
48677瀏覽量
246286 -
應(yīng)用程序
+關(guān)注
關(guān)注
38文章
3322瀏覽量
58698 -
訓(xùn)練模型
+關(guān)注
關(guān)注
1文章
37瀏覽量
3931
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論