隨著人工智能和物聯(lián)網(wǎng)技術(shù)的發(fā)展,AI技術(shù)紛紛進(jìn)行著商業(yè)化落地并快速升級。AI語音作為人機交互的主要方式之一備受關(guān)注,預(yù)計2019年中國智能語音市場規(guī)模將進(jìn)一步增長,達(dá)到200億元。
7月19日,由深圳灣主辦的 WARE 2019第Ⅱ季 新硬件AI技術(shù)與應(yīng)用峰會在深圳舉行,該峰會匯聚了AI語音行業(yè)的各位大咖,共話AI語音的前沿技術(shù)、落地應(yīng)用及未來演變趨勢。
現(xiàn)場,思必馳CMO龍夢竹以”無微不至,智能小家電的AI攻勢“為題進(jìn)行了分享。
圖:思必馳CMO龍夢竹
她表示,消費市場靠智能音箱打響了第一槍,目前全行業(yè)全品類也在逐漸+AI,硬件、服務(wù)、交互體驗均在升級,去中心化趨勢明顯。
思必馳作為全鏈路語音技術(shù)方案的提供商,面對日漸發(fā)展的藍(lán)海市場,感受到了技術(shù)需求的明顯變化。例如,算法和算力作為原動力,推動著AI滾滾前行,5G時代的到來給予了人工智能更強大的計算空間,但是對于臺燈、插座、耳機等以極簡化的命令式交互為主的終端來講,更輕快的能效體驗成為需求。
一直以來,超高度的定制化是IOT類產(chǎn)品企業(yè)的強需求,就此思必馳做深做透,結(jié)合個性化定制的需求,推出DUI開放平臺,用戶在語音技術(shù)、應(yīng)用場景、對話邏輯、技能知識等方面均可自行定制,增強產(chǎn)品的個性化特征。
在這一過程中,對于智能小家電、智能穿戴類企業(yè)而言,除定制需求外,在特定場景下的功能、功耗、能效、響應(yīng)速度等方面均有不同需求。龍夢竹表示,通過實際對接過程中反哺技術(shù)的更新,我們發(fā)現(xiàn)了一些“深藏不露”的技術(shù)熱點。
全雙工,進(jìn)一步推進(jìn)人機對話的演變。
從單輪對話到多輪對話,全雙工技術(shù)進(jìn)一步推進(jìn)人機對話的演變,使其具備實時智能響應(yīng)、智能打斷、智能糾錯、多輪交互等能力,源源不斷的語音上行流和源源不斷的下行流,支持機器聽+說同時進(jìn)行,具備智能決策的能力,能夠判斷噪音、指令、響應(yīng)時間、響應(yīng)信號等,并可通過語義分析判斷語氣詞、無效詞、可忽略的停頓等,具備一次喚醒、多次交互的能力。
龍夢竹表示,全雙工語音技術(shù)的成熟應(yīng)用讓機器智能對話變得更流暢。但是,全雙工尚未成熟到通用階段,但在部分應(yīng)用場景中已初見成效,例如在智能客服場景,以及命令式交互為主的智能設(shè)備,比如臺燈、耳機、空調(diào)等,比如“你好小馳,空調(diào)開到,嗯,20度,不不不,25度吧。”。
分布式麥克風(fēng)陣列方案的需求浮出水面。
當(dāng)前,麥克風(fēng)陣列技術(shù)在智能音箱市場中的應(yīng)用已十分普遍,遠(yuǎn)場交互、聲源定位、算法降噪等技術(shù)均優(yōu)化了產(chǎn)品體驗,例如,思必馳雙麥、線性/環(huán)形4麥、線性/環(huán)形6麥等多款軟硬一體化方案的市場應(yīng)用已十分成熟。
但是,隨著多品類智能終端產(chǎn)品在用戶生活中涌現(xiàn),“一呼百應(yīng)”的情況常常發(fā)生,此時,對分布式麥克風(fēng)陣列解決方案的需求便浮出水面。
分布式麥克風(fēng)陣列可讓多個非結(jié)構(gòu)排列的無規(guī)則麥克風(fēng)組成陣列系統(tǒng),提供就近喚醒功能,相對于規(guī)則化的麥陣,功耗更低。同時,借助聲紋識別技術(shù),判斷說話人身份,避免設(shè)備長時間處于工作狀態(tài),達(dá)到低功耗目的。
全屋智能,多設(shè)備聯(lián)動喚醒機制十分必要。
例如,正面喚醒可以通過近距離交互方式,面對面地喚醒設(shè)備以避免多設(shè)備誤喚醒;就近喚醒則利用聲波到達(dá)設(shè)備的時間差,對同一喚醒詞的多款設(shè)備進(jìn)行空間計算,利用二級喚醒機制來喚醒距離用戶最近的設(shè)備;語義選擇會基于one-shot云+端混合識別技術(shù),實現(xiàn)本地喚醒詞和云端識別語義一體化,基于用戶語義分析用戶意圖,以喚醒相應(yīng)設(shè)備;多模態(tài)交互技術(shù)帶來了多模態(tài)直視喚醒,模擬人與人眼神交互的特點,喚醒用戶需要交互的設(shè)備。
這些深藏不露的技術(shù)熱點,讓語音交互在IOT中的應(yīng)用更加流暢自然。
同時,面對智能小家電、智能穿戴產(chǎn)品對低功耗的需求,思必馳推出低功耗算法方案,能夠讓設(shè)備持續(xù)工作、隨叫隨到,讓更多的小設(shè)備快速+AI。
思必馳低功耗算法方案將根據(jù)硬件結(jié)構(gòu)評審和聲學(xué)評估結(jié)果,結(jié)合產(chǎn)品應(yīng)用場景,提供相應(yīng)的單項/組合項算法方案,主要可分為一級低功耗喚醒,二級喚醒驗證,三級聲紋驗證。
尤其是一級低功耗喚醒,根據(jù)設(shè)備的基礎(chǔ)情況,我們還會提供更適合的算法方案,例如,針對臺燈、插座、低端的兒童玩具等小型、單一功能設(shè)備,且僅存在完全的近場喚醒需求類的產(chǎn)品,小模型語音喚醒方案即可滿足需求。但,對于耳機、手機、白電類等具備相對遠(yuǎn)場需求的產(chǎn)品,雙麥遠(yuǎn)場喚醒方案則更為合適。
該低功耗算法方案同樣具備超高的定制能力,例如喚醒詞定制,根據(jù)產(chǎn)品的目標(biāo)人群年齡特征、地域特征的口音定制,根據(jù)產(chǎn)品應(yīng)用的車載、商場、騎行等場景的噪聲環(huán)境定制,根據(jù)芯片選型、硬件設(shè)計等進(jìn)行靈活組合與定制。
“算法+芯片”的深度融合,帶來了整體性能的升級。
思必馳攜手子公司深聰智能打造了低功耗AI語音芯片TH1520,通過軟硬件協(xié)同設(shè)計、優(yōu)化整合型專用芯片,算法+芯片深度融合的嵌入式系統(tǒng),取代通用芯片+通用算法的解決方案,打造可編程、定制化專用型 AI 深度學(xué)習(xí)架構(gòu),取代目前第三方通用型架構(gòu)。目前,該芯片正式進(jìn)入產(chǎn)品對接測試階段。
TH1520在處理遠(yuǎn)場以及復(fù)雜聲場下的各項體驗指標(biāo)處于業(yè)界領(lǐng)先,支持離線識別,可全離線應(yīng)用,而且功耗極低,待機狀態(tài)功耗毫瓦級,全速工作功耗不大于百毫瓦,可用電池供電,使得便攜和移動場景成為可能,片內(nèi)存儲亦可大幅節(jié)省成本和總體功耗。同時,算法+芯片的方案可進(jìn)行快速移植與部署,將產(chǎn)品推向市場。
目前該方案可應(yīng)用于智能耳機、智能手機、智能門鎖、智能臺燈等多款產(chǎn)品。思必馳也將不斷優(yōu)化技術(shù)方案,為更多IOT產(chǎn)品帶來優(yōu)質(zhì)體驗。
越是體積小巧的設(shè)備,對功耗性能、集成工藝的要求越高。思必馳解決方案軟硬兼施,應(yīng)對智能小家電的AI攻勢。
-
人工智能
+關(guān)注
關(guān)注
1804文章
48754瀏覽量
246726 -
智能語音
+關(guān)注
關(guān)注
11文章
797瀏覽量
49393
發(fā)布評論請先 登錄
思必馳AI辦公本亮相京東直播間
思必馳技術(shù)創(chuàng)新加速AI產(chǎn)業(yè)化落地
思必馳助力吉利領(lǐng)克900打造語音助手Lynkye
蘇州市領(lǐng)導(dǎo)蒞臨思必馳調(diào)研
思必馳出席語言計算技術(shù)創(chuàng)新專題研討會
柳州市領(lǐng)導(dǎo)蒞臨思必馳調(diào)研考察
思必馳天琴語音助手8.0深度融合DeepSeek
思必馳助力上汽通用五菱與DeepSeek完成深度融合
帶來全新辦公體驗!思必馳發(fā)布AI辦公本Turbo
思必馳發(fā)布AI辦公本Turbo,搭載專業(yè)級跨模態(tài)會議大模型
思必馳AI辦公本:首搭AI筆記,柔彩護(hù)眼類紙屏

評論