智能語音是智能時代人機(jī)交互的關(guān)鍵接口,近幾年隨著各行業(yè)場景需求爆發(fā)式增長,技術(shù)突破和應(yīng)用落地不斷深入。從全球范圍來看,2022年全球智能語音產(chǎn)業(yè)規(guī)模將達(dá)351.2億美元,保持33.1%的高速增長。
根據(jù)德勤統(tǒng)計數(shù)據(jù),2022年我國智能語音市場將達(dá)341億元,同比增長13.4%。我國智能語音產(chǎn)業(yè)整體發(fā)展環(huán)境積極向好。工信部信息技術(shù)發(fā)展司副司長王威偉表示,智能語音產(chǎn)業(yè)作為新一代信息技術(shù)和人工智能產(chǎn)業(yè)的重要組成部分,必將迎來更大的發(fā)展機(jī)遇。
智能語音技術(shù),是實現(xiàn)人機(jī)語言的通信,包括語音識別技術(shù)(ASR)和語音合成技術(shù)(TTS)。智能語音技術(shù)的研究以語音識別技術(shù)為開端,可以追溯到20世紀(jì)50年代。隨著信息技術(shù)的發(fā)展,智能語音技術(shù)已經(jīng)成為人們信息獲取和溝通最便捷、最有效的手段。
從當(dāng)前的發(fā)展情況來看,語音合成技術(shù)發(fā)展最早,應(yīng)用已較為普遍,除了合成音仍偏機(jī)械之外,基本不存在太大技術(shù)問題;語音識別在2012年卷積神經(jīng)網(wǎng)絡(luò)(CNN)應(yīng)用之后,準(zhǔn)確率大幅提升,已經(jīng)在C端、B端得到廣泛應(yīng)用,但效果和體驗仍有待提高。
比如語音識別魯棒性問題顯著,語音識別整個過程包含語音信號處理、靜音切除、聲學(xué)特征提取、模式匹配等多個環(huán)節(jié)。由于語音信號的多樣性和復(fù)雜性,系統(tǒng)只能在一定限制條件下才能獲得滿意效果。在真實使用場景中,考慮到遠(yuǎn)場、方言、噪音等問題,準(zhǔn)確率就會打折。
為了解決語音識別魯棒性問題,企業(yè)從多方面進(jìn)行優(yōu)化,一是在語音增強(qiáng)、麥克風(fēng)陣列以及說話人分離等技術(shù)領(lǐng)域投入,并結(jié)合后端語義,促進(jìn)對上下文的理解,從而提升識別效果;另一方面是從產(chǎn)品設(shè)計上進(jìn)行優(yōu)化,比如通過進(jìn)一步交互,使語音識別變得更為準(zhǔn)確。
在語音識別方面,視聽融合的多模態(tài)交互技術(shù)是技術(shù)演進(jìn)的主要方向。據(jù)介紹,科大訊飛多模語音增強(qiáng)技術(shù)融合語音與視覺的多模感知,讓高噪音場景下的語音交互跨過實用門檻,率先在車載、會議、地鐵購票和醫(yī)療掛號等場景落地。此外,針對低資源語音識別難題,海天瑞聲和科大訊飛分別從語音數(shù)據(jù)和算法層面推動技術(shù)進(jìn)步。
當(dāng)前智能語音應(yīng)用場景正在迅速鋪開。據(jù)德勤統(tǒng)計數(shù)據(jù),預(yù)計到2030年,智能語音消費(fèi)級和企業(yè)級應(yīng)用市場將分別超過700億元和千億元的規(guī)模。
在汽車領(lǐng)域,智能語音已成人機(jī)交互關(guān)鍵環(huán)節(jié),并從車內(nèi)交互衍生車外交互,從單模交互走向多模交互,從被動交互發(fā)展為主動交互,為車企提供全棧技術(shù)賦能。思必馳此前表示,在中高端車型的車載設(shè)備中,具備語音交互能力的中控大屏能為車主帶來高清且流暢的智能體驗。
另外相對更平民化的傳統(tǒng)車型而言,智能網(wǎng)聯(lián)化成本高,中控大屏的智能化程度有限。針對更多車型智能化改造,思必馳推出了針對前裝市場的車載“智能收放機(jī)”軟硬一體化方案(聯(lián)網(wǎng)版、藍(lán)牙版),打造無屏版智能中控,圍繞“云+管+端+手”四個維度,分別為整車賦予智能化的改造,這將有利于擴(kuò)大智能語音在汽車領(lǐng)域的應(yīng)用。
智能語音在教育和醫(yī)療領(lǐng)域也已經(jīng)取得較大規(guī)模的應(yīng)用,比如,在教育領(lǐng)域,科大訊飛全球中文學(xué)習(xí)平臺已覆蓋全球183個國家,吸引300多萬海外中文學(xué)習(xí)愛好者使用;在醫(yī)療領(lǐng)域,2022年疫情期間,科大訊飛電話機(jī)器人助力全國31個省112個地市疫情排查,累計服務(wù)超1.1億人次;智能外呼和智醫(yī)助理可用于獨(dú)居老人、留守兒童的日常關(guān)愛和兜底保障。
除此之外,智能語音在城市和工業(yè)領(lǐng)域也有很好的應(yīng)用前景。姚建銓院士此前指出,智能語音與建設(shè)智慧城市的要求吻合,可以實現(xiàn)各種語音高效轉(zhuǎn)換和智能處理,為智慧城市進(jìn)一步建設(shè)帶來新的機(jī)遇。在工業(yè)領(lǐng)域,我國打造了包括國家智能語音創(chuàng)新中心在內(nèi)的一批語音技術(shù)創(chuàng)新國家隊, 開展工業(yè)聲學(xué)、多語種、AI語音芯片等關(guān)鍵共性技術(shù)研究工作。
可想而知,隨著智能語音關(guān)鍵技術(shù)的不斷突破,以及各企業(yè)、研究團(tuán)隊在各行業(yè)各領(lǐng)域的應(yīng)用探索,未來智能語音的將會在更多場景中實現(xiàn)規(guī)模化應(yīng)用,市場規(guī)模也將隨之增長。
審核編輯 :李倩
-
語音識別
+關(guān)注
關(guān)注
39文章
1773瀏覽量
113869 -
智能語音
+關(guān)注
關(guān)注
11文章
797瀏覽量
49363 -
智慧城市
+關(guān)注
關(guān)注
21文章
4337瀏覽量
99206
原文標(biāo)題:智能語音關(guān)鍵技術(shù)不斷突破,市場規(guī)模將超千億!
文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
淺談 IPv6 行業(yè)市場規(guī)模與增長趨勢


高盛上調(diào)人形機(jī)器人市場規(guī)模預(yù)測
全球半導(dǎo)體市場規(guī)模預(yù)測
無人叉車的市場規(guī)模怎么樣?適合使用agv的企業(yè)有哪些共同點?

2024年全球芯片市場規(guī)模將達(dá)6298億美元
2024年AI IC市場規(guī)模預(yù)計達(dá)1100億美元
最新2024年全球激光加工市場規(guī)模將增至240.2億美元
2035年Chiplet市場規(guī)模將超4110億美元
RFID電子標(biāo)簽預(yù)計在2030年全球市場規(guī)模將達(dá)到75.1億美元

SoC芯片,市場規(guī)模大漲

淺析2024-2030中國RFID市場規(guī)模及未來發(fā)展趨勢
2030年GaN功率元件市場規(guī)模將超43億美元
GaN技術(shù)引領(lǐng)功率電子產(chǎn)業(yè)新風(fēng)潮,預(yù)估2030年市場規(guī)模將突破43億美元

2030年人形機(jī)器人電子皮膚市場規(guī)模將達(dá)90.5億!

評論