一年一度的Cadence CDNLive中國用戶大會2018于8月10日在上海浦東嘉里大酒店開幕,作為Cadence的戰略級合作伙伴,聲智科技帶著全新的DSP低功耗語音交互方案出席了此次大會。
CDNLive大會是由Cadence公司舉辦的一年一度的全球巡回用戶大會。從今年4月由美國硅谷伊始,覆蓋德國、日本、***、印度、以色列等七大地區和國家。大會以“聯結、分享、啟發”為主題,行業巨頭、技術用戶、業界頂尖開發者與業界專家都將聚集于此,共同分享高階工藝芯片、復雜SoC和系統設計的技術和理念,為行業的發展提供靈感和啟發。對于科技行業來說,這個集會可謂是一年一度最大的盛典。
2017年聲智科技與Cadence建立了戰略合作關系,開始為CadenceTensilicaDSP系列產品研發設計低功耗遠場智能語音交互解決方案。本次Cadence CDNLive中國用戶大會上,聲智科技展示了基于Cadence Tensilica Fusion和HiFi DSP設計的融合遠場語音交互和遠場實時通話技術的SoundAI Voice Kit智能語音交互系統。
融合遠場語音交互和遠場實時通話技術的SoundAI Voice Kit(以下簡稱SVK)是一款為手機、智能機器人、智能電視、機頂盒、機頂盒等消費電子產品和IOT產品提供低功耗的遠場語音喚醒,語音識別,語音控制,語音搜索,遠場聲紋識別,遠場實時通話(VoIP)等功能的理想軟件解決方案。
(1)滿足低功耗需求
隨著亞馬遜Echo、谷歌Google Home,阿里天貓精靈、小米小愛同學等產品在市場上大獲成功,支持遠場語音交互的智能設備越來越普及。遠場智能語音交互勢必是未來人機交互的新趨勢。智能語音交互必然會推動消費電子品、物聯網的革命,包括如汽車、家用設備,手機以及可穿戴設備。然而,耗能過高的困擾一直是制約物聯網發展。
本次大會推出的SVK智能語音交互系統提供的遠場語音喚醒算法,具有低功耗的特點,可以保證SoC和系統成本,也可以滿足家居和移動場景的不同需求。該算法計算量少,計算復雜度低,占CPU內存小,但是語音交互的順暢度不打折。
該算法搭載了最新的Voice Activity Detection技術,可拾取環境語音以檢測和響應喚醒詞或觸發命令,通過關鍵字檢測支持低功耗實時監聽,實現低功耗遠場語音喚醒功能。而且針對可能出現的多線程同時工作場景,也可以隨時喚醒識別,不影響人機交流自然順暢的體驗,只為語音交互帶來方便,不增加重量。在手機上應用,可實現鎖屏喚醒、多任務喚醒、遠場聲紋喚醒等功能。
該遠場語音喚醒算法可實現五米之內95%以上的喚醒率,支持Duel-wake(雙名喚醒)、Free-cut(隨時打斷、隨時喚醒)、One-shot(一句連控)的功能。目前,小米、百度、阿里、騰訊、華為、聯想、獵豹移動等公司均采用聲智科技提供的遠場語音喚醒技術。
Dual-wake(雙名喚醒),即喚醒詞不再是單一的一個,設備可以擁有兩個名字,使用任意一個名字都可以將其喚醒并進行無差別的操作,這樣的設計與改進為設備后期功能擴展以及實現智能家電之間的聯動留下了空間。
Free-cut(隨時打斷、隨時喚醒)技術可以讓設備任意時刻終止當前任務,立即響應新的用戶需求,這就實現了連續喚醒執行新的命令,而無需等待上一任務完成后響應,隨叫隨應。
One-shot(一句連控),采用“喚醒詞+語音語義識別”一體化方式,實現喚醒詞與語音操控之間無縫對接,用戶叫了設備的名字后無需等待設備應答就可以直接說出命令,無需等待設備回應“誒”、“我在”等之后才能說出命令,響應速度更快,更加符合人類語音交互習慣。
(2)匹配復雜場景
隨著智能語音設備應用場景的增加,由近場語音交互過渡到遠場語音交互,場景中的噪聲種類越來越多,越來越復雜,對于語音交互的要求也越來越高。針對可能出現的極端噪聲場景,本次推出的SoundAI Voice Kit智能語音交互系統也進行了定制優化。
集成通話降噪、混響抑制、回聲抵消、噪聲抑制、波束形成、增益控制等噪聲抑制技術,針對遠場語音交互所處的復雜應用場景,定制了OpenAEC算法,可以解決弱參考信號或者無參考信號等更為復雜場景的回聲抵消(自噪聲抑制)問題,可實現更加精準的喚醒。
同時搭載了針對智能家居、辦公環境、車載等場景的抗強噪喚醒算法(AKS技術),保證在噪聲環境中,也實現精準的遠場語音喚醒。在車載環境中,針對主副駕駛的方向性降噪問題,通過麥克風陣列波束成型技術在主方向語音不失真的前提下,有效去除空調、胎噪等平穩噪聲,平穩噪聲抑制量大于30dB。
并在保護主方向語音的同時,去除環境中的語音、車載娛樂設施等非穩態噪聲的干擾。其中非穩態噪聲抑制量大于20dB,在噪音環境下可以大幅提升遠場語音喚醒和識別率。解決行車過程中,主駕駛與智能語音設備語音交互易受干擾的問題,確保準確識別主駕駛方向的指令,抑制其他方向噪聲。
針對家庭場景下,易出現的大電視噪聲、音響噪聲等非穩態噪聲,聲智推出了
家庭非穩態噪聲抑制技術、垂直抗強噪識別技術,專門匹配相應場景,帶來更出色的遠場交互體驗,無懼環境,想說就說,聲隨心動,保證遠場語音交互的完美體驗。
(3)快速開發集成
聲智科技推出的融合遠場語音交互和遠場實時通話技術的SoundAI Voice Kit是眾多audio/voice/speech軟硬件合作伙伴生態系統的重要支撐,通過提供包括喚醒、降噪、ASR、NLP在內的領先的語音交互技術,幫助用戶快速打造自己的硬件產品,更加易于集成,易于開發,易于擴展,更安全,更自由。
一直以來,DSP芯片具有大規模集成性、穩定性好、精度高、可嵌入性、接口和集成方便等特點,而且相較于通用芯片(AP芯片),價格更具優勢。隨著智能電子消費品、IOT產品越來越多的涌現,目前市場還沒有專門的語音芯片應用到智能語音設備中,還沒有經過市場驗證。
目前更多的還是采用通用芯片(AP芯片/平板芯片等)+Codec芯片/DSP芯片等組合的方式。DSP芯片通過對數字信號進行處理,包括回聲消除、噪聲抑制、語音降噪/增強等,使語音便于后端的語音識別,再由通用芯片進行處理傳輸到云端提供語音處理的計算力支持。
人工智能的大爆發給消費電子產品和IOT設備的變革塑造了更多的可能性。此次出席Cadence大會,聲智科技帶來的全新的融合遠場語音交互和遠場實時通話技術的SoundAI Voice Kit智能語音交互系統,將更好的賦能客戶的智能硬件產品快速的落地,擁有更精準的、更符合人性習慣的遠場語音交互能力與智能語音交互體驗。
-
語音識別
+關注
關注
39文章
1773瀏覽量
113881 -
智能機器人
+關注
關注
17文章
895瀏覽量
84218 -
語音交互
+關注
關注
3文章
304瀏覽量
28478
發布評論請先 登錄
藍牙語音遙控器 低功耗芯片選型HS6621CxC/OM6621
德賽西威與面壁智能發布端側大模型語音交互方案
虹科邀您相約MATLAB EXPO 2025中國用戶大會
智能語音交互方案在客服領域的應用
Credo發布Lark系列——為低功耗800G光學DSP樹立新標桿
智能語音芯片WT588F02B-8S:低功耗設計賦能多元化場景應用

芯資訊|WT3000T8語音合成芯片:高性價比語音交互解決方案

基于WTV380-8S語音芯片的智能電子鎖語音交互系統設計方案介紹

基于WTVxxx語音芯片的智能清潔機器人語音交互系統設計方案介紹

評論