語音控制芯片或者說模塊的應(yīng)用前景越來越廣泛,無論是設(shè)計方案還是廠家生產(chǎn)的產(chǎn)品在越來越多越來越頻繁的使用語音控制芯片。當然行業(yè)內(nèi)更多的是稱呼為語音識別芯片,因為語音控制的前提是要先識別用戶的聲音,才能夠發(fā)出正確的指令。
語音芯片控制模塊是實現(xiàn) “語音指令 - 設(shè)備響應(yīng)” 的核心組件,其工作原理可拆解為信號采集、處理、識別及指令執(zhí)行的完整鏈路,下面將以WTK69000為例給大家分享一下整個流程的工作原理。
一、語音信號采集與預(yù)處理
①.信號采集:通過內(nèi)置麥克風(fēng)或外接麥克風(fēng)收集用戶的語音信號。芯片以 16kHz 采樣率對語音信號進行采樣,將其轉(zhuǎn)化為數(shù)字信號。
②.預(yù)處理:包括預(yù)加重、分幀、加窗等操作。預(yù)加重用于提升高頻信號的能量,分幀是將連續(xù)的語音信號分成若干個短幀,加窗則是對每幀信號進行加權(quán)處理,以減少頻譜泄漏。此外,芯片還采用了神經(jīng)網(wǎng)絡(luò)降噪系統(tǒng)、AI 識別降噪等技術(shù),抑制穩(wěn)態(tài)噪聲和動態(tài)噪聲,提高信號質(zhì)量。
③語音特征提取經(jīng)過預(yù)處理的語音信號,會被提取特征向量。WTK6900 系列芯片通常提取包含 12 維 MFCC(梅爾頻率倒譜系數(shù))+ 能量 + 差分參數(shù)的特征向量,這些特征能夠較好地表征語音的特性,為后續(xù)的語音識別提供基礎(chǔ)。
二、語音識別
采用混合識別架構(gòu):應(yīng)用改進型 DTW(動態(tài)時間規(guī)整)算法,計算測試模板與參考模板之間的距離,衡量語音的相似度。同時,該系列部分芯片采用深度神經(jīng)網(wǎng)絡(luò)算法進行語音識別,具有識別精準、誤判率低等優(yōu)勢。
決策機制:將最近鄰得分與閾值 θ1 進行比較,若得分大于閾值,則觸發(fā)對應(yīng)指令;否則進入拒識狀態(tài)。通過這種方式來確定用戶所說的語音是否與預(yù)設(shè)的指令詞匹配,從而實現(xiàn)語音識別功能。
三、指令輸出與設(shè)備控制
WTK6900 系列芯片識別出語音指令后,通過 UART 等通信接口將命令推送到設(shè)備原有的上位機,上位機接收到指令后,控制相關(guān)設(shè)備執(zhí)行相應(yīng)的動作,如智能玩具中的舵機轉(zhuǎn)動、電機旋轉(zhuǎn),投影儀的功能切換,智能晾衣架的升降等。
此外,WTK6900 系列芯片還支持多模態(tài)學(xué)習(xí)方式,用戶可通過物理按鍵、串口指令、語音命令或?qū)S?APP 啟動學(xué)習(xí)流程,實現(xiàn)命令詞的自學(xué)習(xí)功能,可存儲 100 多個自定義語音模板,還支持方言自適應(yīng)學(xué)習(xí),能靈活適應(yīng)不同用戶的語音指令需求。
四、云端交互
云端大模型(如 GPT、BERT)接收 WTK6900 上傳的語音數(shù)據(jù)或特征向量,進行多輪對話、意圖識別、知識推理等復(fù)雜處理。例如:用戶說 “幫我查一下明天深圳的天氣”,WTK6900 本地識別為 “天氣查詢” 指令碼,云端大模型解析出 “深圳”“明天” 等語義要素,調(diào)用天氣 API 獲取結(jié)果。
方言或模糊指令(如 “搞凍 D”)通過云端大數(shù)據(jù)訓(xùn)練的模型進行精準識別。
通信機制:WTK支持UART串口/SPI接口/藍牙BLE/wifi模組擴展。
場景案例:
①本地處理:WTK6900H-A 芯片通過 UART 接收用戶語音指令 “調(diào)至 26 度”,本地識別為 “溫度調(diào)節(jié)” 指令碼(0x05),并通過 I2C 接口直接控制空調(diào)模塊。
②云端擴展:若用戶指令為 “根據(jù)空氣質(zhì)量自動調(diào)節(jié)”,WTK6900 將 “自動模式” 指令碼上傳至云端,云端大模型結(jié)合實時空氣質(zhì)量數(shù)據(jù)生成最優(yōu)溫度參數(shù),返回后驅(qū)動空調(diào)執(zhí)行。
以上就是“語音控制模塊工作原理”的全部內(nèi)容,希望可以幫助到大家。
審核編輯 黃宇
-
芯片
+關(guān)注
關(guān)注
459文章
52276瀏覽量
437348 -
模塊
+關(guān)注
關(guān)注
7文章
2785瀏覽量
49804 -
語音控制
+關(guān)注
關(guān)注
5文章
496瀏覽量
28675
發(fā)布評論請先 登錄
網(wǎng)絡(luò)語音控制器的原理與應(yīng)用
網(wǎng)絡(luò)語音控制器是什么設(shè)備
電機控制器的工作原理和作用
PLC無線通信模塊的工作原理 PLC無線通信模塊網(wǎng)絡(luò)配置
離線語音控制模塊,讓生活更懂你!

UWB模塊工作原理 UWB模塊應(yīng)用案例
語音識別機器人的工作原理
淺談NRK3502語音芯片IC的工作原理

評論