“Hey NXP”、”哈啰恩智浦”……一聲又一聲的問候在寧靜的辦公室里格外惹人注目,原來是恩智浦公司又一嘔心瀝血的得意新作——智能語音技術(shù)(VIT)。
智能語音技術(shù)(Voice Intelligent Technology – VIT)基于最先進的深度學(xué)習和語音識別技術(shù),是一款完整的喚醒詞/語音命令解決方案。
VIT在MCUXpresso SDK中支持的恩智浦設(shè)備上免費提供,目前已經(jīng)可以支持英語,而中文、土耳其語、西班牙語等其他語言也正如火如荼地開發(fā)測試當中。
VIT功能包括
喚醒詞引擎(Wake Word Engine - WWE):它使用了訓(xùn)練所需要并且已記錄的觸發(fā)詞文件。
在訓(xùn)練階段使用數(shù)據(jù)增強技術(shù)來整合數(shù)據(jù)集中的可變性。
利用神經(jīng)網(wǎng)絡(luò)分類器來確定提取的音素序列是否與目標關(guān)鍵字對應(yīng)。
不需要音頻數(shù)據(jù)集的語音命令引擎(Voice Commands Engine - VCE)。
目標語音命令在脫機過程中被轉(zhuǎn)換為單詞符號序列,VCE在運行時確定提取的音素序列是否對應(yīng)于特定的單詞符號序列以及命令。
一個模型可以支持從大量詞匯當中所挑選的30個語音命令。
簡而言之VIT可以
通過Text2Model工具創(chuàng)建的自定義命令
自定義觸發(fā)字選項
低延遲檢測(<200ms)
VIT現(xiàn)已經(jīng)支持的平臺有
i.MX RT600系列:Cortex-M33內(nèi)核,HiFi4 DSP協(xié)處理器,評估板為MIMXRT685-EVK
i.MX RT1060系列:Cortex-M7內(nèi)核,評估板為MIMXRT1060-EVK
VIT可以利用語音服務(wù)來喚醒并控制物聯(lián)網(wǎng)裝置或家用設(shè)備。目前的VIT版本可以支持喚醒詞以及利用Text2Model工具所產(chǎn)生的語音命令,如下圖所示↓↓↓
喚醒詞模型是從關(guān)鍵詞檔案數(shù)據(jù)庫所創(chuàng)建,而語音命令模型則是由Text2Model工具所產(chǎn)生。目前SDK中所內(nèi)建的VIT函式庫可以偵測 “Hey NXP” 關(guān)鍵詞以及12個在VIT_Voice_Commands.h當中所預(yù)設(shè)的語音命令。
這次VIT的發(fā)布包含了以下的部分:
Lib/libVIT_PLATFORM_VERSION.a :平臺可以選HIFI4或Cortex-M7
Lib/VIT.h :描述VIT公用的API庫
Lib/VIT_Model.h :VIT模型檔案包含了喚醒詞和語音命令的描述
VIT_Voice_Commands.h :列舉VIT函式庫所支持的語音命令
Lib/Inc :涵蓋VIT公用接口定義的文件夾
ExApp/VIT_ExApp.c :VIT范例
VIT提供豐富API以供使用者操作:
VIT_SetModel:儲存VIT模塊的地址,并確認此模塊是否能被VIT函式庫所支持
VIT_GetMemoryTable:通知軟件應(yīng)用程序VIT函式所需要的內(nèi)存。共定義四種不同的內(nèi)存區(qū)塊,F(xiàn)ast data / Slow data / fast coefficient /Temporary or scratch
VIT_GetInstanceHandle:設(shè)置并初始化VIT,所有的內(nèi)存都被映像到子模塊所需的緩沖區(qū)
VIT_SetControlParameters:設(shè)置或修改VIT的控制參數(shù)
VIT_Process:分析音頻以辨識是喚醒詞或語音命令
VIT_GetVoiceCommandFound:VIT讀取命令編號與名稱
VIT_GetModelInfo:輔助API,用來取得VIT模塊的訊息
VIT_ResetInstance:輔助API,用來重置VIT模塊
VIT_GetControlParameters:輔助API,用來取得VIT的控制參數(shù)
VIT_GetStatusParameters:輔助API,用來取得VIT的狀態(tài)參數(shù)
以下為簡單的API調(diào)用流程↓↓↓
原文標題:免費提供!VIT智能語音技術(shù):恩智浦深度學(xué)習應(yīng)用又一得意之作!
文章出處:【微信公眾號:NXP客棧】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
恩智浦
+關(guān)注
關(guān)注
14文章
5945瀏覽量
112895 -
智能語音
+關(guān)注
關(guān)注
11文章
797瀏覽量
49371 -
深度學(xué)習
+關(guān)注
關(guān)注
73文章
5554瀏覽量
122461
原文標題:免費提供!VIT智能語音技術(shù):恩智浦深度學(xué)習應(yīng)用又一得意之作!
文章出處:【微信號:NXP客棧,微信公眾號:NXP客棧】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
「2025恩智浦創(chuàng)新技術(shù)峰會」飛凌嵌入式亮相上海首站

啟揚智能受邀參加2025恩智浦技術(shù)峰會

米爾誠邀您參加2025恩智浦NXP峰會

恩智浦智能家電創(chuàng)新方案一文看盡 恩智浦智能家電技術(shù)日給你答案

恩智浦宣布收購NPU廠商Kinara
恩智浦開啟中國戰(zhàn)略新篇章
恩智浦半導(dǎo)體6.25億美元收購TTTech Auto
恩智浦創(chuàng)新解決方推動智能物流轉(zhuǎn)型
2.425億美元!恩智浦收購汽車技術(shù)公司
米爾NXP i.MX 93核心板亮相2024恩智浦工業(yè)和物聯(lián)網(wǎng)技術(shù)峰會

啟揚智能受邀參加2024恩智浦技術(shù)峰會

評論