女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

語音控制不是魔術,而是設計

efwedfd ? 來源:efwedfd ? 作者:efwedfd ? 2022-07-14 16:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

由于硬件和軟件的進化突破,語音用戶界面或各種尺寸和價格點的支持 VUI 的產(chǎn)品現(xiàn)在都可以推向市場。與直到今天定義語音控制體驗的“對著麥克風說話并等待”模型不同,新系統(tǒng)現(xiàn)在可以以最終用戶謹慎甚至不可見的方式嵌入到產(chǎn)品中,并具有即時響應時間,而不是“ t 體驗云延遲。

在評估智能揚聲器和云的語音控制替代方案時,產(chǎn)品開發(fā)人員面臨著新的機遇和挑戰(zhàn)。開發(fā)人員必須考慮尺寸和位置,因為高度微型化的設備被嵌入到家具和電器中。將語音應用程序與邊緣機器學習相結合對于讓產(chǎn)品隨著時間的推移變得更加智能是必要的。同時,設備也越來越依賴電池供電,需要開發(fā)人員進行工程設計以實現(xiàn)最佳能源管理。最后,開發(fā)人員必須考慮用戶對功能的期望。對于消費者來說,精心設計的語音控制感覺無處不在,能夠聽到角落和穿墻的聲音。所有這些以及更多內(nèi)容匯集了在構建支持 VUI 的產(chǎn)品時必須考慮的幾個設計元素。

語音控制 2.0 更自由的方面之一是可以自由地說出語音命令,而無需附近的智能揚聲器。集成在智能家居設備中的語音可以使整個家庭成為一個可聽區(qū)域,在識別喚醒詞或其他可定義的聲音時隨時可用。專門的硬件和軟件用于產(chǎn)生準確的遠場音頻捕獲。

設計技巧

為了在遠場環(huán)境中有效地捕捉聲音,一些設計技術開始發(fā)揮作用,包括:端口方向:聲學端口是可以在沒有物理障礙的情況下接受音頻信號的地方。端口的位置(頂部或底部)由單個設備的外形尺寸決定。為了簡化設計,聲學端口通常位于麥克風附近,如下所示。但是,端口孔應與揚聲器和其他聲學噪聲源(例如電機放大器)足夠遠,以最大限度地減少麥克風輸入處的不需要的信號。

pYYBAGLOlHGAf4-SAADGbhu2oQE285.png

pYYBAGLOlHGAf4-SAADGbhu2oQE285.png

圖 1. 頂部和底部加載聲學端口配置的橫截面(來源:Knowles)

麥克風陣列和波束成形:使用多個麥克風稱為“陣列”。在任何給定時刻,麥克風陣列都會同時聽到來自各個方向的聲音。除了口頭命令外,他們還會聽到家中的其他聲音和動作。通過一種稱為波束成形的技術,可以對麥克風陣列進行編程,以選擇性地捕獲來自一個方向的聲音,同時拒絕來自其他方向的聲音。波束成形算法的最終結果是選擇性地調(diào)諧出來自所需方向的信號以外的信號。波束成形是數(shù)字信號處理鏈中的第一步。

數(shù)字信號處理 (DSP) 算法:DSP 是任何語音控制系統(tǒng)的基石。這就是想要的音頻信息的意義——捕捉它、聚焦它、凈化它、放大它——這樣音素就可以發(fā)出文字、命令和噪音,而不會破壞這個過程。DSP 幾乎用于語音交互的所有階段,從音頻捕獲和語音增強到語音處理。

poYBAGLOlHeABH1RAAD6ke5lWrg712.png

poYBAGLOlHeABH1RAAD6ke5lWrg712.png

圖 2. 遠場語音拾取(來源:Jerry Lu)

以便利為設計理念

除了針對功能進行設計之外,支持 VUI 的設備還需要針對便利性和可用性進行設計。喚醒詞的兩個主要設計考慮圍繞能源管理和處理能力。由于 VUI 必須始終處于“偵聽”模式以等待喚醒詞,因此電池供電的 VUI 和 VCD 必須設計用于極低的能量消耗以及立即喚醒。此外,設備在過濾掉不需要的聲音的同時區(qū)分想要的語音命令的能力需要不可忽視的處理能力,這需要準確性和即時性。包含強大音頻邊緣處理器的產(chǎn)品現(xiàn)在可以提供計算能力和低功耗、低延遲操作,從而實現(xiàn)即時用戶體驗。

即使在今天的早期階段,語音控制的爆炸式增長也充分證明了智能家居中語音控制的市場機會。智能家居的支柱任務,包括安全、能源管理、娛樂和高級安全,都通過語音控制變得更簡單、更容易訪問。語音最終可以作為整個智能家居的統(tǒng)一控制器,從房子的任何房間發(fā)出命令……如果它們的設計考慮到用戶并利用語音控制技術的重大進步。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 設計方法
    +關注

    關注

    0

    文章

    12

    瀏覽量

    9176
  • 語音控制
    +關注

    關注

    5

    文章

    497

    瀏覽量

    28793
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    語音控制模塊工作原理

    語音控制芯片或者說模塊的應用前景越來越廣泛,無論是設計方案還是廠家生產(chǎn)的產(chǎn)品在越來越多越來越頻繁的使用語音控制芯片。當然行業(yè)內(nèi)更多的是稱呼為語音
    的頭像 發(fā)表于 06-17 11:49 ?241次閱讀
    <b class='flag-5'>語音</b><b class='flag-5'>控制</b>模塊工作原理

    你失去工作不是因為AI,而是因為使用AI的人

    當算法能精準預測消費者需求時,當AI生成的文案比人類更懂傳播心理學時,當自動化系統(tǒng)開始取代基礎決策崗位時,真正的危機已悄然降臨—— 不是AI在搶奪你的工作,而是那些比你更早掌握AI、更懂得如何駕馭
    的頭像 發(fā)表于 05-13 12:05 ?228次閱讀
    你失去工作<b class='flag-5'>不是</b>因為AI,<b class='flag-5'>而是</b>因為使用AI的人

    為什么dlp4710evm投射出來的條紋不是顯示的導入的圖片,而是每幅圖片都會產(chǎn)生漸變?

    我使用 internal patterns的方式投射圖片,我的投影儀參數(shù)如下圖所示, 為什么投射出來的條紋不是顯示的導入的圖片,而是每幅圖片都會產(chǎn)生漸變。
    發(fā)表于 02-26 06:35

    TTS語音播報控制器能做什么?

    TTS(Text-to-Speech)語音播報控制器,作為一種能夠?qū)⑽谋拘畔⑥D(zhuǎn)換為語音輸出的技術設備,在現(xiàn)代社會的各個領域中展現(xiàn)出了廣泛的應用前景。TTS技術的出現(xiàn),豐富人機交互的方式,提高信息傳播
    的頭像 發(fā)表于 02-20 18:18 ?680次閱讀

    網(wǎng)絡語音控制器的原理與應用

    隨著科技的飛速發(fā)展,網(wǎng)絡語音控制器作為一種新興的技術產(chǎn)品,已經(jīng)在各個領域展現(xiàn)出了其巨大的應用潛力和價值。網(wǎng)絡語音控制器是一種人機系統(tǒng)中以語言驅(qū)動的
    的頭像 發(fā)表于 02-20 18:16 ?475次閱讀

    網(wǎng)絡語音控制器是什么設備

    網(wǎng)絡語音控制器,作為一種能夠通過語音識別技術接收并執(zhí)行用戶語音指令的智能設備,結合計算機、人工智能、物聯(lián)網(wǎng)、網(wǎng)絡通信、語音處理等技術,使用戶
    的頭像 發(fā)表于 02-19 17:42 ?493次閱讀

    在DLP2021-Q1參考設計中,DMD與投影鏡頭不是平行的而是成一定的夾角,這樣的目的是什么?

    在DLP2021-Q1參考設計中,non-telecentric design 非遠心設計方案里,DMD與投影鏡頭不是平行的而是成一定的夾角,這樣的目的是什么,不會引起畸變嗎?
    發(fā)表于 02-19 08:03

    在做導聯(lián)脫落檢測時,ADS1294的輸出不是77,而是63,為什么?

    我的ECG是用ADS1294作為AFE,ECG為三導聯(lián),CH1:LARA,CH2:LL RA, CH3:LLLA, 在做導聯(lián)脫落檢測時,ADS1294的輸出不是77,而是63,為什么?
    發(fā)表于 02-13 08:13

    空調(diào)語音控制方案NRK3501語音識別芯片-讓智能生活觸手可及!

    NRK3501語音識別芯片支持離線語音控制空調(diào),精準識別,遠場降噪,最多支持200條離線指令,5米內(nèi)識別率92%,讓智能家居更便捷舒適。
    的頭像 發(fā)表于 01-07 11:40 ?695次閱讀
    空調(diào)<b class='flag-5'>語音</b><b class='flag-5'>控制</b>方案NRK3501<b class='flag-5'>語音</b>識別芯片-讓智能生活觸手可及!

    ADS7841發(fā)送控制字節(jié)0x97的時候,ADOUT引腳不是一直保持低電平,而是會發(fā)送0x07呢?

    為什么我在用ADS7841,發(fā)送控制字節(jié)0x97的時候,ADOUT引腳不是一直保持低電平,而是會發(fā)送0x07呢?
    發(fā)表于 12-30 06:54

    請問TMP117的出廠溫度校準不是線性校準的而是分檔校準的嗎?

    買了5個TMP117AI芯片,在高低溫箱做溫度精度實驗,發(fā)現(xiàn)TMP117測量-10度時溫度會從-11.99度跳變到-8.2度,測量零度的時候也會,我想請問TMP117的出廠溫度校準不是線性校準的而是分檔校準的嗎?
    發(fā)表于 11-29 12:07

    ADS1293空采或者拔掉心電導聯(lián)線的時候,不是直線而是雜波?

    我們的產(chǎn)品在檢驗時遇到這樣一個問題,用生物信號器給信號的時候波形正常無雜波,但是為什么空采或者拔掉心電導聯(lián)線的時候,不是直線而是雜波?
    發(fā)表于 11-29 07:35

    智能語音開關:離線控制,守護隱私的新選擇

    智能家居依賴網(wǎng)絡,智能音箱成入口。但隱私泄露成問題,離線智能產(chǎn)品應運而生。九芯電子采用NRK3502離線語音芯片,實現(xiàn)精準語音控制,守護用戶隱私,操作便捷安全。
    的頭像 發(fā)表于 11-22 13:37 ?951次閱讀
    智能<b class='flag-5'>語音</b>開關:離線<b class='flag-5'>控制</b>,守護隱私的新選擇

    基于語音識別技術的智能家居控制系統(tǒng)

    語音識別的智能控制系統(tǒng)是智能家居的重要組成部分,相比傳統(tǒng)的遙控或觸控方式,基于語音識別控制的智能家居系統(tǒng)通過人機語音交互的方式,實現(xiàn)對家居
    的頭像 發(fā)表于 11-19 17:25 ?1226次閱讀
    基于<b class='flag-5'>語音</b>識別技術的智能家居<b class='flag-5'>控制</b>系統(tǒng)

    為什么Gain=1對應的默認值不是16位二進制補碼的中間數(shù)而是最小數(shù)?

    十進制的-32768,7FFFh為十進制的32767;分別對應最大碼和最小碼,為什么Gain=1對應的默認值不是16位二進制補碼的中間數(shù)而是最小數(shù)?
    發(fā)表于 11-18 08:12