女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Alexa耳語模式——AI技術更顯人性化

人工智能 ? 2018-10-09 15:20 ? 次閱讀

上周,亞馬遜在美國西雅圖舉行的發布會上一口氣推出了十余款Alexa設備,大部分設備主要由Alexa語音平臺驅動。其中部分設備將增添“耳語模式”功能,使Alexa設備用耳語來回應用戶的低聲說話。日前,亞馬遜Alexa語音系統小組的一位專家Zeynab Raeesy在其博文中揭秘了這一功能的AI基礎。

Raeesy在博文中介紹:“如果你在一個有小孩睡覺的房間,當有人走進來時,你會馬上低聲說話,提醒進來的人你希望房間內能保持安靜,而進來的人意識到這一點之后,很可能也會壓低聲音講話。”

Raeesy指出,Alexa的耳語模式令人難以理解的地方在于它是清音的,也就是說,它不涉及聲帶振動,往往比普通的語音在低頻段具有更少的能量。她與小組的同事研究了兩種能區分正常語音和耳語音的神經網絡

兩種神經網絡主要在結構上有所區別,一個是MLP(多層感知器),另一個是能進行時間遞歸的LSTM(長短期記憶)網絡,這兩者用來做訓練的數據是一樣的,這些數據包括(1)對數濾波器組能量,或者是用來記錄不同頻率范圍信號能量的語音信號表示;(2)能區別耳語音與正常語音之間信號差異的一組特征。

在測試中,他們發現LSTM的表現結果比MLP更好,具備許多優勢。Raeesy解釋道,Alexa語音識別引擎的其他組件完全依賴對數濾波器組能量,并給不同的組件提供相同的輸入數據,進而使整個系統更加緊湊。

Alexa耳語模式的開發并非一帆風順,至少在最初階段是這樣的。由于Alexa是通過短時間的沉默(一種被稱為“結束指向”的技術)來識別指令的結束或者進行回復,LSTM往往在話語即將結束時降低置信度。為解決這個問題,研究人員將LSTM的輸出校準成整個話語的平均值,最終,降低最后1.25秒的語音數據成為維持“耳語模式”性能的關鍵。

美式英語的耳語模式功能將在今年11月份推出,對耳語模式具體工作原理的介紹將以論文的形式在12月份的IEEE語音技術研討會上發表。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    34274

    瀏覽量

    275455
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    AI在可穿戴領域狂飆,混合式AI模式加速落地

    并不陌生,它帶來了更加個性的推薦和更加人性化的交互方式。 ? 在可穿戴設備上,蘋果、三星、360、索尼、XREAL等做智能手表、XR設備的硬件廠商都將生成式AI用到了自己的產品上。在產業鏈上游,涉及處理器、傳感器的芯片廠商在生
    的頭像 發表于 08-02 01:09 ?7002次閱讀
     <b class='flag-5'>AI</b>在可穿戴領域狂飆,混合式<b class='flag-5'>AI</b><b class='flag-5'>模式</b>加速落地

    成本狂降90%!國產芯片+開源模型如何改寫AI玩具規則

    成本實現更人性化的體驗。這種技術迭代不僅重塑了玩具的定義,更悄然重構著人與機器的關系圖譜。 ? 輕量級模型的出現,本質上是將云端大模型的智慧濃縮至終端設備的過程。以DeepSeek-R1為代表的技術路徑,通過知識蒸餾將千億參數模
    的頭像 發表于 05-29 00:52 ?2887次閱讀

    【「零基礎開發AI Agent」閱讀體驗】+ 入門篇學習

    10.AI Agent開發模式走向了零代碼可視模式(需要我們程序員對此有著觀念上的轉變),但是掌握編程技術,有助于
    發表于 05-02 09:26

    移遠通信智能模組全面接入多模態AI大模型,重塑智能交互新體驗

    全系智能模組產品已全面接入火山引擎豆包VLM(視覺語言)多模態AI大模型。這一突破性進展表明,搭載移遠任意智能模組的終端設備,均可無縫融合多模態AI大模型的強大功能,為用戶帶來更智能、便捷、人性化的產品體驗。 ? ? ? 一鍵接
    發表于 03-21 14:12 ?230次閱讀
    移遠通信智能模組全面接入多模態<b class='flag-5'>AI</b>大模型,重塑智能交互新體驗

    AI技術與PLC編程融合

    如何將AI技術融入PLC編程軟件
    發表于 02-14 15:55

    企業AI算力租賃模式的好處

    構建和維護一個高效、可擴展的AI算力基礎設施,不僅需要巨額的初期投資,還涉及復雜的運維管理和持續的技術升級。而AI算力租賃模式為企業提供了一種靈活、高效且成本可控的解決方案。下面,
    的頭像 發表于 12-24 10:49 ?1137次閱讀

    雷諾下一代車載語音助手Reno將引入生成式AI技術

    為客戶提供更加直觀和有趣的駕駛體驗。多年來,雷諾與賽輪思一直保持緊密合作,致力于提升Reno的人性化語音交互能力。
    的頭像 發表于 11-01 16:39 ?1598次閱讀

    亞馬遜基于人工智能的Alexa發布計劃延期至明年

    11月1日外媒報道稱,亞馬遜已將基于人工智能技術全新打造的正版Alexa發布計劃延期至明年。   亞馬遜最初于去年9月公開了新版Alexa的規劃,意在通過集成AI大模型,顯著增強
    的頭像 發表于 11-01 15:19 ?924次閱讀

    智能照明管理系統,打造人性化照明方案

    基本概念 智能照明管理系統是利用物聯網、有線/無線通訊、大數據以及云計算等技術組成的智慧樓宇照明管控系統,將傳統人工按時開關的模式,升級為能夠遠程控制、故障示警、自動調節及節能管理的燈控方案,為
    的頭像 發表于 10-22 10:55 ?999次閱讀
    智能照明管理系統,打造<b class='flag-5'>人性化</b>照明方案

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    領域的研究人員的工作模式相融合,也是一個亟待解決的問題。然而,這些挑戰也孕育著新的機遇。隨著技術的不斷進步和應用場景的拓展,AI在生命科學領域的應用將更加廣泛和深入,為科學家們提供更多的研究工具和方法
    發表于 10-14 09:21

    AI for Science:人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得

    人工智能在科學研究中的核心技術,包括機器學習、深度學習、神經網絡等。這些技術構成了AI for Science的基石,使得AI能夠處理和分析復雜的數據集,從而發現隱藏在數據中的
    發表于 10-14 09:16

    NV080D-S8 高品質otp語音芯片:讓漱口水售貨機更智能和人性化

    體驗與人性化服務。這款芯片憑借其卓越的音質輸出與靈活的編程能力,讓每一次與售貨機的交互都變得生動有趣。當顧客走近漱口水售貨機時,該芯片能夠即時感知并觸發預設的歡迎
    的頭像 發表于 10-12 08:02 ?466次閱讀
    NV080D-S8 高品質otp語音芯片:讓漱口水售貨機更智能和<b class='flag-5'>人性化</b>

    智慧醫療:讓醫療更智慧、更高效、更人性化

    一、智慧醫療簡介 智慧醫療是指運用人工智能、大數據、云計算、物聯網等技術,將醫療機構內外的醫療資源和信息進行整合和共享,實現醫療服務的智能管理和優化。通過智能的設備、系統和算法,智慧醫療能夠實現
    的頭像 發表于 06-25 11:20 ?2353次閱讀

    業界標桿,用戶首選:三星AI電視引領視聽體驗與智慧生活新紀元

    能夠提供極致的視聽體驗,更通過智能算法深度理解用戶需求,并與家居設備無縫連接,實現個性內容推薦和人性化智慧交互。三星AI電視讓用戶在享受視聽盛宴的同時,也能感受到科技帶來的便利與舒適,為大眾的娛樂生活帶來更多可能。
    的頭像 發表于 06-17 11:03 ?490次閱讀

    請問ESP-VA-SDK中怎么獲取alexa技能響應返回的內容?

    目前在基于 ESP32-Vaquita-DSPG 開發板調研 alexa 控制相關的開發流程,目前需求是希望可以在 開發板 上獲取通過 alexa 語音控制,返回的響應內容。 目前翻閱了大量資料文章,好像沒有找到相關的內容,是否有人有相關開發經驗,能指點一下。
    發表于 06-13 07:13