女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用NVIDIA Riva實現將語音轉錄成文本

星星科技指導員 ? 來源:NVIDIA ? 作者:About Sirisha Rella, ? 2022-03-31 17:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

每天,電信、金融和統一通信即服務( UCaaS )等行業都會產生數百萬分鐘的音頻。這些音頻會議記錄可以轉錄,以便為呼叫中心代理提供實時建議,從客戶呼叫記錄中提取見解,或在視頻會議中生成實時字幕。

Industries that commonly use AI include telco, financial services, healthcare, unified communication as a service, and retail.

圖 1 。人工智能在工業中的應用

自動語音識別使您能夠將語音轉錄成文本。生成高質量的文字記錄是一項挑戰,因為這些技能需要理解特定于行業的術語、數百到數千分鐘特定于領域的培訓音頻以及實時運行的管道。 NVIDIA Riva 語音識別是一項技術,可為跨行業的幾個常見用例提供世界級的實時準確度。

在這篇文章中,我們討論 Riva 語音識別。后續文章將討論如何定制語音識別模型,并將其作為優化技能進行部署:

Customizing Speech Recognition Models to Your Domain Using TAO Toolkit

Deploying Speech Recognition Models to Production Using Riva

Riva 語音識別

Riva 是 GPU 加速的 AI 語音 SDK ,用于實時轉錄和虛擬助理等對話 AI 應用程序。 Riva 具有以下優點:

NGC 中經過預訓練的最先進的語音模型

沒有編碼工具,例如TAO Toolkit,用于在自定義數據集上微調這些模型

用于高性能推理的優化語音識別和語音合成管道

Riva 下面的模型是基于數百到數千小時的開放和真實世界數據進行訓練的,這些數據來自電信、金融、醫療保健和 NVIDIA 超級計算機上的教育等行業。數據集樣本還來自嘈雜的環境、自發的語音對話、多種英語口音和不同的采樣率。所有這些屬性都有助于生成噪聲魯棒、高質量的轉錄。

Riva 語音識別技能在各種真實世界的用例數據集上進行評估,包括視頻會議、聯絡中心、播客和技術視頻。您可以在云中、數據中心和邊緣部署這些技能。

Riva 語音識別管道在保持準確性的同時,為新的最先進的體系結構提供支持。圖 2 顯示了在過去 3 年中,通過新的模型體系結構、訓練方法以及最新的基于 TensorRT 和 GPU 的優化,語音準確性的提高。

Riva ASR accuracy improved by 50% in 3 years.

圖 2 。 Riva ASR 精度改進

使用 Riva ,您可以在流式或批處理模式下以實時延遲快速部署和擴展到數百和數千個并發流。

關于作者

About Sirisha Rella

Sirisha Rella 是 NVIDIA 的技術產品營銷經理,專注于計算機視覺、語音和基于語言的深度學習應用。 Sirisha 獲得了密蘇里大學堪薩斯城分校的計算機科學碩士學位,是國家科學基金會大學習中心的研究生助理。

About Tanay Varshney

Tanay Varshney 是 NVIDIA 的一名深入學習的技術營銷工程師,負責廣泛的 DL 軟件產品。他擁有紐約大學計算機科學碩士學位,專注于計算機視覺、數據可視化和城市分析的橫斷面。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5315

    瀏覽量

    106504
  • 語音識別
    +關注

    關注

    39

    文章

    1782

    瀏覽量

    114275
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Air8000 TTS開源,語音合成從此“零距離”!

    文本語音)——是一種將書面文本轉換為人類可聽語音的技術,通過算法和模型模擬人類發聲,實現機器“說話”。其核心目標是生成自然、流暢且富有表現
    的頭像 發表于 07-03 16:33 ?211次閱讀
    Air8000 TTS開源,<b class='flag-5'>語音</b>合成從此“零距離”!

    怎么用labview實現語音轉文字

    請問怎么用labview實現語音轉文字
    發表于 07-01 16:27

    【CW32模塊使用】語音合成播報模塊

    。SYN6288E 通過異步串 口(UART)通訊方式,接收待合成的文本數據,實現文本語音(或 TTS 語音)的轉換。
    的頭像 發表于 03-29 17:25 ?648次閱讀
    【CW32模塊使用】<b class='flag-5'>語音</b>合成播報模塊

    把樹莓派打造成識別文本的“神器”!

    。RaspberryPi也能實現這種文本識別,而且并不困難。我們可以從靜態圖像或攝像頭的實時流中讀取文本。在本教程中,我們將探討如何使用RaspberryPi實現
    的頭像 發表于 03-25 09:30 ?433次閱讀
    把樹莓派打造成識別<b class='flag-5'>文本</b>的“神器”!

    網絡語音控制器的原理與應用

    隨著科技的飛速發展,網絡語音控制器作為一種新興的技術產品,已經在各個領域展現出了其巨大的應用潛力和價值。網絡語音控制器是一種人機系統中以語言驅動的控制器,通過語音識別系統實現用戶的
    的頭像 發表于 02-20 18:16 ?496次閱讀

    TTS語音播報模塊簡介

    在現代科技日新月異的時代,語音技術作為人工智能領域的重要分支,正以前所未有的速度改變著我們的生活方式。其中,TTS(Text To Speech,文本語音)語音播報模塊作為連接數字世
    的頭像 發表于 02-18 16:16 ?1020次閱讀

    聯發科與NVIDIA合作 為NVIDIA 個人AI超級計算機設計NVIDIA GB10超級芯片

    聯發科近日宣布與NVIDIA合作設計NVIDIA GB10 Grace Blackwell超級芯片,將應用于NVIDIA 的個人AI超級計算機NVIDIA? Project DIGIT
    的頭像 發表于 01-07 16:26 ?606次閱讀

    HarmonyOS NEXT 應用開發練習:AI智能語音播報

    一、DEMO思路 在這個HarmonyOS NEXT原生應用DEMO中,我們將使用ArkTS開發語言創建一個簡單的AI智能語音播報應用。 該應用能夠接收用戶輸入的文本,并使用TTS
    發表于 01-06 15:33

    NVIDIA推出全新生成式AI模型Fugatto

    NVIDIA 開發了一個全新的生成式 AI 模型。利用輸入的文本和音頻,該模型可以創作出包含任意的音樂、人聲和聲音組合的作品。
    的頭像 發表于 11-27 11:29 ?832次閱讀

    語音識別技術在醫療領域的應用

    語音識別技術在醫療領域的應用已經越來越廣泛,為醫療服務帶來了諸多便利和效率提升。以下是對語音識別技術在醫療領域應用的介紹: 一、語音病歷 語音識別技術可以將醫生或患者的
    的頭像 發表于 11-26 09:35 ?1224次閱讀

    語音識別與自然語言處理的關系

    了人機交互的革命,使得機器能夠更加自然地與人類溝通。 語音識別技術概述 語音識別,也稱為自動語音識別(ASR),是指將人類的語音轉換成文本
    的頭像 發表于 11-26 09:21 ?1519次閱讀

    ASR語音識別技術應用

    ASR(Automatic Speech Recognition)語音識別技術,是計算機科學與人工智能領域的重要突破,能將人類語音轉換為文本,廣泛應用于智能家居、醫療、交通等多個領域。以下是對ASR
    的頭像 發表于 11-18 15:12 ?2083次閱讀

    基于Arm Neoverse N2實現自動語音識別技術

    自動語音識別 (Automatic Speech Recognition) 技術已經深入到現代生活的方方面面,廣泛應用于從語音助手、轉錄服務,到呼叫中心分析和語音
    的頭像 發表于 11-15 11:35 ?1114次閱讀
    基于Arm Neoverse N2<b class='flag-5'>實現</b>自動<b class='flag-5'>語音</b>識別技術

    NVIDIA文本嵌入模型NV-Embed的精度基準

    NVIDIA 的最新嵌入模型 NV-Embed —— 以 69.32 的分數創下了嵌入準確率的新紀錄海量文本嵌入基準測試(MTEB)涵蓋 56 項嵌入任務。
    的頭像 發表于 08-23 16:54 ?2514次閱讀
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>文本</b>嵌入模型NV-Embed的精度基準

    LM358如何實現將50HZ的方波轉換為正弦波?

    基于單電源供電的LM358 。。如何實現將50HZ的方波轉換為正弦波。。。下面是我設計的電路圖,可是結果不行。。請指教,謝謝了。。。
    發表于 08-21 06:18