污福利导航,色就色综合激情区,少妇射射网

每天，電信、金融和統一通信即服務（ UCaaS ）等行業都會產生數百萬分鐘的音頻。這些音頻會議記錄可以轉錄，以便為呼叫中心代理提供實時建議，從客戶呼叫記錄中提取見解，或在視頻會議中生成實時字幕。

Industries that commonly use AI include telco, financial services, healthcare, unified communication as a service, and retail.

圖 1 。人工智能在工業中的應用

自動語音識別使您能夠將語音轉錄成文本。生成高質量的文字記錄是一項挑戰，因為這些技能需要理解特定于行業的術語、數百到數千分鐘特定于領域的培訓音頻以及實時運行的管道。 NVIDIA Riva 語音識別是一項技術，可為跨行業的幾個常見用例提供世界級的實時準確度。

在這篇文章中，我們討論 Riva 語音識別。后續文章將討論如何定制語音識別模型，并將其作為優化技能進行部署：

Customizing Speech Recognition Models to Your Domain Using TAO Toolkit

Deploying Speech Recognition Models to Production Using Riva

Riva 語音識別

Riva 是 GPU 加速的 AI 語音 SDK ，用于實時轉錄和虛擬助理等對話 AI 應用程序。 Riva 具有以下優點：

NGC 中經過預訓練的最先進的語音模型

沒有編碼工具，例如TAO Toolkit，用于在自定義數據集上微調這些模型

用于高性能推理的優化語音識別和語音合成管道

Riva 下面的模型是基于數百到數千小時的開放和真實世界數據進行訓練的，這些數據來自電信、金融、醫療保健和 NVIDIA 超級計算機上的教育等行業。數據集樣本還來自嘈雜的環境、自發的語音對話、多種英語口音和不同的采樣率。所有這些屬性都有助于生成噪聲魯棒、高質量的轉錄。

Riva 語音識別技能在各種真實世界的用例數據集上進行評估，包括視頻會議、聯絡中心、播客和技術視頻。您可以在云中、數據中心和邊緣部署這些技能。

Riva 語音識別管道在保持準確性的同時，為新的最先進的體系結構提供支持。圖 2 顯示了在過去 3 年中，通過新的模型體系結構、訓練方法以及最新的基于 TensorRT 和 GPU 的優化，語音準確性的提高。

Riva ASR accuracy improved by 50% in 3 years.

圖 2 。 Riva ASR 精度改進

使用 Riva ，您可以在流式或批處理模式下以實時延遲快速部署和擴展到數百和數千個并發流。

關于作者

About Sirisha Rella

Sirisha Rella 是 NVIDIA 的技術產品營銷經理，專注于計算機視覺、語音和基于語言的深度學習應用。 Sirisha 獲得了密蘇里大學堪薩斯城分校的計算機科學碩士學位，是國家科學基金會大學習中心的研究生助理。

About Tanay Varshney

Tanay Varshney 是 NVIDIA 的一名深入學習的技術營銷工程師，負責廣泛的 DL 軟件產品。他擁有紐約大學計算機科學碩士學位，專注于計算機視覺、數據可視化和城市分析的橫斷面。

審核編輯：郭婷

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b