女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何讓神經聲碼器高效地用于序列到序列聲學模型

ss ? 來源:IT創事記 ? 作者:IT創事記 ? 2021-01-07 16:01 ? 次閱讀

往往在放下手機之后你才會意識到,電話那頭的客服其實是個機器人;或者準確地說,是“一位”智能客服。

沒錯,今天越來越多的工作正在被交給人工智能技術去完成,文本轉語音(TTS,Text To Speech)就是其中非常成熟的一部分。它的發展,決定了今天我們聽到的許多“人聲”,是如此地逼真,以至于和真人發聲無異。

除了我們接觸最多的智能客服,智能家居中的語音助手、可以服務聽障人士的無障礙播報,甚至是新聞播報和有聲朗讀等服務,事實上都基于TTS這項技術。它是人機對話的一部分——簡單地說,就是讓機器說人話。

它被稱為同時運用語言學和心理學的杰出之作。不過在今天,當我們稱贊它的杰出時,更多的是因為它在在線語音生成中表現出的高效。

要提升語音合成效率當然不是一件容易的事。這里的關鍵是如何讓神經聲碼器高效地用于序列到序列聲學模型,來提高TTS質量。

科學家已經開發出了很多這樣的神經網絡聲碼器,例如WaveNet、Parallel WaveNet、WaveRNN、LPCNet 和 Multiband WaveRNN等,它們各有千秋。

WaveNet聲碼器可以生成高保真音頻,但在計算上它那巨大的復雜性,限制了它在實時服務中的部署;

LPCNet聲碼器利用WaveRNN架構中語音信號處理的線性預測特性,可在單個處理器內核上生成超實時的高質量語音;但可惜,這對在線語音生成任務而言仍不夠高效。

科學家們希望TTS能夠在和人的“交流”中,達到讓人無感的順暢——不僅是語調上的熱情、親切,或冷靜;更要“毫無”延遲。

新的突破出現在騰訊。騰訊 AI Lab(人工智能實驗室)和云小微目前已經率先開發出了一款基于WaveRNN多頻帶線性預測的全新神經聲碼器FeatherWave。經過測試,這款高效高保真神經聲碼器可以幫助用戶顯著提高語音合成效率。

英特爾的工程團隊也參與到了這項開發工作中。他們把面向第三代英特爾至強可擴展處理器所做的優化進行了全面整合,并采用了英特爾深度學習加速技術(英特爾 DL Boost)中全新集成的 16 位 Brain Floating Point (bfloat16) 功能。

bfloat16是一個精簡的數據格式,與如今的32位浮點數(FP32)相比,bfloat16只通過一半的比特數且僅需對軟件做出很小程度的修改,就可達到與FP32同等水平的模型精度;與半浮點精度 (FP16) 相比,它可為深度學習工作負載提供更大的動態范圍;與此同時,它無需使用校準數據進行量化/去量化操作,因此比 INT8 更方便。這些優勢不僅讓它進一步提升了模型推理能力,還讓它能為模型訓練提供支持。

事實上,英特爾至強可擴展處理器本就是專為運行復雜的人工智能工作負載而設計的。借助英特爾深度學習加速技術,英特爾志強可擴展處理器將嵌入式 AI 性能提升至新的高度。目前,此種處理器現已支持英特爾高級矢量擴展 512 技術(英特爾AVX-512 技術)和矢量神經網絡指令 (VNNI)。

在騰訊推出的全新神經聲碼器FeatherWave 聲碼器中,就應用了這些優化技術。

FeatherWave 聲碼器框圖

利用英特爾AVX-512技術和bfloat16指令,騰訊的科學家們確保了GRU模塊和Dense運算符中粗略部分/精細部分的所有SGEMV計算都使用512位矢量進行矢量化,并采用bfloat16點積指令;對于按元素逐個加/乘等運算以及其他非線性激活,都使用最新的英特爾AVX-512 指令運行。

在最終都性能測試中,通過優化,相同質量水平(MOS4.5)的文本轉語音速度比FP32提升了高達1.54倍。

此外,騰訊還以 GAN 和 Parallel WaveNet (PWaveNet)為基礎,推出了一種改進后的模型,并基于第三代英特爾至強可擴展處理器對模型性能進行了優化,最終使性能與采用FP32相比提升了高達1.89倍,同時質量水平仍保持不變 (MOS4.4)。

騰訊在TTS領域的進展顯示出了人工智能領域的一個趨勢,那就是科學家們越來越多開始利用英特爾深度學習加速技術在CPU平臺上開展工作。

就像騰訊在針對TTS的探索中獲得了性能提升那樣,第二代和第三代英特爾至強可擴展處理器在集成了加速技術后,已經顯著提升了人工智能工作負載的性能。

在更廣泛的領域內,我們已經能夠清楚地看到這種變化——在效率表現上,由于針對常見人工智能軟件框架,如TensorFlow和PyTorch、庫和工具所做的優化,CPU平臺可以幫助保持較高的性能功耗比和性價比。

尤其是擴展性上,用戶在設計系統時可以利用如英特爾以太網700系列,和英特爾傲騰內存存儲技術,來優化網絡和內存配置。這樣一來,他們就可以在充分利用現有硬件投資的情況下,輕松擴展人工智能訓練的工作負載,獲得更高的吞吐量,甚至處理巨大的數據集。

不止于處理器平臺本身,英特爾目前在面向人工智能優化的軟件,以及市場就緒型人工智能解決方案兩個維度,都建立起了差異化的市場優勢。

例如在軟件方面,英特爾2019年2月進行的 OpenVINO/ResNet50 INT8 性能測試顯示,使用 OpenVINO或TensorFlow和英特爾深度學習加速技術時,人工智能推理性能可提高多達 3.75 倍。

今天,英特爾已經攜手解決方案提供商,構建了一系列的精選解決方案。這些方案預先進行了配置,并對工作負載進行了優化。這就包括了如基于人工智能推理的英特爾精選解決方案,以及面向在面向在Apache Spark上運行的BigDL的英特爾精選解決方案等。

這些變化和方案的出現對于那些希望能從整體業務視角,去觀察人工智能進展的機構或企業的管理層顯然也很有意義——如果只通過優化,就能在一個通用平臺上完成所有人工智能的探索和落地,那么投資的價值就能夠實現最大化。

許多企業做出了這樣的選擇,GE醫療就是其中一家。作為GE集團旗下的醫療健康業務部門,它構建了一個人工智能醫學影像部署架構。

通過采用英特爾至強可擴展處理器,和英特爾固態盤,以及多項英特爾關鍵技術——例如英特爾深度學習開發工具包,和面向深度神經網絡的英特爾數學核心函數庫等;GE醫療收獲了未曾預料到的成果:

這一解決方案最終比基礎解決方案的推理速度提升了多達14倍,且超過了GE原定推理目標5.9倍。

責任編輯:xj

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    213

    文章

    29568

    瀏覽量

    211982
  • 神經網絡
    +關注

    關注

    42

    文章

    4811

    瀏覽量

    103066
  • 智能化
    +關注

    關注

    15

    文章

    5109

    瀏覽量

    57038
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    使用BP神經網絡進行時間序列預測

    使用BP(Backpropagation)神經網絡進行時間序列預測是一種常見且有效的方法。以下是一個基于BP神經網絡進行時間序列預測的詳細步驟和考慮因素: 一、數據準備 收集數據 :
    的頭像 發表于 02-12 16:44 ?696次閱讀

    如何使用RNN進行時間序列預測

    時間序列預測在金融、氣象、銷售預測等領域有著廣泛的應用。傳統的時間序列分析方法,如ARIMA和指數平滑,雖然在某些情況下表現良好,但在處理非線性和復雜模式時可能不夠靈活。遞歸神經網絡(RNN)提供了
    的頭像 發表于 11-15 09:45 ?862次閱讀

    如何使用Python構建LSTM神經網絡模型

    numpy tensorflow 2. 準備數據 LSTM模型通常用于序列數據,比如時間序列預測或文本生成。這里我們以一個簡單的時間序列
    的頭像 發表于 11-13 10:10 ?1478次閱讀

    LSTM神經網絡在時間序列預測中的應用

    時間序列預測是數據分析中的一個重要領域,它涉及到基于歷史數據預測未來值。隨著深度學習技術的發展,長短期記憶(LSTM)神經網絡因其在處理序列數據方面的優勢而受到廣泛關注。 LSTM神經
    的頭像 發表于 11-13 09:54 ?1956次閱讀

    【「時間序列與機器學習」閱讀體驗】時間序列的信息提取

    模型效果與性能的過程。 時間序列的缺失值填充方法有:插值法;回歸填充;均值/中位數/眾數填充;可以借助 Python 的 Pandas庫,通過前向填充、后向填充、線性插值、均值/中位數/眾數填充等
    發表于 08-17 21:12

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    利用這些信息來建立時間序列模型,可見信息提取是一個關鍵的步驟。 本章第一小節直接引入了特征工程定義: 特征工程(Feature Engineering)是將數據轉換為更好地表示潛在問題的特征,從而
    發表于 08-14 18:00

    【《時間序列與機器學習》閱讀體驗】+ 了解時間序列

    收到《時間序列與機器學習》一書,彩色印刷,公式代碼清晰,非常精美。感謝作者,感謝電子發燒友提供了一個讓我學習時間序列及應用的機會! 前言第一段描述了編寫背景: 由此可知,這是一本關于時間序列進行大數
    發表于 08-11 17:55

    【「時間序列與機器學習」閱讀體驗】全書概覽與時間序列概述

    模型、指數平滑方法、Prophet,以及神經網絡,例如循環神經網絡長短期記憶網絡、Transformer、Informer 等。 ●第4章“時間序列異常檢測”:介紹時間
    發表于 08-07 23:03

    深度學習中的時間序列分類方法

    時間序列分類(Time Series Classification, TSC)是機器學習和深度學習領域的重要任務之一,廣泛應用于人體活動識別、系統監測、金融預測、醫療診斷等多個領域。隨著深度學習技術
    的頭像 發表于 07-09 15:54 ?2017次閱讀

    rnn是什么神經網絡模型

    RNN(Recurrent Neural Network,循環神經網絡)是一種具有循環結構的神經網絡模型,它能夠處理序列數據,并對序列中的元
    的頭像 發表于 07-05 09:50 ?1119次閱讀

    rnn神經網絡模型原理

    RNN(Recurrent Neural Network,循環神經網絡)是一種具有循環結構的神經網絡,它能夠處理序列數據,具有記憶功能。RNN在自然語言處理、語音識別、時間序列預測等領
    的頭像 發表于 07-04 15:40 ?1055次閱讀

    遞歸神經網絡主要應用于哪種類型數據

    處理(NLP) 自然語言處理是遞歸神經網絡最重要的應用領域之一。在NLP中,遞歸神經網絡可以用于以下任務: 1.1 語言模型(Language Modeling) 語言
    的頭像 發表于 07-04 14:58 ?1195次閱讀

    循環神經網絡有哪些基本模型

    循環神經網絡(Recurrent Neural Networks,簡稱RNN)是一種具有循環結構的神經網絡,它能夠處理序列數據,并且能夠捕捉序列數據中的時序信息。RNN的基本
    的頭像 發表于 07-04 14:43 ?823次閱讀

    循環神經網絡的基本原理是什么

    具有循環,能夠將前一個時間步的信息傳遞到下一個時間步,從而實現對序列數據的建模。本文將介紹循環神經網絡的基本原理。 RNN的基本結構 1.1 神經元模型 RNN的基本單元是神經元,每個
    的頭像 發表于 07-04 14:26 ?1122次閱讀

    名單公布!【書籍評測活動NO.35】如何用「時間序列與機器學習」解鎖未來?

    ,包括自回歸模型、移動平均模型、自回歸差分移動平均模型、指數平滑方法、Prophet,以及神經網絡,例如循環神經網絡、長短期記憶網絡、Tra
    發表于 06-25 15:00