女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

借助深度學習算法實現5秒內克隆你的聲音

Android編程精選 ? 來源:開源前線整理 ? 作者:開源前線整理 ? 2021-09-29 11:45 ? 次閱讀

大家應該都知道聲音克隆技術,通俗的來說就是借助深度學習算法,可以完全模擬某個人的聲音,而且由機器合成的語音連情緒都能夠完美表達出來,基本可以以假亂真,只要不見面,你根本就察覺不出來向你發出聲音的知識一個機器。

語音克隆最大的創新之一是減少創建語音所需的原始數據量。過去,該系統需要數十甚至數百小時的音頻。但是,今天猿妹要和大家分享的這個工具5秒鐘就可以克隆成功,這個工具名叫——MockingBird。

MockingBird已經登上Github熱榜,收獲3.5K的Star,累計分支 303(Github地址:https://github.com/babysor/MockingBird)

MockingBird具有如下特性:

支持普通話并使用多種中文數據集進行測試

適用于 pytorch,已在 1.9.0 版本(最新于 2021 年 8 月)中測試,GPU Tesla T4 和 GTX 2060

支持 Windows + Linux

僅使用新訓練的合成器(synthesizer)就有良好效果,復用預訓練的編碼器/聲碼器

MockingBird如何使用

MockingBird的安裝要求如下:

首先,MockingBird需要Python 3.7 或更高版本

安裝 PyTorch

安裝 ffmpeg。

運行pip install -r requirements.txt 來安裝剩余的必要包。

安裝 webrtcvad 用 pip install webrtcvad-wheels。

接著,你需要使用數據集訓練合成器:

下載 數據集并解壓:確保您可以訪問 train 文件夾中的所有音頻文件(如.wav)

使用音頻和梅爾頻譜圖進行預處理:python synthesizer_preprocess_audio.py 《datasets_root》 可以傳入參數 --dataset {dataset} 支持 adatatang_200zh, magicdata, aishell3

預處理嵌入:python synthesizer_preprocess_embeds.py 《datasets_root》/SV2TTS/synthesizer

訓練合成器:python synthesizer_train.py mandarin 《datasets_root》/SV2TTS/synthesizer

當你在訓練文件夾 synthesizer/saved_models/ 中看到注意線顯示和損失滿足您的需要時,請轉到下一步。

使用預先訓練好的合成器,如果沒有設備或者不想慢慢調試,可以使用網友貢獻的模型。

訓練聲碼器

預處理數據: python vocoder_preprocess.py 《datasets_root》

訓練聲碼器: python vocoder_train.py mandarin 《datasets_root》

啟動工具箱

然后你可以嘗試使用工具箱:python demo_toolbox.py -d 《datasets_root》

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 開源
    +關注

    關注

    3

    文章

    3580

    瀏覽量

    43435
  • 克隆
    +關注

    關注

    0

    文章

    22

    瀏覽量

    7889
  • 深度學習
    +關注

    關注

    73

    文章

    5554

    瀏覽量

    122446

原文標題:5秒內克隆你的聲音,并生成任何內容,這個工具細思極恐...還特么的開源~

文章出處:【微信號:AndroidPush,微信公眾號:Android編程精選】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    SDK如何控制DLP4500在一秒內投影60張圖片?

    如何利用SDK進行二次開發,實現的功能為,控制DLP4500在一秒內投影60張圖片,相機(灰點)同步拍攝。請問可以提供一下參考程序代碼嗎?
    發表于 02-25 07:58

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法實現智能系統的核心。隨著數據量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度
    的頭像 發表于 11-15 09:19 ?1055次閱讀

    NPU在深度學習中的應用

    設計的硬件加速器,它在深度學習中的應用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對深度學習算法優化的處理器,它與傳統的CPU和G
    的頭像 發表于 11-14 15:17 ?1662次閱讀

    AI大模型與深度學習的關系

    人類的學習過程,實現對復雜數據的學習和識別。AI大模型則是指模型的參數數量巨大,需要龐大的計算資源來進行訓練和推理。深度學習
    的頭像 發表于 10-23 15:25 ?2644次閱讀

    用TPA3112設計的一個音頻功放電路,上電1-3后就沒有聲音輸出了,怎么解決?

    用TPA3112設計的一個音頻功放電路 輸入采用差分的,后來把1個輸入接地,變成了單端的了 問題很奇怪 接信號發生器,上電后,1-3秒內有音頻輸出,能夠聽到聲音 然后就沒有聲音了 FAULT輸出低 折騰了很久,望高手指點一二
    發表于 10-12 07:17

    FPGA做深度學習能走多遠?

    。FPGA的優勢就是可編程可配置,邏輯資源多,功耗低,而且賽靈思等都在極力推廣。不知道用FPGA做深度學習未來會怎樣發展,能走多遠,怎么看。 A:FPGA 在深度
    發表于 09-27 20:53

    深度識別算法包括哪些內容

    :CNN是深度學習中處理圖像和視頻等具有網格結構數據的主要算法。它通過卷積層、池化層和全連接層等組件,實現對圖像特征的自動提取和識別。 應用領域 :CNN在圖像識別、目標檢測、視頻分
    的頭像 發表于 09-10 15:28 ?709次閱讀

    基于大數據與深度學習的穿戴式運動心率算法

    性能的關鍵手段。然而,在復雜多變的運動環境中,準確測量心率數據對于傳統算法而言具有較大的技術瓶頂。本文將探討如何運用大數據和深度學習技術來開發創新的穿戴式運動心率算
    的頭像 發表于 09-10 08:03 ?530次閱讀
    基于大數據與<b class='flag-5'>深度</b><b class='flag-5'>學習</b>的穿戴式運動心率<b class='flag-5'>算法</b>

    深度學習算法在嵌入式平臺上的部署

    隨著人工智能技術的飛速發展,深度學習算法在各個領域的應用日益廣泛。然而,將深度學習算法部署到資源
    的頭像 發表于 07-15 10:03 ?2695次閱讀

    深度學習算法在集成電路測試中的應用

    隨著半導體技術的快速發展,集成電路(IC)的復雜性和集成度不斷提高,對測試技術的要求也日益增加。深度學習算法作為一種強大的數據處理和模式識別工具,在集成電路測試領域展現出了巨大的應用潛力。本文將從
    的頭像 發表于 07-15 09:48 ?1673次閱讀

    利用Matlab函數實現深度學習算法

    在Matlab中實現深度學習算法是一個復雜但強大的過程,可以應用于各種領域,如圖像識別、自然語言處理、時間序列預測等。這里,我將概述一個基本的流程,包括環境設置、數據準備、模型設計、訓
    的頭像 發表于 07-14 14:21 ?3390次閱讀

    深度學習中的無監督學習方法綜述

    應用中往往難以實現。因此,無監督學習深度學習中扮演著越來越重要的角色。本文旨在綜述深度學習中的
    的頭像 發表于 07-09 10:50 ?1507次閱讀

    深度學習的基本原理與核心算法

    處理、語音識別等領域取得了革命性的突破。本文將詳細闡述深度學習的原理、核心算法以及實現方式,并通過一個具體的代碼實例進行說明。
    的頭像 發表于 07-04 11:44 ?3443次閱讀

    深度學習模型訓練過程詳解

    深度學習模型訓練是一個復雜且關鍵的過程,它涉及大量的數據、計算資源和精心設計的算法。訓練一個深度學習模型,本質上是通過優化
    的頭像 發表于 07-01 16:13 ?2355次閱讀

    基于深度學習的鳥類聲音識別系統

    具體的軟硬件實現點擊http://mcu-ai.com/MCU-AI技術網頁_MCU-AI 鳥叫聲識別在鳥類保護中具有重要意義。通過適當的聲音分類,研究可以自動預測該地區的生活質量。如今,深度
    發表于 05-30 20:30