女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

百度端對端語音識別專利揭秘

汽車玩家 ? 來源: 愛集微 ? 作者: 愛集微 ? 2020-01-08 11:17 ? 次閱讀

百度公司提出的端對端神經網絡模型來進行語音識別,成功的代替了手工工程化部件的流水線操作,這讓整個語音識別技術更加便捷,而使用神經網絡來抽取輸入端的特征信息相當于人功抽取特征則更加全面。

集微網消息,近年來,語音識別技術得到了迅猛的發展,這得益于人工智能的快速發展,其中最為主要的學業界的各大神經網絡的出現,包括基礎的序列神經網絡模型RNN、LSTM和GRU。語音識別技術也已經進入到各行各業中,如工業、家電、通信汽車電子等。于是,對于語音識別技術的要求也將更加嚴格了,更傾向于走向準確化和便捷化。

以往,構建語音識別模型主要是使用HMM的序列模型,再使用手工工程化部件來實現整個流水線操作,并且對于不同的語言的語音需要重新構建模型的結果特征。對此,國內語音識別技術第一梯隊公司百度便提出了使用端對端的神經網絡模型來進行語音識別工作,該專利為“端對端語音識別”(專利號:CN107408111A)。

首先,小編在這先介紹一下神經網絡端對端的學習方式。對于語音識別來說,端到端深度學習做的是,訓練一個深度神經網絡,輸入就是一段音頻,輸出直接是聽寫文本。其中這里的端表示輸入源數據端,另外一端是神經網絡處理的結果也就是我們最終需要的目標。這種訓練學習的方式能應對多種語言的語音識別的場景構建,因為僅僅是需要改變輸入端和輸出端,深度神經網絡的結構并不需要根據語言的語音不同而改變。

專利中提出的端對端的深度學習模型的架構圖如圖1所示。該架構包括訓練以攝取語譜并生成文本的遞歸神經網絡模型。首先,使用一個或更多個卷積層對語譜進行特征提取,緊接著,使用一個或多個遞歸層(雙向GRU神經網絡)對語譜的特征進行時序建模。最后再使用全連接層將遞歸層獲取的語譜信息進行全連接作為CTC(鏈結式時間分類算法:重點解決輸入數據與給定標簽的對齊問題)的輸入,經過Softmax計算輸出各個文本標簽的概率。

圖1端對端深度學習模型架構圖

經過上述端對端深度學習模型構建后,專利中還給出了端對端深度學習模型的訓練方法,如圖2所示。

百度端對端語音識別專利揭秘

圖2 端對端深度學習模型訓練方法圖

首先需要為模型設置好,輸入端和輸出端,對于語音識別技術來說,輸入端為一時間序列頻譜幀的話語X,輸出端是與話語X具有相關聯的真實標簽Y。

構建深度神經網絡模型(包括一個或多個卷積層和一個或多個遞歸層的模型)用來預測一個或多個字符也就是我們輸出端的標簽。

根據網絡模型的輸出端的標簽的概率分布與真實標簽的誤差計算損失函數,提供損失函數推出標簽預測的誤差,再使用梯度反向傳播算法更新模型參數。從而達到網絡模型學習的目的。

百度公司提出的端對端神經網絡模型來進行語音識別,成功的代替了手工工程化部件的流水線操作,這讓整個語音識別技術更加便捷,而使用神經網絡來抽取輸入端的特征信息相當于人功抽取特征則更加全面,這讓整個語音識別技術更加準確。從這兩方面來看,端對端的神經網絡模型確實是讓語音識別技術走向了便捷化,準確化。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 百度
    +關注

    關注

    9

    文章

    2325

    瀏覽量

    91804
  • 語音識別
    +關注

    關注

    39

    文章

    1773

    瀏覽量

    113894
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    百度在AI領域的最新進展

    近日,我們在武漢舉辦了Create2025百度AI開發者大會,與全球各地的5000多名開發者,分享了百度在AI領域的新進展。
    的頭像 發表于 04-30 10:14 ?355次閱讀

    上汽大眾與百度地圖達成戰略合作

    近日,上海國際車展期間,百度地圖與上汽大眾舉行科技X生態戰略合作伙伴簽約儀式,雙方將基于百度領先的車道級地圖產品,為上汽大眾千萬車主打造更安全、高效的智能化出行體驗。上汽大眾總經理陶海龍、百度副總裁尚國斌等出席簽約儀式。
    的頭像 發表于 04-29 17:28 ?390次閱讀

    百度AI榮獲2025愛迪生獎金獎和銀獎

    剛剛,百度AI在「2025愛迪生獎」中獲得一金一銀兩項大獎。
    的頭像 發表于 04-08 15:43 ?300次閱讀

    百度搜索,能否將DeepSeek變成“內功”?

    實測之后,會發現百度搜索和DeepSeek稱得上“王炸組合”
    的頭像 發表于 02-21 10:04 ?2217次閱讀
    <b class='flag-5'>百度</b>搜索,能否將DeepSeek變成“內功”?

    百度文心大模型4月1日起全面免費開放

    近日,百度公司正式對外宣布,其備受關注的文心大模型在經過一系列迭代與優化后,將于4月1日零時全面免費開放給所有用戶。此次免費開放的覆蓋范圍廣泛,包括所有PC及App用戶,讓用戶能夠盡情體驗文心系
    的頭像 發表于 02-14 09:19 ?426次閱讀

    百度科啟動“繁星計劃”

    近日,百度科攜手中國科協、中國科學院大學共同舉辦了史記2024·科學科100詞發布會,并在此盛會上正式啟動了“繁星計劃”。這一計劃的核心目標在于利用前沿的AI技術,包括數字人、智能體等,以及
    的頭像 發表于 12-31 10:26 ?568次閱讀

    ElfBoard開源項目|百度智能云平臺的人臉識別項目

    百度智能云平臺的人臉識別項目,旨在利用其強大的人臉識別服務實現自動人臉識別。選擇百度智能云的原因是其高效的API接口和穩定的服務質量,能夠幫
    的頭像 發表于 12-24 10:54 ?1131次閱讀
    ElfBoard開源項目|<b class='flag-5'>百度</b>智能云平臺的人臉<b class='flag-5'>識別</b>項目

    百度正式回應進軍短劇領域

    近日,百度在線網絡技術(北京)有限公司在知識產權領域有了新的動作,據天眼查信息顯示,該公司已申請注冊“百度短劇”商標,涵蓋網站服務、科學儀器、教育娛樂等多個國際分類,目前這些商標均處于等待實質審查
    的頭像 發表于 12-17 14:19 ?505次閱讀

    階躍星辰發布國內首個千億參數語音大模型

    近日,階躍星辰在官方公眾號上宣布了一項重大突破——推出Step-1o千億參數語音大模型。該模型被譽為“國內首個千億參數
    的頭像 發表于 12-17 13:43 ?662次閱讀

    百度文心大模型日均調用量超15億

    近日,百度在上海世博中心舉辦了主題為“應用來了”的百度世界2024大會。會上,百度董事長李彥宏分享了關于大模型行業的最新動態和百度文心大模型的顯著進展。
    的頭像 發表于 11-12 15:28 ?608次閱讀

    百度將發布AI智能眼鏡

    近日,有知情人士透露,百度旗下的人工智能品牌小計劃在即將舉行的百度世界大會上推出一款全新的AI智能眼鏡。這款眼鏡將內置先進的人工智能助手,并配備攝像頭,為用戶提供前所未有的智能體驗。
    的頭像 發表于 11-11 14:50 ?837次閱讀

    百度舸AI計算平臺4.0震撼發布

    在2024年百度云智大會的璀璨舞臺上,百度智能云重磅推出了舸AI異構計算平臺的全新力作——4.0版本。此次升級,標志著百度在AI基礎設施領域邁出了堅實的一步,致力于為行業提供更為強大
    的頭像 發表于 09-26 14:46 ?768次閱讀

    循環神經網絡在語音識別中的應用

    (Recurrent Neural Networks, RNN)在語音識別領域的應用日益廣泛,特別是在語音
    的頭像 發表于 07-08 11:09 ?1004次閱讀

    http讀取百度返回的json數據時丟失數據怎么處理?

    我在使用百度ai開放平臺的語音識別功能,讀取返回的數據時,使用esp_http_client_read(client, http_data, 1024);讀到的數據里沒有json的數據,還是http
    發表于 06-24 07:00

    百度申請文小言商標

    近日,百度在線網絡技術(北京)有限公司在知識產權領域有了新動作。據天眼查知識產權信息顯示,百度已申請多枚“文小言”商標,這些商標將涵蓋廣告銷售、網站服務、健身器材、機械設備等多個領域。
    的頭像 發表于 06-19 09:20 ?673次閱讀