女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于語(yǔ)音識(shí)別在人工智能時(shí)代作用和分析介紹

英特爾物聯(lián)網(wǎng) ? 來(lái)源:djl ? 2019-09-11 10:39 ? 次閱讀

智能時(shí)代,語(yǔ)音識(shí)別

神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)

語(yǔ)音識(shí)別技術(shù)方便于長(zhǎng)輩們?nèi)谌牒A繑?shù)據(jù)的互聯(lián)網(wǎng)時(shí)代,成為長(zhǎng)輩們與外界交流的一大利器。不過(guò),千萬(wàn)不要認(rèn)為在未來(lái)人工智能時(shí)代中的語(yǔ)音識(shí)別僅僅是單純運(yùn)用到手機(jī)聊天中的識(shí)別錄入文字。語(yǔ)音識(shí)別技術(shù)隨著深度學(xué)習(xí)及高性能計(jì)算的不斷發(fā)展,正逐漸從實(shí)驗(yàn)室邁向工業(yè)領(lǐng)域。

語(yǔ)音識(shí)別簡(jiǎn)史

1952年,美國(guó)AT&T貝爾實(shí)驗(yàn)室開(kāi)發(fā)出了第一個(gè)基于電子計(jì)算機(jī)的語(yǔ)音識(shí)別系統(tǒng)Audrey,其可以識(shí)別10個(gè)英文數(shù)字,準(zhǔn)確率為98%;進(jìn)入60年代,語(yǔ)音識(shí)別領(lǐng)域的兩大突破是線(xiàn)性預(yù)測(cè)編碼,以及動(dòng)態(tài)時(shí)間規(guī)整技術(shù);

在60年代后期,隱馬爾可夫模型被Leonard E. Baum等人提出,HMM的提出是語(yǔ)音識(shí)別歷史上的一個(gè)重大突破,使當(dāng)時(shí)語(yǔ)音識(shí)別的錯(cuò)誤率大大降低;李開(kāi)復(fù)等人則在1988年第一次實(shí)現(xiàn)了基于HMM的大詞匯量語(yǔ)音識(shí)別系統(tǒng)Sphinx。

另一方面,早在上世紀(jì)80年代,人工神經(jīng)網(wǎng)絡(luò)已經(jīng)被引入語(yǔ)音識(shí)別。起初人工神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)多為簡(jiǎn)單的多層感知機(jī),但受限于當(dāng)時(shí)的計(jì)算能力以及語(yǔ)音數(shù)據(jù)的稀少,人工神經(jīng)網(wǎng)絡(luò)并沒(méi)有在識(shí)別率上帶來(lái)很大的提升。

近年來(lái),隨著計(jì)算能力的提升和語(yǔ)音數(shù)據(jù)的增加,神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用于語(yǔ)音識(shí)別任務(wù)中。深度神經(jīng)網(wǎng)絡(luò)技術(shù)的出現(xiàn),也進(jìn)一步提高了大規(guī)模連續(xù)語(yǔ)音識(shí)別的性能,目前已經(jīng)成為學(xué)術(shù)界和工業(yè)界研究的熱點(diǎn)內(nèi)容之一。

語(yǔ)音識(shí)別的技術(shù)支持

目前,在語(yǔ)音識(shí)別領(lǐng)域廣泛采用的神經(jīng)網(wǎng)絡(luò)有時(shí)延神經(jīng)網(wǎng)絡(luò)、深度神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)以及基于長(zhǎng)短期記憶的RNN等。

通常將這些深度神經(jīng)網(wǎng)絡(luò)模型與HMM模型結(jié)合構(gòu)建完整的聲學(xué)模型,并結(jié)合語(yǔ)言模型等提升語(yǔ)音識(shí)別性能。

在語(yǔ)言模型方面,雖然傳統(tǒng)的N元模型一直是主流技術(shù),但基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型從2012年開(kāi)始被較為廣泛的研究,如RNN-LM、LSTM-LM等。

鑒于基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型的計(jì)算量較大,一般先利用N元模型初始化,然后再用基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型重打分,即神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型并不直接用于解碼,而是在基線(xiàn)系統(tǒng)解碼結(jié)果的基礎(chǔ)上進(jìn)行得分重估。

同時(shí),RNN-CTC的出現(xiàn)使得語(yǔ)音識(shí)別擺脫了傳統(tǒng)方法中聲學(xué)模型、語(yǔ)言模型、解碼器等模塊化的束縛,通過(guò)采用對(duì)輸入輸出序列直接建模的方法,只需訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò)模型即可進(jìn)行識(shí)別,因此被稱(chēng)為端到端語(yǔ)音識(shí)別。

端到端的模型可以解決傳統(tǒng)方法中各個(gè)模型訓(xùn)練目標(biāo)不一致的問(wèn)題。另外,由于實(shí)際中可獲取的文本數(shù)據(jù)比語(yǔ)音數(shù)據(jù)多得多,所以往往還會(huì)用文本數(shù)據(jù)訓(xùn)練一個(gè)更好的語(yǔ)言模型,與CTC神經(jīng)網(wǎng)絡(luò)結(jié)合使用。

深度神經(jīng)網(wǎng)絡(luò)用于人工智能應(yīng)用的問(wèn)題在于其實(shí)時(shí)率等性能指標(biāo)還需有待提高,但是端到端語(yǔ)音識(shí)別開(kāi)辟了人工智能的一個(gè)新方向,而且訓(xùn)練的過(guò)程相對(duì)簡(jiǎn)單,因此人工智能方向上的端到端識(shí)別將會(huì)是未來(lái)的技術(shù)趨勢(shì)之一。此外人工智能再進(jìn)一步改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)、改進(jìn)訓(xùn)練方法,逐步使人工智能性能達(dá)到工業(yè)水平和要求,進(jìn)入商用階段指日可待。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【「嵌入式系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)」閱讀體驗(yàn)】+ 基于語(yǔ)音識(shí)別智能杯墊

    項(xiàng)目二維碼下圖 該作品通過(guò)采集飲水?dāng)?shù)據(jù),多種交互方式,數(shù)據(jù)分析處理,提醒用戶(hù)定期飲水,達(dá)到保持健康的作用。 主要功能是語(yǔ)音識(shí)別。 ASR-PRO語(yǔ)音
    發(fā)表于 01-02 18:15

    標(biāo)貝智能語(yǔ)音識(shí)別在智能會(huì)議場(chǎng)景中的落地案例

    標(biāo)貝科技專(zhuān)注智能語(yǔ)音交互領(lǐng)域多年,在語(yǔ)音識(shí)別語(yǔ)音合成領(lǐng)域有著多項(xiàng)大型企業(yè)合作案例,標(biāo)貝與多個(gè)智能
    的頭像 發(fā)表于 12-20 10:31 ?663次閱讀
    標(biāo)貝<b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別在</b><b class='flag-5'>智能</b>會(huì)議場(chǎng)景中的落地案例

    語(yǔ)音識(shí)別在智能家居中的應(yīng)用

    隨著科技的飛速發(fā)展,智能家居逐漸成為人們生活中不可或缺的一部分。智能家居系統(tǒng)通過(guò)物聯(lián)網(wǎng)技術(shù)將家中的各種設(shè)備連接起來(lái),實(shí)現(xiàn)遠(yuǎn)程控制和自動(dòng)化管理。在眾多的控制方式中,語(yǔ)音識(shí)別技術(shù)因其便捷性
    的頭像 發(fā)表于 11-26 09:31 ?1177次閱讀

    ASR語(yǔ)音識(shí)別技術(shù)應(yīng)用

    ASR(Automatic Speech Recognition)語(yǔ)音識(shí)別技術(shù),是計(jì)算機(jī)科學(xué)與人工智能領(lǐng)域的重要突破,能將人類(lèi)語(yǔ)音轉(zhuǎn)換為文本,廣泛應(yīng)用于
    的頭像 發(fā)表于 11-18 15:12 ?1843次閱讀

    嵌入式和人工智能究竟是什么關(guān)系?

    人工智能的結(jié)合,無(wú)疑是科技發(fā)展中的一場(chǎng)革命。在人工智能硬件加速中,嵌入式系統(tǒng)以其獨(dú)特的優(yōu)勢(shì)和重要性,發(fā)揮著不可或缺的作用。通過(guò)深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等算法,嵌入式系統(tǒng)能夠高效地處理大量數(shù)據(jù),從而實(shí)現(xiàn)
    發(fā)表于 11-14 16:39

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    探討了人工智能如何通過(guò)技術(shù)創(chuàng)新推動(dòng)能源科學(xué)的進(jìn)步,為未來(lái)的可持續(xù)發(fā)展提供了強(qiáng)大的支持。 首先,書(shū)中通過(guò)深入淺出的語(yǔ)言,介紹人工智能在能源領(lǐng)域的基本概念和技術(shù)原理。這使得我對(duì)人工智能
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    很幸運(yùn)社區(qū)給我一個(gè)閱讀此書(shū)的機(jī)會(huì),感謝平臺(tái)。 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,為我們揭示了人工智能技術(shù)在生命科學(xué)領(lǐng)域中的廣泛應(yīng)用和深遠(yuǎn)影響。在
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    人工智能:科學(xué)研究的加速器 第一章清晰地闡述了人工智能作為科學(xué)研究工具的強(qiáng)大功能。通過(guò)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等先進(jìn)技術(shù),AI能夠處理和分析海量數(shù)據(jù),發(fā)現(xiàn)傳統(tǒng)方法難以捕捉的模式和規(guī)律。這不僅極大地提高了數(shù)據(jù)處理
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    RISC-V在人工智能圖像處理領(lǐng)域的應(yīng)用前景十分廣闊,這主要得益于其開(kāi)源性、靈活性和低功耗等特點(diǎn)。以下是對(duì)RISC-V在人工智能圖像處理應(yīng)用前景的詳細(xì)分析: 一、RISC-V的基本特點(diǎn) RISC-V
    發(fā)表于 09-28 11:00

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析 想問(wèn)下哪些比較容易學(xué) 不過(guò)好像都是要學(xué)的
    發(fā)表于 09-26 15:24

    名單公布!【書(shū)籍評(píng)測(cè)活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

    活的世界? 編輯推薦 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》聚焦于人工智能與材料科學(xué)、生命科學(xué)、電子科學(xué)、能源科學(xué)、環(huán)境科學(xué)五大領(lǐng)域的交叉融合,通過(guò)深入淺出的語(yǔ)言和諸多實(shí)際應(yīng)用案例,介紹
    發(fā)表于 09-09 13:54

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個(gè)方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過(guò)程加速:FPGA可以用來(lái)加速深度學(xué)習(xí)的訓(xùn)練和推理過(guò)程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    圖像識(shí)別屬于人工智能

    屬于。圖像識(shí)別人工智能(Artificial Intelligence, AI)領(lǐng)域的一個(gè)重要分支。 一、圖像識(shí)別概述 1.1 定義 圖像識(shí)別是指利用計(jì)算機(jī)技術(shù)對(duì)圖像中的內(nèi)容進(jìn)行
    的頭像 發(fā)表于 07-16 10:44 ?1841次閱讀

    人工智能神經(jīng)網(wǎng)絡(luò)芯片的介紹

    人工智能神經(jīng)網(wǎng)絡(luò)芯片是一類(lèi)專(zhuān)門(mén)為深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)算法設(shè)計(jì)的處理器。它們具有高性能、低功耗、可擴(kuò)展等特點(diǎn),廣泛應(yīng)用于圖像識(shí)別語(yǔ)音識(shí)別、自然語(yǔ)言處理等領(lǐng)域。以下是
    的頭像 發(fā)表于 07-04 09:33 ?1279次閱讀

    人工智能語(yǔ)音識(shí)別技術(shù)詳解

    隨著科技的飛速發(fā)展,人工智能(AI)技術(shù)已經(jīng)滲透到我們生活的方方面面,其中語(yǔ)音識(shí)別技術(shù)作為AI領(lǐng)域的重要分支,更是以其獨(dú)特的魅力和廣泛的應(yīng)用前景,引起了社會(huì)各界的廣泛關(guān)注。本文將詳細(xì)介紹
    的頭像 發(fā)表于 07-01 11:39 ?2364次閱讀