女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

云知聲AGI技術實力在2023年再次獲得國際頂會認可

云知聲 ? 來源:云知聲 ? 2023-09-07 10:27 ? 次閱讀

近日,國際性語音及語言科學技術領域盛會INTERSPEECH 2023在愛爾蘭都柏林舉行。云知聲聯(lián)合上海師范大學發(fā)表的4篇論文被大會成功收錄,成果覆蓋語言增強、語音識別、防攻擊聲紋等研究方向。這是繼ACM MM 2023后,云知聲AGI技術實力在2023年再次獲得國際頂會認可。

INTERSPEECH在國際上享有極高盛譽并具有廣泛的學術影響力,是由國際語音通訊協(xié)會(ISCA)創(chuàng)辦的旗艦級國際會議,是國際性語音及語言科學技術領域的頂級會議之一,對參會企業(yè)和單位有著嚴苛的準入門檻,歷屆INTERSPEECH會議都倍受全球各地語音研究領域人士的廣泛關注。

此次獲得國際頂會認可,既是云知聲與上海師范大學通力合作、持續(xù)探索智能語音技術的結果,也離不開云知聲AGI技術架構的有力支撐。

云知聲:通過通用人工智能(AGI)創(chuàng)建互聯(lián)直覺的世界

云知聲AI技術體系及U+X戰(zhàn)略

作為中國AGI技術產業(yè)化的先驅之一,云知聲于2016年打造Atlas人工智能基礎設施,并構建公司云知大腦(UniBrain)技術中臺,以山海(UniGPT)通用認知大模型為核心,包括多模態(tài)感知與生成、知識圖譜、物聯(lián)平臺等智能組件,并通過領域增強能力,為云知聲智慧物聯(lián)、智慧醫(yī)療等業(yè)務提供高效的產品化支撐,推動“U(云知大腦)+X(應用場景)”戰(zhàn)略落實,踐行公司“通過通用人工智能(AGI)創(chuàng)建互聯(lián)直覺的世界”的使命。

作為云知大腦(UniBrain)的重要組件,智能語音技術包含語音識別、聲紋識別、語音合成等,目前已廣泛應用于家居、車載、客服等領域。以車載場景為例,在云知聲智能語音技術的加持下,可實現(xiàn)多音區(qū)識別、連續(xù)語音交互、個性化語音播報、所見即可說、模糊指令匹配等強大語音能力,為用戶帶來更智能更自然的交互體驗。隨著云知聲智能語音技術的不斷發(fā)展,其在各個場景的落地應用也將進一步提速。此次論文收錄,充分印證了云知聲在智能語音領域的技術創(chuàng)新實力,同時,也將進一步夯實其AGI技術底座,加速千行百業(yè)的智慧化升級。

接下來,云知聲將繼續(xù)踐行“U+X”戰(zhàn)略,攜手上海師范大學等高校機構,共同加強AI基礎理論和關鍵技術的研發(fā),不斷拓展AGI應用場景,為智慧物聯(lián)與智慧醫(yī)療兩大領域提供更廣泛、更深入的人工智能解決方案,致力實現(xiàn)以人工智能賦能千行百業(yè)的美好愿景。

以下為入選論文概覽:

研究方向:語音增強

目前主流時頻語音增強系統(tǒng)以復頻譜作為輸入,存在著訓練工具不支持復數(shù),復數(shù)建模方式不易訓練,以及基于掩蔽的方法理論上無法完全恢復出干凈語音的問題。為解決以上問題,本文提出了一種無需掩蔽的語音增強系統(tǒng)。該系統(tǒng)利用短時離散余弦變換(STDCT)作為特征,不僅與STFT同樣具備信息完備性,而且是一種實數(shù)特征。我們在MetaFomer基礎上,結合MobileNet block的輕量架構以及NAFNet的設計理念構建了全局局部模塊,整個網(wǎng)絡由此模塊堆疊而成。結果表明,相比其他網(wǎng)絡,MFNet的性能達到了SOTA水平,且計算量具有優(yōu)勢。

1b353b40-4c9d-11ee-a25d-92fbcf53809c.png

研究方向:語音識別

Multi-pass Training and Cross-information Fusion for Low-resource End-to-end Accented Speech Recognition

低資源重口音語音識別是當前ASR技術在實際應用中面臨的重要挑戰(zhàn)之一。在這項研究中,我們提出了一個基于Conformer的架構,稱為Aformer,以利用大量非口音和有限口音訓練數(shù)據(jù)的聲學信息。在Aformer中設計了一個普通編碼器和一個口音編碼器來提取互補的聲學信息。此外,我們使用多通道的方式訓練Aformer,并研究了三種交叉信息融合方法,以有效地結合來自一般編碼器和口音編碼器的信息。結果表明,在六個域內和域外口音測試集上,我們提出的方法優(yōu)于Conformer基線,詞/字錯誤率相對減少了10.2%到24.5%。

1b7e7af8-4c9d-11ee-a25d-92fbcf53809c.png

研究方向:語音識別

Phonetic-assisted Multi-Target Units Modeling for Improving Conformer-Transducer ASR system

在端到端的自動語音識別(ASR)中,開發(fā)有效的目標建模單元是非常重要的,也是大家一直關注的問題。我們提出一種語音輔助的多目標單元(PMU)建模方法,以漸進式表征學習的方式增強Conformer-TransducerASR系統(tǒng)。具體來說,PMU首先使用語音輔助子詞建模(PASM)和字節(jié)對編碼(BPE)分別產生語音誘導和文本誘導的目標單元;在此基礎上,我們提出了三種增強聲學編碼器的框架,包括基本PMU、paraCTC和paCTC,它們集成了不同層次的PASM和BPE單元,用于CTC和transducer多任務訓練。在LibriSpeech和口音ASR測試集上的實驗結果表明,與傳統(tǒng)的BPE相比,提出的PMU方法顯著降低了LibriSpeech clean、other和6個重音ASR測試集的WER,分別降低了12.7%、6.0%和7.7%。

1bb882ac-4c9d-11ee-a25d-92fbcf53809c.png

研究方向:防攻擊聲紋

Advanced RawNet2 with Attention-based Channel Masking for Synthetic Speech Detection

自動揚聲器驗證系統(tǒng)通常很容易受到欺騙攻擊,特別是不可見的攻擊。由于語音合成和語音轉換算法的多樣性,如何提高合成語音檢測系統(tǒng)的泛化能力是一個具有挑戰(zhàn)性的問題。為了解決這個問題,我們提出了一種改進的RawNet2,通過引入一個基于注意力的通道掩蔽模塊來改進RawNet2,其中包括三個主要組成部分:SE、通道掩蔽和全局-局部特征聚合。在ASVspoof2019和ASVspoof 2021數(shù)據(jù)集上評估了該系統(tǒng)的有效性。其中,ARawNet2在ASVspoof 2019 LA任務上達到了4.61%,在ASVspoof 2021 LA和DF任務上的EER分別達到了8.36%和19.03%,比RawNet2基線分別降低了12.00%和14.97%。

1beb130c-4c9d-11ee-a25d-92fbcf53809c.png

1c1799ea-4c9d-11ee-a25d-92fbcf53809c.png

審核編輯:彭菁

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 語音識別
    +關注

    關注

    39

    文章

    1774

    瀏覽量

    113904
  • 人工智能
    +關注

    關注

    1804

    文章

    48704

    瀏覽量

    246468
  • Agi
    Agi
    +關注

    關注

    0

    文章

    91

    瀏覽量

    10426
  • 云知聲
    +關注

    關注

    0

    文章

    220

    瀏覽量

    8658

原文標題:云知聲4篇論文入選國際頂會INTERSPEECH 2023

文章出處:【微信號:云知聲,微信公眾號:云知聲】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    四篇論文入選自然語言處理ACL 2025

    結果正式公布。在此次國際學術盛會中表現(xiàn)卓越,共有4篇論文被接收,其中包括2篇主論文(Main Paper)和2篇Findings。入
    的頭像 發(fā)表于 05-26 14:15 ?255次閱讀
    <b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>聲</b>四篇論文入選自然語言處理<b class='flag-5'>頂</b><b class='flag-5'>會</b>ACL 2025

    營收超9億!這家AI巨頭將靠AGI逆襲,醫(yī)療AI成新戰(zhàn)場

    ? 電子發(fā)燒友網(wǎng)報道(文/莫婷婷)3月底,再次向港交所遞交招股書。在這之前
    的頭像 發(fā)表于 04-07 08:31 ?1746次閱讀
    <b class='flag-5'>年</b>營收超9億!這家AI巨頭將靠<b class='flag-5'>AGI</b>逆襲,醫(yī)療AI成新戰(zhàn)場

    AIGC技術助力雅馬哈提升企業(yè)生產力

    近日,又收獲一則暖心喜訊,收到了一封來自雅馬哈發(fā)動機(廈門)信息系統(tǒng)有限公司的感謝信。信中,雅馬哈對學院為其精心打造的AIGC辦公
    的頭像 發(fā)表于 01-16 09:57 ?381次閱讀

    Atlas超算平臺的核心亮點

    ”,榮耀入選《分布式統(tǒng)一大數(shù)據(jù)虛擬文件系統(tǒng)Alluxio原理、技術與實踐》。這一榮譽不僅彰顯了
    的頭像 發(fā)表于 01-07 16:08 ?506次閱讀

    榮耀斬獲四項年度大獎

    歲末年初,不僅是時間流轉的標志,更是萬物更新、夢想揚帆的新篇章。在這個交織著希望與挑戰(zhàn)的關鍵時刻,憑借其人工智能領域的卓越成就和深厚技術
    的頭像 發(fā)表于 01-07 16:06 ?423次閱讀

    與TCL引領新風空調語音交互新時代

    近日,收到一份特別的新年禮物——一封來自TCL的感謝信,再次溫暖了
    的頭像 發(fā)表于 01-02 10:14 ?416次閱讀

    近期斬獲多項年度大獎

    科技迅猛發(fā)展的當下,人工智能(AI)已成為推動各行業(yè)革新的核心動力。,以其卓越的技術實力
    的頭像 發(fā)表于 12-24 10:26 ?487次閱讀

    榮獲上海市優(yōu)秀專家工作站稱號

    近日,2024上海市院士(專家)工作站(服務中心)績效評估結果揭曉。(上海)智能科技有限公司(以下簡稱“
    的頭像 發(fā)表于 12-13 14:27 ?496次閱讀

    榮登2024大模型企業(yè)TOP50榜單

    近日,智領未來·向新而行—2024人工智能大模型產業(yè)大會在京召開,會上揭曉2024大模型企業(yè)TOP50榜單,榮登榜單,山海大模型綜合實力再獲業(yè)界高度
    的頭像 發(fā)表于 11-29 17:52 ?834次閱讀

    天合儲能再次獲得權威機構認可

    隨著全球儲能市場的蓬勃發(fā)展,天合儲能以其卓越的創(chuàng)新實力和全球布局能力再次獲得權威機構認可
    的頭像 發(fā)表于 11-25 11:39 ?549次閱讀

    中國科大攜手斬獲ACM MM 2024競賽多項榮譽

    近日,第32屆ACM國際多媒體會議澳大利亞墨爾本圓滿落幕。由中國科學技術大學自動化系於俊老師帶隊的中國科學技術大學與
    的頭像 發(fā)表于 11-21 14:21 ?627次閱讀

    學院榮登2024中國企培業(yè)模式創(chuàng)新TOP10榜單

    近日,第13屆國際培訓產品博覽(簡稱“培博”)江蘇昆山舉行,展會期間公布2024培博?培英獎評選結果,
    的頭像 發(fā)表于 11-21 14:12 ?545次閱讀

    黃偉:AGI產業(yè)升級新范式

    近日,由國楓律師事務所聯(lián)合上海交通大學凱原法學院共同主辦的國楓律師事務所三十周系列活動之“通用人工智能(AGI):科技創(chuàng)新、產業(yè)迭代與法治發(fā)展”論壇滬舉行,匯集科技界、投資界、法學界、企業(yè)界等
    的頭像 發(fā)表于 09-12 14:39 ?752次閱讀

    榮獲“年度車載AGI解決方案高成長供應商”

    ? 近日,2024高工智能汽車開發(fā)者大會暨艙駕智能與跨域論壇滬舉行,同期舉辦中國汽車新供應鏈百強頒獎盛典,憑借車載語音交互全鏈路方案,榮獲“年度車載
    的頭像 發(fā)表于 07-11 16:07 ?835次閱讀

    邊緣側大模型技術探索和應用

    解決的課題。 2024高工智能汽車開發(fā)者大會暨艙駕智能與跨域論壇上,智慧座艙解決方案中心總經(jīng)理鮑晴峰以《邊緣側大模型帶來智能座艙交互新體驗》為題,分享了
    的頭像 發(fā)表于 06-29 15:30 ?1162次閱讀