女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Arm與Stability AI攜手合作加快文本轉音頻的響應速度

Arm社區 ? 來源:Arm社區 ? 2025-03-25 15:54 ? 次閱讀

作者:Arm 終端事業部產品管理總監 Ronan Naughton

想象一下,你正在智能手機上編輯視頻,需要為其添加合適的音效;或是你想要生成自定義聲音,用于設置鈴聲、鬧鐘或發布社交媒體帖子。你無需在網上搜索或購買音頻片段,只需輸入一段描述,例如“日落時的輕柔海浪聲”,幾秒鐘后,你的設備就會為你生成合適的聲音,甚至無需聯網就可實現。得益于 Arm 和 Stability AI 的新合作,這種完全在端側直接生成音頻的技術已變為現實。

Arm 與 Stability AI 攜手合作,加快文本轉音頻的響應速度

Stability AI 是一家專注于圖像、視頻、3D 和音頻領域人工智能 (AI) 模型開發的公司。而 Arm KleidiAI 能夠提供專門針對 Arm CPU 的經優化的性能關鍵例程(即微內核)。通過 KleidiAI 與 XNNPack 庫和 ExecuTorch 框架的集成,以及 Stability AI 自身的優化,為 Stability AI 的文本轉音頻開放模型“Stable Audio Open”帶來了顯著的 AI 性能提升。

令人驚嘆的結果包括文本轉音頻的 AI 生成時間從幾分鐘大幅縮短至幾秒鐘,響應速度提高了 30 倍。Stable Audio Open 模型完全在基于 Arm CPU 的智能手機上運行,且無需聯網,對于文本轉音頻 AI 來說是首創之舉。

Stability AI 利用 KleidiAI 自動加速功能,加快模型的響應速度,從而在不影響質量的情況下提升了端側 AI 性能。KleidiAI 帶來的性能提升,無需 Stable Audio Open 模型用戶額外投入開發精力,節省了時間和成本。Arm 和 Stability AI 將繼續合作,以實現更多性能的躍升,帶來更為出色的 AI 用戶體驗。

顯著的性能提升表明,具有針對性的硬件和軟件集成,使過往無法實現的 AI 應用在移動端變得可行,從而推動了未來的創新機遇。Arm 技術驅動了全球 99% 的智能手機,這也意味著數十億智能手機用戶現可取得先進的 AI 音頻功能。

共同應對復雜的 AI 挑戰

Stable Audio Open 模型具備出色的效率,但在智能手機的 CPU 上直接由端側運行該模型仍非易事。在初期嘗試時,單個音頻樣本的生成時間超過四分鐘,這對終端用戶而言不太能接受。

通過與 Arm 合作,Stability AI 將模型的訓練參數量蒸餾到適合移動端的規模。然后,通過新的蒸餾模型,并利用 XNNPack 與 ExecuTorch 集成帶來的 KleidiAI 性能加速,實現了在移動端 Arm CPU 上幾秒內就生成音頻片段。

Stability AI 首席執行官 Prem Akkaraju 表示:隨著越來越多的專業創意工作者和企業采用生成式 AI 來幫助提升其生產流程,我們的模型和工作流必須隨處可得,以供構建者和創作者使用,這一點至關重要。我們很高興能就此與 Arm 合作。從服務器到智能手機,Arm 平臺在整個生態系統中應用普及,并且 Arm 通過將 Arm Kleidi 集成到軟件棧中,致力于加速各類主流框架中的 AI 模型,因此 Arm 是我們的不二之選。

文本轉音頻 AI 的興起

自 2022 年以來,Stability AI 始終立于生成式 AI 發展的前沿,曾憑借行業領先的圖像模型 Stable Diffusion 引起轟動。依托 Stable Diffusion 的成功,該公司隨后推出了 Stable Audio,這是首個完全獲得授權的音頻模型之一,專為通過文本提示詞生成高質量的音樂和音效而設計。這些 AI 模型在 Hugging Face 等主要平臺上均排名前茅,擁有多達數百萬規模的用戶數,構成了一個活躍的技術社區。

人人皆可享先進的音頻 AI 體驗

這一成果僅僅只是雙方合作的開始,Arm 和 Stability AI 已規劃了更多的性能優化舉措,旨在為用戶帶來更加出色的使用體驗。通過攜手合作,Arm 正在為音頻、圖像、視頻和 3D 領域的端側 AI 打好基礎,重塑每個人創作內容和與數字媒體互動的方式。通過蒸餾先進的模型并利用經過優化的軟件,部署到人們常用的硬件設備上,從而為未來鋪平道路,實現人人都能通過口袋里的設備直接享受先進的 AI 應用、模型和體驗。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • ARM
    ARM
    +關注

    關注

    134

    文章

    9308

    瀏覽量

    375027
  • 音頻
    +關注

    關注

    29

    文章

    3023

    瀏覽量

    83041
  • AI
    AI
    +關注

    關注

    87

    文章

    34223

    瀏覽量

    275383
  • 人工智能
    +關注

    關注

    1804

    文章

    48708

    瀏覽量

    246501

原文標題:加快 30 倍!Arm Kleidi 賦能端側音頻生成提速

文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    Arm 與微軟合作,為基于 Arm 架構的 PC 和移動設備應用提供超強 AI 體驗

    ArmKleidiAI與ONNXRuntime的集成,為Windows和安卓操作系統帶來了顯著的AI性能優化,實現高達2.6倍的AI推理速度提升,從而加速應用體驗。聯合作者:
    的頭像 發表于 06-03 16:47 ?219次閱讀
    <b class='flag-5'>Arm</b> 與微軟<b class='flag-5'>合作</b>,為基于 <b class='flag-5'>Arm</b> 架構的 PC 和移動設備應用提供超強 <b class='flag-5'>AI</b> 體驗

    Arm與微軟合作加速邊緣設備上的AI體驗

    隨著人工智能 (AI) 成為當今個人電腦 (PC) 和移動設備使用體驗(從聊天機器人到生產力提升)中不可或缺的一部分,這些設備對 CPU 高效、可擴展的推理需求也在持續增長。Arm 與微軟正攜手
    的頭像 發表于 05-28 13:54 ?171次閱讀

    WT588F語音芯片響應時間深度解析:從指令觸發到音頻播放的技術全貌

    在智能語音交互設備開發中,系統響應速度直接影響用戶體驗。廣州唯創電子WT588F系列語音芯片憑借其靈活的架構設計,在響應效率方面表現出色。本文將深入解析該芯片從接收指令到音頻輸出的全過程,并揭示
    的頭像 發表于 03-31 09:24 ?287次閱讀
    WT588F語音芯片<b class='flag-5'>響應</b>時間深度解析:從指令觸發到<b class='flag-5'>音頻</b>播放的技術全貌

    Banana Pi 與瑞薩電子攜手共同推動開源創新:BPI-AI2N

    與嵌入式系統的優勢,該聯合解決方案旨在打造更開放、更靈活的軟硬件平臺。 “此次合作將提升瑞薩在開源社區的知名度。基于 RZ/V2N 的突破性 BPI-AI2N SOM 有望對多個行業產生重大影響,為工程師
    發表于 03-12 09:43

    AI Agent 應用與項目實戰》閱讀心得3——RAG架構與部署本地知識庫

    分析模型在不同類型數據上的表現,來優化文本分割策略和檢索參數,使系統在保持響應速度的同時,能夠提供更準確的查詢結果。 經過對第6-7章的深入學習,我對RAG技術在工程實踐中的應用有了更系統的認識。這一
    發表于 03-07 19:49

    Arm 年度技術大會: 預計2025 年底,全球將有超過 1,000 億臺具備 AI 能力的 Arm 設備

    。值得一提的是,在生態伙伴的攜手合作下,Arm預計到2025年底,全球將有超過1,000億臺具備AI能力的Arm設備。
    的頭像 發表于 11-22 12:41 ?630次閱讀
    <b class='flag-5'>Arm</b> 年度技術大會: 預計2025 年底,全球將有超過 1,000 億臺具備 <b class='flag-5'>AI</b> 能力的 <b class='flag-5'>Arm</b> 設備

    Arm與ExecuTorch合作加速端側生成式AI實現

    Arm 正在與 Meta 公司的 PyTorch 團隊攜手合作,共同推進新的 ExecuTorch 測試版 (Beta) 上線,旨在為全球數十億邊緣側設備和數百萬開發者提供人工智能 (AI
    的頭像 發表于 11-15 11:30 ?698次閱讀

    ADS1246輸出Data的響應速度可以達到100ms嗎?

    你好,請問當采樣率設置為20SPS,PGA=1時,輸入電流從4mA跳變到20mA,輸出Data的響應速度可以達到100ms嗎?謝謝
    發表于 11-15 07:22

    如何提升 ChatGPT 的響應速度

    提升 ChatGPT 的響應速度是一個涉及多個層面的復雜問題。以下是一些可能的方法和策略,可以幫助提高 ChatGPT 的響應速度: 優化算法 : 并行處理 :通過并行處理技術,可以讓多個計算任務
    的頭像 發表于 10-25 17:39 ?1438次閱讀

    神盾集團與Arm達成合作,推動AI HPC晶片創新

    近日,神盾集團在美國宣布了一項重要策略合作。旗下神盾公司與安國國際科技正式加入Arm? Total Design計劃,與全球領先的半導體公司安謀(Arm)攜手
    的頭像 發表于 10-21 15:52 ?795次閱讀

    usb轉音頻線是怎么連接的

    USB轉音頻線是一種將USB接口轉換為音頻接口的設備,它通常用于將電腦或其他USB設備的聲音輸出到音響系統、耳機或其他音頻設備。這種轉換線可以幫助用戶在沒有傳統音頻輸出接口的情況下,實
    的頭像 發表于 10-08 14:26 ?4844次閱讀

    Arm如何賦能無處不在的AI

    作為人工智能 (AI) 的創新基礎,眾多企業都在使用通用且應用廣泛的 Arm 計算平臺。迄今為止,合作伙伴基于 Arm 架構的芯片出貨量已逾 2,800 億顆。如今,
    的頭像 發表于 09-14 09:38 ?827次閱讀

    谷歌Gemini 1.5 Flash模型升級,AI聊天速度飆升50%

    谷歌近期對其Gemini AI系列進行了重大更新,推出了Gemini 1.5 Flash模型。此次升級的核心亮點在于顯著提升了AI聊天的響應速度,官方宣稱最高可達50%的增速,為用戶帶來前所未有的流暢體驗。
    的頭像 發表于 09-06 18:06 ?1149次閱讀

    NVIDIA 攜手全球合作伙伴推出 NIM Agent Blueprints,助力企業打造屬于自己的 AI

    可定制工作流目錄加快核心生成式 AI 用例的部署速度。首批用例包括客戶服務、藥物研發和 PDF 數據提取,未來將加入更多用例 企業可以使用 NIM Agent Blueprints 以及
    發表于 08-28 10:10 ?335次閱讀
    NVIDIA <b class='flag-5'>攜手</b>全球<b class='flag-5'>合作</b>伙伴推出 NIM Agent Blueprints,助力企業打造屬于自己的 <b class='flag-5'>AI</b>

    使用bt_spp_acceptor例程時,如何提高spp接收響應速度

    我使用bt_spp_acceptor例程時,spp下發到模組,模組響應速度不夠,請問怎么解決?
    發表于 06-26 07:17