女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA助力阿里巴巴天貓精靈大幅提升服務(wù)運(yùn)行效率

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 作者:NVIDIA英偉達(dá)企業(yè)解 ? 2022-07-14 10:05 ? 次閱讀

天貓精靈智能引擎團(tuán)隊(duì)、智能合成團(tuán)隊(duì)與 NVIDIA 團(tuán)隊(duì)合作,通過利用 NVIDIA TensorRT 加速流式語音合成(Text-to-Speech,以下簡(jiǎn)稱 TTS)深度學(xué)習(xí)模型,并借助 NVIDIA Triton 推理服務(wù)器在 NVIDIA T4 GPU 上進(jìn)行高效部署,幫助阿里巴巴天貓精靈流式 TTS 服務(wù)將吞吐提升 50%,首包延時(shí)降低 35%,大幅提升服務(wù)運(yùn)行效率,提升資源利用率。

天貓精靈(Tmall Genie)是阿里巴巴消費(fèi)者人工智能一級(jí)公司,于 2017 年 9 月發(fā)布第一代天貓精靈智能終端 X1。讓用戶以自然語言對(duì)話的交互方式,實(shí)現(xiàn)影音娛樂、購(gòu)物、信息查詢、生活服務(wù)等功能操作,成為消費(fèi)者的家庭助手。目前,天貓精靈已經(jīng)服務(wù)超過 3000 萬中國(guó)家庭,在三方權(quán)威統(tǒng)計(jì)中不僅智能音箱產(chǎn)品出貨量排名中國(guó)前列,其產(chǎn)品并已可連接 3 億以上的家庭 AIoT 生態(tài)設(shè)備。

除了智能音箱終端產(chǎn)品外,天貓精靈推出 AliGenie 開放平臺(tái),旨在構(gòu)建基于 AI 的多模態(tài)交互及服務(wù)系統(tǒng),為多種云應(yīng)用提供跨系統(tǒng)服務(wù)能力,實(shí)現(xiàn)端云協(xié)同、跨平臺(tái)多終端快速接入。該開放平臺(tái)提供高性能且高質(zhì)量的語音 AI 能力,包括多種不同音色的高度擬人、高度流暢的語音合成算法等。

此外,天貓精靈基于 AliGenie 開放平臺(tái),還提供基于芯片/模組的硬件解決方案,以及通用的熱門行業(yè)解決方案。專注生活多個(gè)領(lǐng)域,提供一站式解決方案。

本案例中負(fù)責(zé)實(shí)施的是天貓精靈智能引擎團(tuán)隊(duì)以及天貓精靈智能合成團(tuán)隊(duì)。天貓精靈智能合成團(tuán)隊(duì)負(fù)責(zé)語音合成等生成式算法的研究及開發(fā);天貓精靈智能引擎團(tuán)隊(duì)主要支撐天貓精靈業(yè)務(wù)線各項(xiàng)業(yè)務(wù)的工程化落地,如語音識(shí)別、語義理解、語音合成、圖像處理等 AI 核心場(chǎng)景。

流式 TTS 是天貓精靈工作流中最為重要的 AI 環(huán)節(jié)之一。在這一場(chǎng)景中,天貓精靈智能引擎團(tuán)隊(duì)面臨著如下挑戰(zhàn):

首先流式 TTS 對(duì)于首包延時(shí)有著嚴(yán)格要求,否則用戶將會(huì)因?yàn)檩^長(zhǎng)的反饋遲滯而感到不適,這就要求 TTS 工作管線的每個(gè)模塊的推理能夠高效地執(zhí)行。

另一方面,團(tuán)隊(duì)希望 TTS 服務(wù)的吞吐能夠達(dá)到較高水平,這就需要在服務(wù)端對(duì)收到的多個(gè)流式合成請(qǐng)求進(jìn)行 Batching 的處理。但流式 TTS 工作管線包含聲學(xué)模型和聲碼器等多個(gè)模塊,在 GPU 上進(jìn)行 Batching 操作需要正確維護(hù)和切換每個(gè)合成請(qǐng)求所需的模型狀態(tài),因此需要特別設(shè)計(jì)工作管線和調(diào)度邏輯。

最后,如何盡可能提升 GPU 資源利用率是降本增效的關(guān)鍵。最直接的思路便是在一張 GPU 上部署多個(gè)模型來提升利用率。因此,如何在同一張 GPU 上對(duì)多個(gè)模型進(jìn)行高效的調(diào)度和管理也成為了一個(gè)挑戰(zhàn)。

基于以上挑戰(zhàn),天貓精靈智能引擎團(tuán)隊(duì)、智能合成團(tuán)隊(duì)與 NVIDIA 解決方案架構(gòu)團(tuán)隊(duì)合作,采用NVIDIA TensorRT對(duì)模型進(jìn)行推理加速,并利用NVIDIA Triton 推理服務(wù)器在 T4 GPU 上進(jìn)行在線部署,形成了一套高效的流式 TTS 推理部署方案。在提升用戶體驗(yàn)的同時(shí),大幅降低了服務(wù)成本。

首先,該方案使用 TensorRT 對(duì)流式 TTS 工作管線中的每一個(gè)模型進(jìn)行優(yōu)化加速。我們將訓(xùn)練好的聲學(xué)模型和聲碼器,導(dǎo)出為 ONNX 模型格式,再使用 TensorRT 將 ONNX 模型轉(zhuǎn)換為最優(yōu)化的 TensorRT Engine。使用 TensorRT 加速的 TTS 模型,能顯著提升推理執(zhí)行的速度,從而盡可能壓縮首包延時(shí)。

另一方面,天貓精靈智能引擎團(tuán)隊(duì)與 NVIDIA 團(tuán)隊(duì)合作設(shè)計(jì)并實(shí)現(xiàn)了一種基于 Triton 的流式 TTS 推理部署管線。在該方案中,我們使用 Triton Custom Backend 實(shí)現(xiàn)串聯(lián) TTS 各個(gè)模型的調(diào)度管線。對(duì)于管線中的每一步推理處理,會(huì)調(diào)用部署在 Triton 上的 TTS TensorRT Engine。如此一來,Triton 便可將發(fā)送到服務(wù)端的 TTS 請(qǐng)求,有條不紊地調(diào)度到管線中的每個(gè)模塊進(jìn)行推理執(zhí)行。并且,在該管線中,我們實(shí)現(xiàn)了適用于 GPU 平臺(tái)的流式 TTS 高效調(diào)度機(jī)制,通過在服務(wù)端 Custom Backend 中維護(hù)每個(gè)合成請(qǐng)求的狀態(tài),實(shí)時(shí)地將模型輸入和狀態(tài)動(dòng)態(tài)聚合為對(duì) GPU 友好的 Batch,交由管線中各個(gè)模塊的 TensorRT Engine 進(jìn)行推理,從而大幅提升管線吞吐和 GPU 利用率,同時(shí)保證了對(duì)每個(gè)合成請(qǐng)求的快速響應(yīng)。此外,流式 TTS 中一句話的合成請(qǐng)求會(huì)對(duì)應(yīng)多個(gè)回包,每個(gè)回包承載一個(gè)音頻塊。針對(duì)這種一收多發(fā)的推理模式,我們利用 Triton 提供的 Decoupled Responses 機(jī)制,保證一個(gè)請(qǐng)求的多個(gè)回包能夠正確高效地發(fā)送給對(duì)應(yīng)的客戶端,使用戶能聽到完整且流暢的音頻。

最后,為了進(jìn)一步提升 GPU 資源利用率,該方案利用了 Triton 的 Concurrent Model Execution 特性。該特性將部署在 Triton 上的模型或模塊,以模型實(shí)例的方式管理:一個(gè)模型可以部署多個(gè)實(shí)例,不同模型的實(shí)例也可部署在同一GPU上。因此該方案開啟了 Concurrent Model Execution 后,同一個(gè) T4 GPU 上可部署多個(gè) TTS 發(fā)音模型,使得多個(gè)模型實(shí)例的推理在 GPU 算力資源充足時(shí)可以達(dá)到并行執(zhí)行。如此一來,GPU 算力資源可以被多個(gè)模型的并行執(zhí)行充分利用起來,達(dá)到降本增效的目的。

通過使用基于 NVIDIA TensorRT 和 Triton 推理服務(wù)器的流式 TTS 推理部署方案,天貓精靈 TTS 服務(wù)的吞吐提升約 50%,首包延時(shí)降低約 35% ,幫助天貓精靈節(jié)省了業(yè)務(wù)成本,提升了用戶體驗(yàn)。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5238

    瀏覽量

    105749
  • 阿里巴巴
    +關(guān)注

    關(guān)注

    7

    文章

    1635

    瀏覽量

    48073
  • TTS
    TTS
    +關(guān)注

    關(guān)注

    0

    文章

    51

    瀏覽量

    11087
  • 天貓精靈
    +關(guān)注

    關(guān)注

    4

    文章

    96

    瀏覽量

    11650

原文標(biāo)題:NVIDIA TensorRT 和 Triton 助力阿里巴巴天貓精靈顯著提升流式語音合成服務(wù)運(yùn)行效率

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    阿里云是什么?企業(yè)不可不知的云端架構(gòu)服務(wù)

    阿里云是什么?中國(guó)高速連線阿里云 CDN 服務(wù) 阿里云為國(guó)內(nèi)云端市場(chǎng)中市占有率第一的云平臺(tái),由阿里巴巴集團(tuán)自主研發(fā),在國(guó)內(nèi)使用的線路品質(zhì)穩(wěn)定
    的頭像 發(fā)表于 03-16 09:43 ?370次閱讀

    阿里云爆發(fā)式的跨越

    表示,阿里巴巴與蘋果的合作,將不僅僅局限于手機(jī)服務(wù)領(lǐng)域,未來還將涉及更多的業(yè)務(wù)板塊。 當(dāng)媒體都在驚嘆與討論蘋果為什么選擇阿里巴巴時(shí),背后真正的主角還需要加上一個(gè) “云” 字。 長(zhǎng)期以來,相比淘寶、
    的頭像 發(fā)表于 03-12 16:54 ?352次閱讀
    <b class='flag-5'>阿里</b>云爆發(fā)式的跨越

    Arm與阿里巴巴合作加速端側(cè)多模態(tài)AI體驗(yàn)

    Arm 控股有限公司(納斯達(dá)克股票代碼:ARM,以下簡(jiǎn)稱“Arm”)近日發(fā)布與阿里巴巴集團(tuán)輕量級(jí)深度學(xué)習(xí)框架 MNN 的又一新合作。
    的頭像 發(fā)表于 03-10 09:07 ?524次閱讀

    谷景阿里巴巴國(guó)際站正式上線

    在行業(yè)發(fā)展的關(guān)鍵節(jié)點(diǎn),谷景電子取得了重大突破,谷景阿里巴巴國(guó)際站正式上線!此次上線聚焦電感領(lǐng)域,旨在為全球客戶提供更較大好的電感產(chǎn)品與服務(wù),也標(biāo)志著谷景電感業(yè)務(wù)在國(guó)際化道路上邁出了關(guān)鍵一步。
    的頭像 發(fā)表于 02-26 09:44 ?364次閱讀

    阿里巴巴否認(rèn)投資DeepSeek傳聞

    近日,市場(chǎng)流傳出一則消息,稱阿里巴巴計(jì)劃向人工智能企業(yè)DeepSeek投資10億美元,意在獲取該公司10%的股份,并考慮將阿里云作為其首要推理算力平臺(tái)。此消息一出,立即引起了市場(chǎng)的廣泛關(guān)注和熱議
    的頭像 發(fā)表于 02-10 09:10 ?494次閱讀

    阿里巴巴否認(rèn)投資DeepSeek

    近日,有傳聞稱阿里巴巴計(jì)劃以100億美元的估值,投資10億美元認(rèn)購(gòu)中國(guó)AI初創(chuàng)企業(yè)DeepSeek的10%股權(quán)。然而,阿里高管顏喬迅速對(duì)此進(jìn)行了否認(rèn),他表示:“同為中國(guó)杭州企業(yè),我們?yōu)镈eepSeek的成就鼓掌,但外界流傳的阿里
    的頭像 發(fā)表于 02-08 16:47 ?569次閱讀

    貓精靈與夸克團(tuán)隊(duì)攜手設(shè)計(jì)AI眼鏡

    近日,阿里巴巴集團(tuán)內(nèi)部的智能互聯(lián)事業(yè)群迎來了新的管理變革,由總裁吳嘉正式接管這一關(guān)鍵業(yè)務(wù)板塊。作為阿里巴巴面向廣大消費(fèi)者的重要硬件業(yè)務(wù)之一,“貓精靈”將繼續(xù)保持其獨(dú)立運(yùn)營(yíng)的特色與優(yōu)勢(shì)
    的頭像 發(fā)表于 01-20 10:28 ?1721次閱讀

    阿里AI To C業(yè)務(wù)調(diào)整:貓精靈與夸克融合,探索AI眼鏡

    近日,阿里集團(tuán)內(nèi)部進(jìn)行了一次業(yè)務(wù)調(diào)整,智能互聯(lián)事業(yè)群正式由智能信息事業(yè)群總裁吳嘉接管。智能互聯(lián)事業(yè)群是阿里在2022年成立的一級(jí)業(yè)務(wù)部門,其核心品牌為貓精靈,是
    的頭像 發(fā)表于 01-17 10:16 ?608次閱讀

    阿里巴巴出售高鑫零售股權(quán),聚焦核心業(yè)務(wù)

    近日,阿里巴巴集團(tuán)正式對(duì)外發(fā)布公告,宣布其子公司及New Retail與德弘資本達(dá)成了一項(xiàng)重要協(xié)議。根據(jù)該協(xié)議,阿里巴巴將出售其所持有的高鑫零售全部股權(quán),這些股權(quán)合計(jì)占高鑫零售已發(fā)行股份總數(shù)的約
    的頭像 發(fā)表于 01-02 10:54 ?391次閱讀

    阿里巴巴將在美國(guó)推出AI電商工具PIC COPILOT

    人工智能領(lǐng)域的一次重要嘗試,旨在利用先進(jìn)的AI技術(shù)為美國(guó)電商市場(chǎng)提供更加智能化、便捷化的服務(wù)。該工具將深度融合阿里巴巴在大數(shù)據(jù)、云計(jì)算以及電子商務(wù)領(lǐng)域的深厚積累,通過智能算法和數(shù)據(jù)分析,幫助商家更加精準(zhǔn)地把握市場(chǎng)需求,提升運(yùn)營(yíng)
    的頭像 發(fā)表于 12-06 10:52 ?912次閱讀

    阿里巴巴整合電商資源,成立全新電商事業(yè)群

    業(yè)群將由蔣凡擔(dān)任CEO,直接向吳泳銘匯報(bào)。該事業(yè)群將全面覆蓋并整合阿里巴巴旗下的淘寶貓集團(tuán)、國(guó)際數(shù)字商業(yè)集團(tuán),以及1688、閑魚等核心電商業(yè)務(wù)。這一整合舉措旨在打造一個(gè)覆蓋國(guó)內(nèi)外全產(chǎn)業(yè)鏈的綜合性業(yè)務(wù)集群,進(jìn)一步提升
    的頭像 發(fā)表于 11-22 10:51 ?440次閱讀

    阿里巴巴國(guó)際站首推全流程AI產(chǎn)品

    近日,阿里巴巴國(guó)際站正式推出了其首個(gè)全流程AI產(chǎn)品——AI生意助手2.0。這一創(chuàng)新產(chǎn)品的問世,標(biāo)志著阿里巴巴助力中小企業(yè)外貿(mào)經(jīng)營(yíng)方面邁出了重要一步。
    的頭像 發(fā)表于 10-30 16:12 ?662次閱讀

    阿里巴巴完成雙重主要上市

    8月28日阿里巴巴在香港聯(lián)交所主板主要上市,成為在港交所、紐交所雙重主要上市的公司。如今,阿里巴巴完成雙重主要上市。 此外,有投資機(jī)構(gòu)認(rèn)為阿里巴巴最快有望于9月份就納入港股通。 截至8月28日收盤,
    的頭像 發(fā)表于 08-29 16:06 ?549次閱讀

    阿里巴巴季報(bào)出爐 阿里云二季度營(yíng)收增長(zhǎng)6%

    阿里巴巴季報(bào)出爐我們一起來圍觀一下,根據(jù)阿里巴巴集團(tuán)發(fā)布的截至2024年6月30日的第二季度經(jīng)營(yíng)業(yè)績(jī)數(shù)據(jù)顯示,阿里巴巴該季度營(yíng)收達(dá)到2432.4億元,而上年同期營(yíng)收2341.56億元,同比增4%;經(jīng)
    的頭像 發(fā)表于 08-16 16:45 ?700次閱讀

    阿里巴巴AI賦能海外擴(kuò)張新篇章

    中國(guó)電商巨頭阿里巴巴集團(tuán)正積極重啟并加速其海外擴(kuò)張戰(zhàn)略,以應(yīng)對(duì)國(guó)內(nèi)電商市場(chǎng)競(jìng)爭(zhēng)加劇的挑戰(zhàn)。此次擴(kuò)張的一大亮點(diǎn)在于,阿里巴巴將人工智能(AI)技術(shù)深度融入其國(guó)際業(yè)務(wù)布局中,開啟了海外發(fā)展的新篇章。
    的頭像 發(fā)表于 07-12 17:56 ?1269次閱讀