女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用NVIDIA GPU助力美團CTR預(yù)測服務(wù)升級

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-13 15:15 ? 次閱讀

案例簡介

本案例中美團機器學(xué)習(xí)平臺使用 NVIDIA GPU 支持其多方面優(yōu)化策略,從而提高吞吐能力及降低響應(yīng)延遲。通過算子融合、計算圖等價替換等一系列優(yōu)化 ,相較于 CPU 在相同成本約束下,NVIDIA T4 GPU 大幅加速美團 CTR(Click-Through-Rate)模型預(yù)測性能,神經(jīng)網(wǎng)絡(luò)模型吞吐能力提升了 10 倍;同時在搜索精排場景中,端到端整體吞吐能力提升了一倍以上,助力美團 CTR 向新一代服務(wù)升級。

? 本案例為 NVIDIA GPU 推理加速互聯(lián)網(wǎng)行業(yè) CTR 模型的典型應(yīng)用

? 本案例主要應(yīng)用到 T4 GPU 和 NVIDIA 各 SDK 以及 CUDA 加速手段

客戶簡介及應(yīng)用背景

美團是一家集生活服務(wù)及商品零售的電商平臺,公司聚焦“零售+科技”戰(zhàn)略,以“吃”為核心,通過科技創(chuàng)新,服務(wù)于生活服務(wù)業(yè)需求側(cè)和供給側(cè)數(shù)字化升級。美團在中國業(yè)務(wù)涵蓋餐飲、配送、網(wǎng)約車、共享單車、酒店及旅游預(yù)訂、電影票務(wù)等 200 多個服務(wù)品類,覆蓋全國 2800 個市區(qū)縣,服務(wù) 6.7 億活躍用戶和 830 萬活躍商家。

伴隨著用戶規(guī)模的提升和業(yè)務(wù)的精細化運營,業(yè)務(wù)側(cè)對推薦系統(tǒng)的準(zhǔn)確度、吞吐能力和時延都提出了新的挑戰(zhàn),而 CTR 模型作為推薦系統(tǒng)的核心模型,其效果直接影響業(yè)務(wù)的收入。

客戶挑戰(zhàn)

美團的 CTR 模型過去一直在使用 CPU 推理的方式,但隨著用戶訪問量的提升和深度神經(jīng)網(wǎng)絡(luò)的引入,CTR 模型結(jié)構(gòu)趨于復(fù)雜,吞吐和計算量也越來越大,CPU 開始不能滿足模型對于算力的需求,而僅僅通過 CPU 服務(wù)器的堆疊帶來的性能提升性價比相較偏低。

而 GPU 擁有數(shù)以千計的計算核心,可以在單機內(nèi)提供密集的并行計算能力,特別適合深度學(xué)習(xí)場景,在行業(yè)內(nèi)已經(jīng)在 CV、NLP 等領(lǐng)域展示了強大的能力。通過 CUDA 及相關(guān) API,NVIDIA建立了完整的 GPU 生態(tài)系統(tǒng)。基于此,美團基礎(chǔ)研發(fā)平臺將 CTR 模型部署到 GPU 上,并通過一系列針對 CPU 與 GPU 的異構(gòu)系統(tǒng)并行計算設(shè)計、數(shù)據(jù)存儲方式和傳輸方式上的特定優(yōu)化,希望能通過 GPU 強大的計算力,協(xié)助美團在 CTR 預(yù)測的各業(yè)務(wù)場景中發(fā)揮出最大優(yōu)勢。

應(yīng)用方案

為了解決算力瓶頸及上述各種挑戰(zhàn),美團機器學(xué)習(xí)平臺采用 NVIDIA AI 計算平臺,在繼 CV、NLP 及 CTR 訓(xùn)練后,也使用了 NVIDIA T4來提供 CTR 預(yù)測支持,大幅提升用戶體驗與服務(wù)穩(wěn)定性。除此之外,時延也是業(yè)務(wù)側(cè)非常重視的性能指標(biāo),許多復(fù)雜模型縱有更好的準(zhǔn)確度,但卻因響應(yīng)時間不達標(biāo)而無法落地應(yīng)用,例如,在某搜索框自動補全的場景,由于天然的交互屬性,時延要求非常苛刻,一般來說無法使用復(fù)雜的模型。而在 GPU 能力的加持下,其復(fù)雜模型的平均響應(yīng)時間從 15 毫秒降低至 6~7 毫秒,足足縮短了一倍多,達到了上線要求。

使用效果及影響

通過 NVIDIA T4 深度優(yōu)化方案,成功為美團 CTR 模型創(chuàng)造更多應(yīng)用機會,不僅極大地提升了系統(tǒng)吞吐量,更進一步地提升了整個模型訓(xùn)練的速度與降低訓(xùn)練成本,落實 AI 框架在 GPU上性能推理的優(yōu)化實踐。

“在美團和英偉達的共同努力下,我們將 CTR 預(yù)測服務(wù)成功的遷移到 GPU 平臺上,在為業(yè)務(wù)提供更好的支撐的同時也獲得了更好的性價比;下一步,機器學(xué)習(xí)平臺計劃采用 NVIDIA Triton 推理服務(wù)框架和 NVIDIA Ampere A30,進一步提升美團推理服務(wù)的效率。”

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5241

    瀏覽量

    105768
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4910

    瀏覽量

    130653
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    34198

    瀏覽量

    275358
收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    Altair One? 云端門戶與 NVIDIA Omniverse 實時數(shù)字孿生藍圖完成全面整合

    正式宣布其?Altair One?云端門戶與?NVIDIA Omniverse 實時數(shù)字孿生藍圖實現(xiàn)技術(shù)融合。通過整合?GPU 加速、NVIDIA NIM 微服務(wù)與?Omniverse
    的頭像 發(fā)表于 04-02 14:01 ?194次閱讀

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)

    NVIDIA GTC 推出新一代專業(yè)級 GPU 和 AI 賦能的開發(fā)者工具—同時,ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結(jié)束測試階段,本月的 NVIDIA
    的頭像 發(fā)表于 03-28 09:59 ?513次閱讀

    NVIDIA助力解決量子計算領(lǐng)域重大挑戰(zhàn)

    NVIDIA 加速量子研究中心提供了強大的工具,助力解決量子計算領(lǐng)域的重大挑戰(zhàn)。
    的頭像 發(fā)表于 03-27 09:17 ?465次閱讀

    NVIDIA GPU助力科研人員探索外星世界

    NVIDIA GPU 驅(qū)動的深度學(xué)習(xí)在短短幾秒內(nèi)解讀出了卡西尼號土星探測器多年來收集的海量數(shù)據(jù),為科研人員探索外星世界提供了更加智能的方式。
    的頭像 發(fā)表于 02-27 10:37 ?496次閱讀

    上汽乘用車與達成戰(zhàn)略合作

    的達成,無疑將為雙方的用戶、商家、經(jīng)銷商及員工帶來更加全面和優(yōu)質(zhì)的服務(wù)體驗。上汽乘用車作為國內(nèi)領(lǐng)先的汽車制造商,擁有強大的產(chǎn)品研發(fā)和生產(chǎn)能力,而則以其廣泛的用戶基礎(chǔ)和強大的互聯(lián)網(wǎng)服務(wù)
    的頭像 發(fā)表于 01-21 15:22 ?904次閱讀

    豐田、Aurora和大陸集加入NVIDIA合作伙伴行列

    NVIDIA 宣布,豐田、Aurora 和大陸集已加入全球移動出行領(lǐng)導(dǎo)者行列,利用 NVIDIA 加速計算和 AI 開發(fā)構(gòu)建乘用與商用車型。
    的頭像 發(fā)表于 01-08 10:50 ?452次閱讀

    NVIDIA和GeForce RTX GPU專為AI時代打造

    NVIDIA 和 GeForce RTX GPU 專為 AI 時代打造。
    的頭像 發(fā)表于 01-06 10:45 ?527次閱讀

    GPU加速云服務(wù)器怎么用的

    GPU加速云服務(wù)器是將GPU硬件與云計算服務(wù)相結(jié)合,通過云服務(wù)提供商的平臺,用戶可以根據(jù)需求靈活租用帶有
    的頭像 發(fā)表于 12-26 11:58 ?364次閱讀

    NVIDIA預(yù)測2025年AI行業(yè)發(fā)展

    NVIDIA 加速計算、數(shù)據(jù)科學(xué)和研究領(lǐng)域?qū)<?b class='flag-5'>預(yù)測,多模態(tài)模型將推動行業(yè)創(chuàng)新和效率提升。
    的頭像 發(fā)表于 12-18 13:49 ?1021次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    的各個方面,包括硬件支持、操作系統(tǒng)支持、許可證、GPU計算的啟用、NVIDIA和AMD GPU的詳細信息以及相關(guān)的使用指南和故障排除等內(nèi)容。 1. 硬件支持 - NVIDIA
    發(fā)表于 12-16 14:25

    全新NVIDIA NIM微服務(wù)實現(xiàn)突破性進展

    全新 NVIDIA NIM 微服務(wù)實現(xiàn)突破性進展,可助力氣象技術(shù)公司開發(fā)和部署 AI 模型,實現(xiàn)對降雪、結(jié)冰和冰雹的預(yù)測
    的頭像 發(fā)表于 11-21 10:07 ?595次閱讀

    AMD與NVIDIA GPU優(yōu)缺點

    在圖形處理單元(GPU)市場,AMD和NVIDIA是兩大主要的競爭者,它們各自推出的產(chǎn)品在性能、功耗、價格等方面都有著不同的特點和優(yōu)勢。 一、性能 GPU的性能是用戶最關(guān)心的指標(biāo)之一。在高端市場
    的頭像 發(fā)表于 10-27 11:15 ?2095次閱讀

    使用NVIDIA Edify助力服務(wù)創(chuàng)建3D資產(chǎn)和虛擬環(huán)境照明

    使用 NVIDIA Edify 助力服務(wù)創(chuàng)建 3D 資產(chǎn)和虛擬環(huán)境照明,或是減半生成圖像時間。
    的頭像 發(fā)表于 08-02 15:22 ?907次閱讀

    暴漲預(yù)警!NVIDIA GPU供應(yīng)大跳水

    gpu
    jf_02331860
    發(fā)布于 :2024年07月26日 09:41:42

    英偉達推出全新NVIDIA AI Foundry服務(wù)NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)NVIDIA NIM 推理微服務(wù),與同樣剛推出的 Llama 3.1
    的頭像 發(fā)表于 07-25 09:48 ?994次閱讀