案例簡介
本案例中美團機器學(xué)習(xí)平臺使用 NVIDIA GPU 支持其多方面優(yōu)化策略,從而提高吞吐能力及降低響應(yīng)延遲。通過算子融合、計算圖等價替換等一系列優(yōu)化 ,相較于 CPU 在相同成本約束下,NVIDIA T4 GPU 大幅加速美團 CTR(Click-Through-Rate)模型預(yù)測性能,神經(jīng)網(wǎng)絡(luò)模型吞吐能力提升了 10 倍;同時在搜索精排場景中,端到端整體吞吐能力提升了一倍以上,助力美團 CTR 向新一代服務(wù)升級。
? 本案例為 NVIDIA GPU 推理加速互聯(lián)網(wǎng)行業(yè) CTR 模型的典型應(yīng)用
? 本案例主要應(yīng)用到 T4 GPU 和 NVIDIA 各 SDK 以及 CUDA 加速手段
客戶簡介及應(yīng)用背景
美團是一家集生活服務(wù)及商品零售的電商平臺,公司聚焦“零售+科技”戰(zhàn)略,以“吃”為核心,通過科技創(chuàng)新,服務(wù)于生活服務(wù)業(yè)需求側(cè)和供給側(cè)數(shù)字化升級。美團在中國業(yè)務(wù)涵蓋餐飲、配送、網(wǎng)約車、共享單車、酒店及旅游預(yù)訂、電影票務(wù)等 200 多個服務(wù)品類,覆蓋全國 2800 個市區(qū)縣,服務(wù) 6.7 億活躍用戶和 830 萬活躍商家。
伴隨著用戶規(guī)模的提升和業(yè)務(wù)的精細化運營,業(yè)務(wù)側(cè)對推薦系統(tǒng)的準(zhǔn)確度、吞吐能力和時延都提出了新的挑戰(zhàn),而 CTR 模型作為推薦系統(tǒng)的核心模型,其效果直接影響業(yè)務(wù)的收入。
客戶挑戰(zhàn)
美團的 CTR 模型過去一直在使用 CPU 推理的方式,但隨著用戶訪問量的提升和深度神經(jīng)網(wǎng)絡(luò)的引入,CTR 模型結(jié)構(gòu)趨于復(fù)雜,吞吐和計算量也越來越大,CPU 開始不能滿足模型對于算力的需求,而僅僅通過 CPU 服務(wù)器的堆疊帶來的性能提升性價比相較偏低。
而 GPU 擁有數(shù)以千計的計算核心,可以在單機內(nèi)提供密集的并行計算能力,特別適合深度學(xué)習(xí)場景,在行業(yè)內(nèi)已經(jīng)在 CV、NLP 等領(lǐng)域展示了強大的能力。通過 CUDA 及相關(guān) API,NVIDIA建立了完整的 GPU 生態(tài)系統(tǒng)。基于此,美團基礎(chǔ)研發(fā)平臺將 CTR 模型部署到 GPU 上,并通過一系列針對 CPU 與 GPU 的異構(gòu)系統(tǒng)并行計算設(shè)計、數(shù)據(jù)存儲方式和傳輸方式上的特定優(yōu)化,希望能通過 GPU 強大的計算力,協(xié)助美團在 CTR 預(yù)測的各業(yè)務(wù)場景中發(fā)揮出最大優(yōu)勢。
應(yīng)用方案
為了解決算力瓶頸及上述各種挑戰(zhàn),美團機器學(xué)習(xí)平臺采用 NVIDIA AI 計算平臺,在繼 CV、NLP 及 CTR 訓(xùn)練后,也使用了 NVIDIA T4來提供 CTR 預(yù)測支持,大幅提升用戶體驗與服務(wù)穩(wěn)定性。除此之外,時延也是業(yè)務(wù)側(cè)非常重視的性能指標(biāo),許多復(fù)雜模型縱有更好的準(zhǔn)確度,但卻因響應(yīng)時間不達標(biāo)而無法落地應(yīng)用,例如,在某搜索框自動補全的場景,由于天然的交互屬性,時延要求非常苛刻,一般來說無法使用復(fù)雜的模型。而在 GPU 能力的加持下,其復(fù)雜模型的平均響應(yīng)時間從 15 毫秒降低至 6~7 毫秒,足足縮短了一倍多,達到了上線要求。
使用效果及影響
通過 NVIDIA T4 深度優(yōu)化方案,成功為美團 CTR 模型創(chuàng)造更多應(yīng)用機會,不僅極大地提升了系統(tǒng)吞吐量,更進一步地提升了整個模型訓(xùn)練的速度與降低訓(xùn)練成本,落實 AI 框架在 GPU上性能推理的優(yōu)化實踐。
“在美團和英偉達的共同努力下,我們將 CTR 預(yù)測服務(wù)成功的遷移到 GPU 平臺上,在為業(yè)務(wù)提供更好的支撐的同時也獲得了更好的性價比;下一步,機器學(xué)習(xí)平臺計劃采用 NVIDIA Triton 推理服務(wù)框架和 NVIDIA Ampere A30,進一步提升美團推理服務(wù)的效率。”
審核編輯:郭婷
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5241瀏覽量
105768 -
gpu
+關(guān)注
關(guān)注
28文章
4910瀏覽量
130653 -
AI
+關(guān)注
關(guān)注
87文章
34198瀏覽量
275358
發(fā)布評論請先 登錄
Altair One? 云端門戶與 NVIDIA Omniverse 實時數(shù)字孿生藍圖完成全面整合
使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)
NVIDIA助力解決量子計算領(lǐng)域重大挑戰(zhàn)
NVIDIA GPU助力科研人員探索外星世界
上汽乘用車與美團達成戰(zhàn)略合作
豐田、Aurora和大陸集團加入NVIDIA合作伙伴行列
GPU加速云服務(wù)器怎么用的
NVIDIA預(yù)測2025年AI行業(yè)發(fā)展
《CST Studio Suite 2024 GPU加速計算指南》
全新NVIDIA NIM微服務(wù)實現(xiàn)突破性進展
AMD與NVIDIA GPU優(yōu)缺點
使用NVIDIA Edify助力的服務(wù)創(chuàng)建3D資產(chǎn)和虛擬環(huán)境照明

評論