女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA助力騰訊助力“開(kāi)悟”AI開(kāi)放研究平臺(tái)

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:NVIDIA ? 2022-04-21 10:47 ? 次閱讀

案例簡(jiǎn)介

? 本案例中通過(guò)NVIDIA V100 GPUTensorRT,騰訊“開(kāi)悟”AI開(kāi)放研究平臺(tái)將強(qiáng)化學(xué)習(xí)模型訓(xùn)練中的自對(duì)弈推理部分,從CPU遷移到GPU上,實(shí)現(xiàn)了10倍的加速,并使推理成本下降90%,整體訓(xùn)練成本下降 67%。

? 本案例主要應(yīng)用到 NVIDIA V100 GPU 和 TensorRT。

客戶簡(jiǎn)介及應(yīng)用背景

騰訊一直積極地推動(dòng)強(qiáng)化學(xué)習(xí)在游戲AI領(lǐng)域的發(fā)展,并在2019年推出了“開(kāi)悟”AI開(kāi)放研究平臺(tái),提供不同游戲的訓(xùn)練場(chǎng)景、支撐AI進(jìn)行強(qiáng)化訓(xùn)練的大規(guī)模算力、統(tǒng)一的強(qiáng)化學(xué)習(xí)框架以加速研發(fā)速度、通用的訓(xùn)練與推理服務(wù),加快AI訓(xùn)練速度。

客戶挑戰(zhàn)

和圖像以及語(yǔ)音的訓(xùn)練方式不同,目前在游戲AI訓(xùn)練上表現(xiàn)最好的方式是強(qiáng)化學(xué)習(xí)。強(qiáng)化學(xué)習(xí)除了需要大量的算力來(lái)訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò)之外,還需要一個(gè)自對(duì)弈的模塊用來(lái)產(chǎn)生訓(xùn)練數(shù)據(jù)。在自對(duì)弈模塊當(dāng)中,會(huì)模擬游戲環(huán)境,并且選擇不同時(shí)期的模型來(lái)操控游戲內(nèi)的角色,AI對(duì)游戲內(nèi)角色的每一操控都需要對(duì)模型進(jìn)行一次前向推理。由于更新模型的訓(xùn)練數(shù)據(jù)來(lái)自于自對(duì)弈模塊,因此自對(duì)弈的推理速度會(huì)對(duì)整個(gè)模型的訓(xùn)練速度和效果造成非常大的影響。

而自對(duì)弈推理每一次前向推理對(duì)延時(shí)的要求比實(shí)際的線上服務(wù)小,因此常見(jiàn)的方式是通過(guò)CPU來(lái)進(jìn)行自對(duì)弈中的推理,但CPU成本太高。為了提高自對(duì)弈的速度與吞吐,減少推理成本,騰訊希望在“開(kāi)悟”AI開(kāi)放研究平臺(tái)里面充分利用GPU去進(jìn)行自對(duì)弈中的模型前向推理。

應(yīng)用方案

為了解決上述在自對(duì)弈推理當(dāng)中GPU利用率不高的問(wèn)題, 騰訊“開(kāi)悟”AI開(kāi)放研究平臺(tái)選擇使用NVIDIA V100 GPU和NVIDIA TensorRT推理引擎來(lái)加速推理。

為了自動(dòng)化地將模型從TensorFlow轉(zhuǎn)換到TensorRT, 騰訊“開(kāi)悟”AI開(kāi)放研究平臺(tái)一開(kāi)始通過(guò)自行開(kāi)發(fā)parser,將TensorFlow的算子映射到TensorRT的算子。同時(shí),為了支持更廣泛的模型與算子,減少維護(hù)和開(kāi)發(fā)的成本, 騰訊“開(kāi)悟”AI開(kāi)放研究平臺(tái)也積極地與NVIDIA合作,推動(dòng)從TensorFlow轉(zhuǎn)換成ONNX模型,再通過(guò)TensorRT ONNX parser轉(zhuǎn)換到TensorRT的流程。

在自對(duì)弈的過(guò)程中,需要頻繁地更新模型的權(quán)重,讓自對(duì)弈模型始終能保持在較新的狀態(tài)。這個(gè)更新的頻率大概幾分鐘一次,每次必須限制在幾百個(gè)毫秒。如果通過(guò)重新build engine 的方式來(lái)更新模型的話,無(wú)法滿足上述要求。因此 騰訊“開(kāi)悟”AI開(kāi)放研究平臺(tái)采用 TensorRT refit engine的功能來(lái)更新權(quán)重。同時(shí),為了對(duì)更新權(quán)重有更好的支持、以及支持更多的算子, 騰訊“開(kāi)悟”AI開(kāi)放研究平臺(tái)從原本的TensorRT 5 升級(jí)到TensorRT 7。

TensorRT 7雖然在部分算子上支持權(quán)重更新,但并不支持LSTM這個(gè)在游戲AI當(dāng)中很重要的算子。為了解決這個(gè)問(wèn)題, 騰訊“開(kāi)悟”AI開(kāi)放研究平臺(tái)通過(guò)開(kāi)發(fā)TensorRT插件的方式封裝LSTM算子,并在插件當(dāng)中更新權(quán)重。

為了充分利用NVIDIA V100 GPU的Tensor core, 騰訊“開(kāi)悟”AI開(kāi)放研究平臺(tái)希望能夠使用TensorRT FP16精度來(lái)加速推理。由于TensorRT對(duì)FP16的支持非常成熟和簡(jiǎn)便,整個(gè)推理流程很快被切換到FP16,并取得了2倍左右的加速。

尋找模型推理時(shí)的性能瓶頸,通過(guò)開(kāi)發(fā)TensorRT插件進(jìn)行算子融合,進(jìn)一步地提升推理的速度。

在完成以上的工作之后,對(duì)比TensorFlow的基礎(chǔ)版本,TensorRT 7 能提供5倍以上的加速效果。

使用效果及影響

通過(guò)NVIDIA V100 GPU以及TensorRT推理引擎加速自對(duì)弈訓(xùn)練的推理部分,騰訊“開(kāi)悟”AI開(kāi)放研究平臺(tái)極大地提升了自對(duì)弈推理的吞吐量與速度,進(jìn)一步地提升了整個(gè)模型訓(xùn)練的速度與降低訓(xùn)練成本,加快模型迭代的周期。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5246

    瀏覽量

    105787
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4912

    瀏覽量

    130675
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    34280

    瀏覽量

    275465
收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA助力解決量子計(jì)算領(lǐng)域重大挑戰(zhàn)

    NVIDIA 加速量子研究中心提供了強(qiáng)大的工具,助力解決量子計(jì)算領(lǐng)域的重大挑戰(zhàn)。
    的頭像 發(fā)表于 03-27 09:17 ?475次閱讀

    NVIDIA AI Enterprise助力AI智能體重構(gòu)工作模式

    無(wú)論是為人道主義援助、客戶服務(wù)還是醫(yī)療健康而開(kāi)發(fā),基于NVIDIA AI Enterprise軟件平臺(tái)構(gòu)建的 AI 智能體構(gòu)成了新型數(shù)字勞動(dòng)力,幫助專(zhuān)業(yè)人士以更低的成本、更大的影響力來(lái)
    的頭像 發(fā)表于 03-25 14:59 ?420次閱讀

    Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開(kāi)發(fā)

    和 Renesas一直致力于推動(dòng)開(kāi)源生態(tài)的發(fā)展,并積極合作打造高效、開(kāi)放的計(jì)算平臺(tái)。BPI-AI2N & BPI-AI2N Carrier 的發(fā)布,不僅為開(kāi)發(fā)者提供了強(qiáng)大的硬
    發(fā)表于 03-19 17:54

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    Oracle Cloud Infrastructure (OCI) 與 NVIDIA AI Enterprise 軟件平臺(tái)之間的集成,將使 160 多個(gè) AI 工具和 100 多個(gè)
    發(fā)表于 03-19 15:24 ?310次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作<b class='flag-5'>助力</b>企業(yè)加速代理式 <b class='flag-5'>AI</b> 推理

    NVIDIA 推出開(kāi)放推理 AI 模型系列,助力開(kāi)發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺(tái)

    月 18 日 —— ?NVIDIA 今日發(fā)布具有推理功能的開(kāi)源 Llama Nemotron 模型系列,旨在為開(kāi)發(fā)者和企業(yè)提供業(yè)務(wù)就緒型基礎(chǔ),助力構(gòu)建能夠獨(dú)立工作或以團(tuán)隊(duì)形式完成復(fù)雜任務(wù)的高級(jí) AI 智能體。
    發(fā)表于 03-19 09:31 ?201次閱讀
    <b class='flag-5'>NVIDIA</b> 推出<b class='flag-5'>開(kāi)放</b>推理 <b class='flag-5'>AI</b> 模型系列,<b class='flag-5'>助力</b>開(kāi)發(fā)者和企業(yè)構(gòu)建代理式 <b class='flag-5'>AI</b> <b class='flag-5'>平臺(tái)</b>

    借助NVIDIA AI Foundry平臺(tái)推動(dòng)醫(yī)療健康與生命科學(xué)行業(yè)發(fā)展

    借助 NVIDIA AI Foundry,全球領(lǐng)先的臨床研究與商業(yè)服務(wù)提供商 IQVIA 將為其全球生命科學(xué)領(lǐng)域的客戶提供 AI 智能體,助力
    的頭像 發(fā)表于 01-17 09:59 ?530次閱讀

    NVIDIA推出開(kāi)放式Llama Nemotron系列模型

    作為 NVIDIA NIM 微服務(wù),開(kāi)放式 Llama Nemotron 大語(yǔ)言模型和 Cosmos Nemotron 視覺(jué)語(yǔ)言模型可在任何加速系統(tǒng)上為 AI 智能體提供強(qiáng)效助力
    的頭像 發(fā)表于 01-09 11:11 ?640次閱讀

    NVIDIA發(fā)布Cosmos?平臺(tái)助力物理AI系統(tǒng)發(fā)展

    NVIDIA近日宣布推出全新的NVIDIA Cosmos?平臺(tái),該平臺(tái)專(zhuān)為自動(dòng)駕駛汽車(chē)(AV)和機(jī)器人等物理AI系統(tǒng)而設(shè)計(jì),旨在推動(dòng)這些領(lǐng)域
    的頭像 發(fā)表于 01-08 15:36 ?582次閱讀

    NVIDIA推出面向RTX AI PC的AI基礎(chǔ)模型

    NVIDIA 今日發(fā)布能在 NVIDIA RTX AI PC 本地運(yùn)行的基礎(chǔ)模型,為數(shù)字人、內(nèi)容創(chuàng)作、生產(chǎn)力和開(kāi)發(fā)提供強(qiáng)大助力
    的頭像 發(fā)表于 01-08 11:01 ?487次閱讀

    騰訊AI助力FAST發(fā)現(xiàn)51顆脈沖星

    近日,騰訊云在天文探索領(lǐng)域取得了顯著成果。截至目前,騰訊云憑借強(qiáng)大的AI技術(shù),已經(jīng)成功助力中國(guó)天眼FAST(五百米口徑球面射電望遠(yuǎn)鏡)發(fā)現(xiàn)了51顆脈沖星。這一成果不僅展示了
    的頭像 發(fā)表于 12-02 10:27 ?493次閱讀

    NVIDIA助力企業(yè)創(chuàng)建定制AI應(yīng)用

    NVIDIA 近日宣布與眾多技術(shù)領(lǐng)導(dǎo)者一同使用最新NVIDIA NIM Agent Blueprint以及NVIDIA NeMo和NVIDIA NIM微服務(wù),幫助企業(yè)創(chuàng)建定制
    的頭像 發(fā)表于 11-20 09:12 ?657次閱讀

    NVIDIA AI助力初創(chuàng)企業(yè)為心理治療師提供AI工具

    NVIDIA AI 助力初創(chuàng)企業(yè)為心理治療師提供 AI 工具,以此來(lái)優(yōu)化和提升心理健康服務(wù)水平,為人們的心理健康保駕護(hù)航。
    的頭像 發(fā)表于 11-19 16:03 ?519次閱讀

    NVIDIA AI助力實(shí)現(xiàn)更好的癌癥檢測(cè)

    由美國(guó)頂級(jí)醫(yī)療中心和研究機(jī)構(gòu)的專(zhuān)家組成了一個(gè)專(zhuān)家委員會(huì),該委員會(huì)正在使用 NVIDIA 支持的聯(lián)邦學(xué)習(xí)來(lái)評(píng)估聯(lián)邦學(xué)習(xí)和 AI 輔助注釋對(duì)訓(xùn)練 AI 腫瘤分割模型的影響。
    的頭像 發(fā)表于 11-19 15:54 ?444次閱讀

    NVIDIA開(kāi)放計(jì)算項(xiàng)目捐贈(zèng)Blackwell平臺(tái)設(shè)計(jì)

    近日,在美國(guó)加利福尼亞州舉行的 OCP 全球峰會(huì)上,NVIDIA 宣布已把 NVIDIA Blackwell 加速計(jì)算平臺(tái)的一些基礎(chǔ)元素捐贈(zèng)給開(kāi)放計(jì)算項(xiàng)目(OCP),并擴(kuò)大
    的頭像 發(fā)表于 11-19 15:30 ?551次閱讀

    賴(lài)耶科技通過(guò)NVIDIA AI Enterprise平臺(tái)打造超級(jí)AI工廠

    NVIDIA 技術(shù)團(tuán)隊(duì)保持合作。賴(lài)耶科技通過(guò)NVIDIA AI Enterprise平臺(tái)打造的超級(jí) AI 工廠,致力于加速大模型場(chǎng)景應(yīng)用
    的頭像 發(fā)表于 11-19 14:55 ?933次閱讀