女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

實踐經驗:在深度學習中喂飽GPU

DPVg_AI_era ? 來源:lq ? 2019-09-13 17:07 ? 次閱讀

深度學習模型訓練是不是大力出奇跡,顯卡越多越好?非也,沒有512張顯卡,也可以通過一些小技巧優化模型訓練。本文作者分析了他的實踐經驗。

前段時間訓練了不少模型,發現并不是大力出奇跡,顯卡越多越好,有時候 1 張 v100 和 2 張 v100 可能沒有什么區別,后來發現瓶頸在其他地方,寫篇文章來總結一下自己用過的一些小 trick,最后的效果就是在 cifar 上面跑 vgg 的時間從一天縮到了一個小時,imagenet 上跑 mobilenet 模型只需要 2 分鐘每個 epoch。(文章末尾有代碼啦)

先說下跑 cifar 的時候,如果只是用 torchvision 的 dataloader (用最常見的 padding/crop/flip 做數據增強) 會很慢,大概速度是下面這種,600 個 epoch 差不多要一天多才能跑完,并且速度時快時慢很不穩定。

我最初以為是 IO 的原因,于是掛載了一塊內存盤,改了一下路徑接著用 torchvision 的 dataloader 來跑,速度基本沒啥變化。。。

然后打開資源使用率看了下發現 cpu 使用率幾乎已經滿了(只能申請 2cpu 和一張 v100...),但是 gpu 的使用率非常低,這基本可以確定瓶頸是在 cpu 的處理速度上了。

后來查了一些資料發現 nvidia 有一個庫叫 dali 可以用 gpu 來做圖像的前處理,從輸入,解碼到 transform 的一整套 pipeline,看了下常見的操作比如 pad/crop 之類的還挺全的,并且支持 pytorch/caffe/mxnet 等各種框架。

可惜在官方文檔中沒找到 cifar 的 pipeline,于是自己照著 imagenet 的版本寫了個,最初踩了一些坑(為了省事找了個 cifar 的 jpeg 版本來解碼,發現精度掉得很多還找不到原因,還得從 cifar 的二進制文件來讀取),最后總歸是達到了同樣的精度,再來看一看速度和資源使用率,總時間直接從一天縮短為一小時,并且 gpu 使用率高了很多。

再說下 imagenet 的訓練加速,最初也是把整個數據集拷到了掛載的內存盤里面(160g 大概夠用了,從拷貝到解壓完成大概 10 分鐘不到),發現同樣用 torchvision 的 dataloader 訓練很不穩定,于是直接照搬了 dali 官方的 dataloader 過來,速度也是同樣起飛 hhhh(找不到當時訓練的圖片了),然后再配合 apex 的混合精度和分布式訓練,申請 4 塊 v100,gpu 使用率可以穩定在 95 以上,8 塊 v100 可以穩定在 90 以上,最后直接上到 16 張 v100 和 32cpu,大概也能穩定在 85 左右(看資源使用率發現 cpu 到頂了,不然估計 gpu 也能到 95 以上),16 塊 v100 在 ImageNet 上跑 mobilenet 只需要 2 分鐘每個 epoch。

寫的 dataloader 放到了 github 上,我測試的精度跟 torchvision 的版本差不多,不過速度上會比 torchvision 快很多,后面有空也會寫一些其他常用 dataloader 的 dali 版本放上去。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4915

    瀏覽量

    130714
  • 數據集
    +關注

    關注

    4

    文章

    1223

    瀏覽量

    25291
  • 深度學習
    +關注

    關注

    73

    文章

    5555

    瀏覽量

    122526

原文標題:在深度學習中喂飽GPU

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    安世半導體全球化發展實踐經驗與前瞻思考

    此前,4月4日至6日,第28屆哈佛大學中國論壇成功舉辦。聞泰科技半導體業務(安世半導體)董事長兼CEO張學政受邀出席,并在“智能時代的變革與未來”分論壇上發表精彩觀點,與行業領袖共同探討全球化、技術迭代與社會責任等議題,分享百年半導體公司全球化發展
    的頭像 發表于 04-12 14:52 ?647次閱讀

    深度學習工作負載GPU與LPU的主要差異

    ,一個新的競爭力量——LPU(Language Processing Unit,語言處理單元)已悄然登場,LPU專注于解決自然語言處理(NLP)任務的順序性問題,是構建AI應用不可或缺的一環。 本文旨在探討深度學習工作負載
    的頭像 發表于 12-09 11:01 ?3255次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b>工作負載<b class='flag-5'>中</b><b class='flag-5'>GPU</b>與LPU的主要差異

    GPU深度學習的應用 GPUs圖形設計的作用

    隨著人工智能技術的飛速發展,深度學習作為其核心部分,已經成為推動技術進步的重要力量。GPU(圖形處理單元)深度
    的頭像 發表于 11-19 10:55 ?1498次閱讀

    NPU深度學習的應用

    設計的硬件加速器,它在深度學習的應用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對深度學習算法優化的處理器,它與傳統的CPU和
    的頭像 發表于 11-14 15:17 ?1746次閱讀

    pcie深度學習的應用

    深度學習模型通常需要大量的數據和強大的計算能力來訓練。傳統的CPU計算資源有限,難以滿足深度學習的需求。因此,GPU(圖形處理單元)和TPU
    的頭像 發表于 11-13 10:39 ?1249次閱讀

    AI干貨補給站 | 深度學習與機器視覺的融合探索

    智能制造的浪潮,阿丘科技作為業界領先的工業AI視覺平臺及解決方案提供商,始終致力于推動AI+機器視覺技術的革新與應用。為此,我們特別開設了「AI干貨補給站」專欄,分享此領域的基礎知識及實踐經驗
    的頭像 發表于 10-29 08:04 ?537次閱讀
    AI干貨補給站 | <b class='flag-5'>深度</b><b class='flag-5'>學習</b>與機器視覺的融合探索

    GPU深度學習應用案例

    GPU深度學習的應用廣泛且重要,以下是一些GPU深度
    的頭像 發表于 10-27 11:13 ?1139次閱讀

    深度學習GPU加速效果如何

    圖形處理器(GPU)憑借其強大的并行計算能力,成為加速深度學習任務的理想選擇。
    的頭像 發表于 10-17 10:07 ?548次閱讀

    FPGA做深度學習能走多遠?

    的發展前景較為廣闊,但也面臨一些挑戰。以下是一些關于 FPGA 深度學習應用前景的觀點,僅供參考: ? 優勢方面: ? 高度定制化的計算架構:FPGA 可以根據
    發表于 09-27 20:53

    深度學習算法集成電路測試的應用

    隨著半導體技術的快速發展,集成電路(IC)的復雜性和集成度不斷提高,對測試技術的要求也日益增加。深度學習算法作為一種強大的數據處理和模式識別工具,集成電路測試領域展現出了巨大的應用潛力。本文將從
    的頭像 發表于 07-15 09:48 ?1732次閱讀

    深度學習的時間序列分類方法

    的發展,基于深度學習的TSC方法逐漸展現出其強大的自動特征提取和分類能力。本文將從多個角度對深度學習時間序列分類
    的頭像 發表于 07-09 15:54 ?1966次閱讀

    深度學習的無監督學習方法綜述

    應用往往難以實現。因此,無監督學習深度學習扮演著越來越重要的角色。本文旨在綜述
    的頭像 發表于 07-09 10:50 ?1578次閱讀

    深度學習視覺檢測的應用

    深度學習是機器學習領域中的一個重要分支,其核心在于通過構建具有多層次的神經網絡模型,使計算機能夠從大量數據自動學習并提取特征,進而實現對復
    的頭像 發表于 07-08 10:27 ?1196次閱讀

    深度學習的模型權重

    深度學習這一充滿無限可能性的領域中,模型權重(Weights)作為其核心組成部分,扮演著至關重要的角色。它們不僅是模型學習的基石,更是模型智能的源泉。本文將從模型權重的定義、作用、優
    的頭像 發表于 07-04 11:49 ?3858次閱讀

    深度學習自動駕駛的關鍵技術

    隨著人工智能技術的飛速發展,自動駕駛技術作為其中的重要分支,正逐漸走向成熟。自動駕駛系統深度學習技術發揮著至關重要的作用。它通過模擬人腦的學習
    的頭像 發表于 07-01 11:40 ?1210次閱讀