女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

和谷歌研究人員一起探索數據并行的邊界極限

nlfO_thejiangme ? 來源:YXQ ? 2019-03-22 08:51 ? 次閱讀

在過去的幾年里,神經網絡在圖像分類、機器翻譯和語音識別等領域獲得了長足的進步,取得了十分優異的結果。這樣的成績離不開軟件和硬件的對訓練過程的加速和改進。更快速的訓練使得模型質量飛速提升,不僅在相同的時間內可以處理更多的數據,也使得研究人員得以迅速嘗試更多的想法,研究出更好的模型。

隨著軟硬件和數據中心云計算的迅速發展,支撐神經網絡的算力大幅提升,讓模型訓練地又好又快。但該如何利用這前所未有的算力來得到更好的結果是擺在所有研究人員面前的一個問題,我們是否應該用更大的算力來實現更快的訓練呢?

并行計算

分布式計算是使用大規模算力最常用的方法,可以同時使用不同平臺和不同架構的處理器。在訓練神經網絡的時候,一般會使用模型并行和數據并行兩種方式。其中模型并行會將模型分別置于不同的計算單元上,使得大規模的模型訓練成為可能,但通常需要對網絡架構進行裁剪以適應不同的處理器。而數據并行著是將訓練樣本分散在多個計算單元上,并將訓練結果進行同步。

數據并行幾乎可以用于任何模型的訓練加速,它是目前使用最為廣泛也最為簡單的神經網絡并行訓練手段。對于想SGD等常見的訓練優化算法來說,數據并行的規模與訓練樣本的批量大小息息相關。我們需要探索對于數據并行方法的局限性,以及如何充分利用數據并行方法來加速訓練。

實驗中使用的模型、數據集和優化器。

谷歌的研究人員在先前的研究中評測了數據并行對于神經網絡訓練的影響,深入探索了批次(batch)的大小與訓練時間的關系,并在六種不同的神經網絡/數據集上利用三種不同的優化方法進行了測試。在實驗中研究人員在約450個負載上訓練了超過100k個模型并發現了訓練時間與批量大小的關系。

研究人員分別從數據集、網絡架構、優化器等角度探索了這一關系的變化,發現在不同的負載上訓練時間和批量大小的關系發生了劇烈的變化。研究結果中包含了71M個模型的測評結果,完整的描繪了100k個模型的訓練曲線,并在論文中的24個圖中充分體現了出來。

訓練時間與批量大小間的普遍聯系

在理想的數據并行系統中,模型間的同步時間可忽略不計,訓練時間可以使用訓練的步數(steps)來測定。在這一假設下,研究人員從實驗的結果中發現了三個區間的關系:在完美區間內訓練時間隨著批量大小線性減小,隨之而來的是遞減拐點,最后將達到最大數據并行的極限,無論如何增大批量的大小即使不考慮硬件,模型的訓練時間也不會明顯減小。

盡管上述的基本關系在不同測試中成立,但研究人員發現上述過程中的拐點在不同數據集和神經網絡架構中的表現十分不同。這意味著簡單的數據并行可以再當今硬件極限的基礎上為某些工作提供加速,但除此之外有些工作也許還需要其他方法來充分利用大規模算力。

在上面的例子中可以看到,ResNet-8在CIFAR-10并不能從超過1024的批大小中獲得明顯的加速,而ResNet-50在ImageNet上則可以一直將批大小提升到65536以上來減小訓練時間。

優化任務

如果可以預測出哪一種負載最適合于數據并行訓練,我們就可以針對性的修改任務負載以充分利用硬件算力。但遺憾的是實驗結果并沒有給出一個明確的計算最大有效批次的方法。拐點與網絡架構、數據集、優化器都有著密切的關系。例如在相同的數據集和優化器上,不同的架構可能會有截然不同的最大可用批次數量。

研究人員認為這主要來源于網絡寬度和深度的不同,但對于某些網絡來說甚至沒有深度和寬度的概念,所以無法得到一個較為清晰的關系來計算最大可用批次數量。甚至當我們發現有的網絡架構可以接受更大的批次,但在不同數據集上的表現又無法得到統一的結論,有時小數據集上大批次的表現甚至要好于大數據上的結果。

fig 4圖中顯示了遷移模型和LSTM模型在相同數據集上最大批次的不同,右圖則顯示了較大的數據集與最大batch也沒有絕對的相關性,LM1B規模較小但可以達到較大的batch。但毋庸置疑的是,在優化算法上的微小改動都會使得訓練結果在增加批量大小的過程中發生極大的變化。這意味著我們可以通過設計新的優化器來最大化的利用數據并行的能力。

未來的工作

雖然利用通過增加批量大小來提高數據并行能力是提速的有效手段,但由于衰減效應的存在無法達到硬件的極限能力。研究表明優化算法也許可以指導我們找到充分利用硬件算力的解決方案。研究人員未來的工作將集中于對于不同優化器的測評,探索恩能夠加速數據并行能力的新方法,盡可能的延伸批量大小對應訓練時間的加速范圍。

如果想探索研究人員們在千百個模型上訓練出的數據,可以直接訪問colab:https://colab.research.google.com/github/google-research/google-research/blob/master/batch_science/reproduce_paper_plots.ipynb詳細過程見論文包含了24個豐富完整的測評圖,描繪了神經網絡訓練過程各種參數隨批量變化的完整過程:https://arxiv.org/pdf/1811.03600.pdf

ref:https://ai.googleblog.com/2019/03/measuring-limits-of-data-parallel.html

Paper:https://arxiv.org/pdf/1811.03600.pdf

代碼:https://colab.research.google.com/github/google-research/google-research/blob/master/batch_science/reproduce_paper_plots.ipynb

https://blog.skymind.ai/distributed-deep-learning-part-1-an-introduction-to-distributed-training-of-neural-networks/https://blog.inten.to/hardware-for-deep-learning-part-3-gpu-8906c1644664?gi=bdd1e2e4331ehttps://ai.googleblog.com/2019/03/measuring-limits-of-data-parallel.htmlhttps://blog.csdn.net/xbinworld/article/details/74781605

Headpic from: https://dribbble.com/shots/4038074-Data-Center

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6223

    瀏覽量

    107517
  • 并行計算
    +關注

    關注

    0

    文章

    28

    瀏覽量

    9577
  • 分布式計算
    +關注

    關注

    0

    文章

    28

    瀏覽量

    4586

原文標題:和谷歌研究人員一起,探索數據并行的邊界極限

文章出處:【微信號:thejiangmen,微信公眾號:將門創投】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    研究人員開發出基于NVIDIA技術的AI模型用于檢測瘧疾

    瘧疾曾度在委內瑞拉銷聲匿跡,但如今正卷土重來。研究人員已經訓練出個模型來幫助檢測這種傳染病。
    的頭像 發表于 04-25 09:58 ?232次閱讀

    NVIDIA GPU助力科研人員探索外星世界

    NVIDIA GPU 驅動的深度學習在短短幾秒內解讀出了卡西尼號土星探測器多年來收集的海量數據,為科研人員探索外星世界提供了更加智能的方式。
    的頭像 發表于 02-27 10:37 ?495次閱讀

    AN-166:與Linduino一起飛行中更新

    電子發燒友網站提供《AN-166:與Linduino一起飛行中更新.pdf》資料免費下載
    發表于 01-12 10:09 ?0次下載
    AN-166:與Linduino<b class='flag-5'>一起</b>飛行中更新

    和Dr Peter一起學KiCad 4.8:設計規則檢查(DRC)

    和Dr Peter一起學KiCad 4.8:設計規則檢查(DRC)
    的頭像 發表于 12-25 14:55 ?1276次閱讀
    和Dr Peter<b class='flag-5'>一起</b>學KiCad 4.8:設計規則檢查(DRC)

    視覺AI之旅:一起探索 FiftyOne ——第二部分 入門指南

    /journey-into-visual-ai-exploring-fiftyone-together-part-ii-getting-started-14cca5adfcd3 ? ? ,前言 上次我們介紹了《視覺AI之旅:一起探索
    的頭像 發表于 12-24 17:00 ?285次閱讀
    視覺AI之旅:<b class='flag-5'>一起</b><b class='flag-5'>探索</b> FiftyOne ——第二部分  入門指南

    研究人員利用激光束開創量子計算新局面

    演示設備 威特沃特斯蘭德大學(Wits)的物理學家利用激光束和日常顯示技術開發出了種創新的計算系統,標志著在尋求更強大的量子計算解決方案方面取得了重大飛躍。 該大學結構光實驗室的研究人員取得的這
    的頭像 發表于 12-18 06:24 ?321次閱讀
    <b class='flag-5'>研究人員</b>利用激光束開創量子計算新局面

    NVIDIA與谷歌量子AI部門達成合作

    NVIDIA CUDA-Q 平臺使谷歌量子 AI 研究人員能夠為其量子計算機創建大規模的數字模型,以解決設計中面臨的各種挑戰
    的頭像 發表于 11-20 09:39 ?587次閱讀

    請問tas5731m PBTL模式,單聲道輸出(AB連一起,CD連一起)如何實現左右聲道的混音輸出?

    請問tas5731m PBTL模式,單聲道輸出(AB連一起,CD連一起)如何實現左右聲道的混音輸出 還有開發軟件里能直接拉線么
    發表于 10-17 06:23

    隔離電源的地能接在一起嗎,隔離電源能不能直接共地使用

    不能接在一起。在使用隔離電源時,需要將隔離電源的輸入和輸出端的地線分別接在接地柱和接地線上,而不能將它們接在一起。實際上,如果將隔離電源兩端的地線接在一起,會導致接地系統的干擾,降低系統的工作穩定性
    的頭像 發表于 10-01 16:27 ?6735次閱讀

    模擬地和電源地能接在一起

    模擬地和電源地是否能接在一起,取決于電子系統的具體要求和設計。在電子系統中,地(Ground)是個共同的參考點,用于構建電位參考平面。電源地是所有電源網絡的參考點,用于確保電源的穩定性和系統的正常工作。模擬地則與模擬電路相關,用于提供參考電位。
    的頭像 發表于 09-15 11:43 ?2861次閱讀

    谷歌研究人員推出革命性首個AI驅動游戲引擎

    在科技日新月異的今天,人工智能(AI)正以前所未有的速度滲透到我們生活的每個角落,從自動駕駛汽車到智能家居,無不彰顯著其巨大的潛力和無限可能。而最近,谷歌研究團隊的
    的頭像 發表于 08-29 17:21 ?745次閱讀

    可以將USB主機與Esp8266一起使用嗎?

    我可以將 USB 主機(USB A 型母頭)與 Esp8266 一起使用嗎? 為什么我不能使用它
    發表于 07-19 06:49

    研究人員:微生物電池可能會對遠程應用產生巨大影響

    粒土壤中可以包含宇宙般的微生物群,據估計數量可以多達100億。現在,位于英國巴斯的研究人員正在開發原型機技術,以收集些微生物物種呼出的電子。 這個想法是為了給低產出的傳感器和開
    的頭像 發表于 06-29 17:17 ?1868次閱讀

    谷歌發布新型大語言模型Gemma 2

    在人工智能領域,大語言模型直是研究的熱點。近日,全球科技巨頭谷歌宣布,面向全球研究人員和開發人員,正式發布了其最新研發的大語言模型——Ge
    的頭像 發表于 06-29 09:48 ?668次閱讀

    研究人員利用人工智能提升超透鏡相機的圖像質量

    研究人員利用深度學習技術提高了直接集成在 CMOS 成像芯片上的超透鏡相機(左)的圖像質量。超透鏡利用 1000 納米高的圓柱形氮化硅納米柱陣列(右圖)操縱光線。 研究人員利用深度學習技術提高了超
    的頭像 發表于 06-11 06:34 ?586次閱讀
    <b class='flag-5'>研究人員</b>利用人工智能提升超透鏡相機的圖像質量