女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

神經網絡的黑盒屬性,一直是困擾研究人員和開發者最頭疼的問題之一

DPVg_AI_era ? 來源:lq ? 2018-12-20 09:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

神經網絡的黑盒屬性,一直是困擾研究人員和開發者最頭疼的問題之一。以至于大家給神經網絡戴了了一個煉丹術的帽子。但是OpenAI發現,梯度噪聲量表是一種簡單的統計度量,可以預測神經網絡訓練在各種任務中的可并行性。

由于復雜的任務往往具有更嘈雜的梯度,因此越來越大的batch計算包,可能在將來變得有用,從而消除了AI系統進一步增長的一個潛在限制。

更廣泛地說,這些結果表明神經網絡訓練不需要被認為是一種煉丹術,而是可以被量化和系統化。

在過去的幾年里,AI研究人員通過數據并行技術,在加速神經網絡訓練方面取得了越來越大的成功,數據并行性將大batch數據分散到許多機器上。

研究人員成功地使用了成各種的batch進行圖像分類和語言建模,甚至玩Dota 2。

這些大batch數據允許將越來越多的計算量有效地投入到單個模型的訓練中,并且是人工智能訓練計算快速增長的重要推動者。

但是,batch如果太大,則梯度消失。并且不清楚為什么這些限制對于某些任務影響更大而對其他任務影響較小。

我們已經發現,通過測量梯度噪聲標度,一個簡單的統計量來量化網絡梯度的信噪比,我們可以近似預測最大有效batch大小。

同理,噪聲尺度可以測量模型所見的數據變化(在訓練的給定階段)。當噪聲規模很小時,快速并行查看大量數據變得多余;反之,我們仍然可以從大batch數據中學到很多東西。

這種類型的統計數據被廣泛用于樣本量選擇,并且已被提議用于深度學習,但尚未被系統地測量或應用于現代訓練運行。

我們對上圖所示的各種機器學習任務進行了驗證,包括圖像識別,語言建模,Atari游戲和Dota。

由于大batch通常需要仔細和昂貴的調整或特殊高效的學習率,因此提前知道上限在訓練新模型方面提供了顯著的實際優勢。

我們發現,根據訓練的現實時間和我們用于進行訓練的總體積計算(與美元成本成比例)之間的權衡,可視化這些實驗的結果是有幫助的。

在非常小的batch的情況下,batch加倍可以讓我們在不使用額外計算的情況下減少一半的訓練。在非常大的batch,更多的并行化不會導致更快的訓練。中間的曲線中存在“彎曲”,漸變噪聲標度預測彎曲發生的位置。

我們通過設置性能水平(比如在Beam Rider的Atari游戲中得分為1000)來制作這些曲線,并觀察在不同batch大小下訓練到該性能所需的時間。 結果與績效目標的許多不同值相對較緊密地匹配了我們模型的預測。

梯度噪聲尺度中的模式

我們在梯度噪聲量表中觀察到了幾種模式,這些模式提供了人工智能訓練未來可能存在的線索。

首先,在我們的實驗中,噪聲標度通常在訓練過程中增加一個數量級或更多。

直觀地,這意味著網絡在訓練早期學習任務的“更明顯”的特征,并在以后學習更復雜的特征。

例如,在圖像分類器的情況下,網絡可能首先學習識別大多數圖像中存在的小尺度特征(例如邊緣或紋理),而稍后將這些部分組合成更一般的概念,例如貓和狗。

要查看各種各樣的邊緣或紋理,網絡只需要看到少量圖像,因此噪聲比例較小;一旦網絡更多地了解更大的對象,它就可以一次處理更多的圖像,而不會看到重復的數據。

我們看到一些初步跡象表明,在同一數據集上不同模型具有相同的效果。更強大的模型具有更高的梯度噪聲標度,但這僅僅是因為它們實現了更低的損耗。

因此,有一些證據表明,訓練中增加的噪聲比例不僅僅是收斂的假象,而是因為模型變得更好。如果這是真的,那么我們期望未來的更強大的模型具有更高的噪聲規模,因此可以更加并行化。

在監督學習的背景下,從MNIST到SVHN到ImageNet都有明顯的進展。在強化學習的背景下,從Atari Pong到Dota 1v1到Dota 5v5有明顯的進展,最佳batch大小相差10,000倍以上。

因此,隨著AI進入新的和更困難的任務,我們希望模型能夠容忍更高的batch。

啟示

數據并行度顯著影響AI功能的進展速度。更快的訓練使更強大的模型成為可能,并通過更快的迭代時間加速研究。

在早期研究中,我們觀察到用于訓練最大ML模型的計算,每3.5個月翻一番。我們注意到這種趨勢是由經濟能力和算法并行訓練的能力共同決定的。

后一因素(算法可并行性)更難以預測,其局限性尚不清楚,但我們目前的結果代表了系統化和量化的一步。

特別是,我們有證據表明,在同一任務中,更困難的任務和更強大的模型將允許比我們迄今為止看到的更激進的數據并行性,這為訓練計算的持續快速指數增長提供了關鍵驅動因素。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4812

    瀏覽量

    103286
  • 圖像分類
    +關注

    關注

    0

    文章

    96

    瀏覽量

    12142
  • 機器學習
    +關注

    關注

    66

    文章

    8499

    瀏覽量

    134394

原文標題:OpenAI發現打破神經網絡黑盒魔咒新思路:梯度噪聲量表

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    人類首創能生成神經細胞的“迷你大腦”,更精確模擬神經網絡

    ”,可以為細胞提供與實際人類大腦相似的交互環境,研究人員可以在這些環境中更清晰地觀察大腦的發育和功能,研究相關大腦疾病的療法,并對有應用前景的新藥物進行測試。髓鞘是種覆蓋在神經纖維上
    發表于 08-21 09:26

    【案例分享】ART神經網絡與SOM神經網絡

    今天學習了兩個神經網絡,分別是自適應諧振(ART)神經網絡與自組織映射(SOM)神經網絡。整體感覺不是很難,只不過些最基礎的概念容易理解不清。首先ART
    發表于 07-21 04:30

    如何設計BP神經網絡圖像壓縮算法?

    神經網絡(Neural Networks)是人工神經網絡(Ar-tificial Neural Networks)的簡稱,是當前的研究熱點之一。人腦在接受視覺感官傳來的大量圖像信息后,
    發表于 08-08 06:11

    如何移植個CNN神經網絡到FPGA中?

    訓練神經網絡并移植到Lattice FPGA上,通常需要開發人員既要懂軟件又要懂數字電路設計,是個不容易的事。好在FPGA廠商為我們提供了許多工具和IP,我們可以在這些工具和IP的基礎上做
    發表于 11-26 07:46

    人工智能發展第階段

    化學會志》期刊報導項新的研究成果:研究人員開發種可用近紅外光激發的電壓熒光納米探針,并用它監測斑馬魚和小鼠腦中
    發表于 07-28 07:51

    matlab實現神經網絡 精選資料分享

    神經神經網絡,對于神經網絡的實現是如何一直沒有具體實現下:現看到個簡單的
    發表于 08-18 07:25

    卷積神經網絡模型發展及應用

    network,DBN)[24], 從此拉開了深度學習大幕。隨著深度學習理論的研究和發展,研究人員提 出了系列卷積神經網絡模型。為了比較不同模型 的質量,收集并整理了文獻中模型在分
    發表于 08-02 10:39

    機器人神經網絡逆系統阻抗控制方法研究

    機器人動力學控制由于其數學模型的不確定性,一直是困擾該領域的難題之一。本文研究了通過神經網絡逆系統方法實現機器人的解耦,然后在外環施加控制的
    發表于 01-11 16:54 ?11次下載

    詳細解析神經網絡的含義、挑戰、類型、應用

    Statsbot深度學習開發者Jay Shah帶你入門神經網絡起了解自動編碼器、卷積神經網絡、循環神經網絡等流行的
    的頭像 發表于 01-15 17:11 ?9613次閱讀

    研究人員開發解釋多義詞的神經網絡

    艾倫人工智能研究所和華盛頓大學的研究人員正在使用可以根據上下文來確定英文單詞含義的神經網絡
    的頭像 發表于 09-12 15:52 ?2429次閱讀

    研究人員開發種新穎的機器學習管道

    研究人員通過種特殊的神經網絡模型,它以“基本塊”(計算指令的基本摘要)形式訓練標記的數據,以自動預測其持續時間使用給定的芯片執行以前看不見的基本塊。結果表明,這種神經網絡模型的性能要
    的頭像 發表于 04-15 16:42 ?2004次閱讀

    BERT是種用于自然語言處理的先進神經網絡方法

    您今天可能已經與BERT網絡進行了互動。這是Google搜索引擎的基礎技術之一,自Google于2018年發布BERT以來,它一直引起研究人員的興奮。BERT是
    的頭像 發表于 12-13 10:08 ?4008次閱讀

    研究人員開發“液態”神經網絡 可適應快速變化的訓練環境

    設計出了種具有重大改進的“液態”神經網絡。其特點是能夠在投入訓練階段之后,極大地擴展 AI 技術的靈活性。 通常情況下,研究人員會在訓練階段向神經網絡算法提供大量相關的目標數據,來磨
    的頭像 發表于 01-29 10:46 ?1746次閱讀

    神經網絡的基本原理

    神經網絡,作為人工智能領域的個重要分支,其基本原理和運作機制一直是人們研究的熱點。神經網絡的基本原理基于對人類大腦
    的頭像 發表于 07-01 11:47 ?2335次閱讀

    卷積神經網絡的實現工具與框架

    卷積神經網絡因其在圖像和視頻處理任務中的卓越性能而廣受歡迎。隨著深度學習技術的快速發展,多種實現工具和框架應運而生,為研究人員開發者提供了強大的支持。 TensorFlow 概述
    的頭像 發表于 11-15 15:20 ?643次閱讀