女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

告別調參煉丹,使用隨機共享權重足矣!

2E1k_gh_baf5b3c ? 來源:陳年麗 ? 2019-08-28 17:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌大腦備受關注的“權重無關神經網絡”終于開源了!其關鍵思想是通過不再強調權重來搜索網絡結構,僅使用隨機共享的權重,也可以執行各種任務的神經網絡。終于可以不用調參煉丹了嗎?快來復現看看!

神經網絡訓練中 “權重” 有多重要不言而喻。但谷歌前段時間發表的研究表明,即使拋棄神經網絡權重訓練,使用隨機共享權重,也可以執行各種任務。

他們提出一種新的神經網絡結構的搜索方法——權重無關神經網絡(Weight Agnostic Neural Networks,WANN),其關鍵思想是通過不再強調權重來搜索網絡結構。

今天,該研究的兩位作者、谷歌大腦學生研究員 Adam Gaier和研究科學家David Ha在Google AI博客上撰文,介紹了該研究的核心思想和重要細節,并宣布WANN的代碼已經在GitHub上開源,以便讓廣泛的研究社區重現WANN實驗。

告別調參煉丹,使用隨機共享權重足矣!

當訓練神經網絡完成一項給定任務時,無論是圖像分類還是強化學習,通常都需要調優與網絡中每個連接相關的一組權重。另一種已經取得實質性進展的成功的神經網絡創建方法是神經架構搜索,它利用人工設計的組件(如卷積網絡組件或transformer blocks)來構建神經網絡架構。

研究表明,利用這些組件構建的神經網絡結構,如深度卷積網絡,對圖像處理任務具有很強的歸納偏差,甚至可以在權重隨機初始化的情況下執行。雖然神經架構搜索提供了一些新的方法,可以為當前的任務域安排具有已知歸納偏差的手工工程組件,但在自動發現具有此類歸納偏差的新神經網絡架構(用于不同的任務域)方面幾乎沒有進展。

我們可以用一個先天和后天的例子作為類比。正如生物學中某些從出生起就具有反捕食行為的物種一樣,他們無需學習就能執行復雜的運動和感官任務,或許我們可以構建一個不需要訓練就能很好地完成任務的神經網絡。當然,這些自然物種(作為類比,人工神經網絡)通過訓練可以得到進一步的改善,但它們即使不學習也能執行任務的能力表明,它們包含使它們非常適合于這些任務的偏差。

在“權重無關神經網絡”(WANN)論文中,我們提出了搜索具有這類偏差的網絡的第一步:即使使用隨機共享的權重,也可以執行各種任務的神經網絡架構。

我們在這項工作中的動機是,在不學習任何權重參數的情況下,僅神經網絡架構能在多大程度上編碼給定任務的解決方案。通過探索這樣的神經網絡架構,我們提出了一種無需學習權重參數就能在其環境中運行良好的智能體。

此外,為了促進該領域的進步,我們還開放了源代碼,以便更廣泛的研究社區重現我們的WANN實驗。

左圖:一個手工設計的、完全連接的深度神經網絡,有2760個權重連接。利用一種學習算法,我們可以求解2760個權重參數的集合,使該網絡能夠執行一個雙足步行任務(BipedalWalker-v2)。

右圖:一個權重無關的神經網絡架構,只有44個連接,但同樣能夠執行雙足步行任務。與完全連接網絡不同的是, WANN仍然可以執行任務,而不需要訓練每個連接的權重參數。實際上,為了簡化訓練,WANN被設計成在每個權重連接的值相同或共享時執行,甚至就算共享權重參數是隨機采樣的,也會起作用。

搜索權重無關神經網絡

我們從一組最小的神經網絡架構候選對象開始,每個候選對象只有很少的連接,并使用一個完善的拓撲搜索算法(NEAT),通過逐個地添加單個連接和單個節點來演化架構。

WANN背后的關鍵思想是通過不再強調權重來搜索架構。與傳統的神經架構搜索方法不同,新架構的所有權重參數都需要使用學習算法進行訓練,我們采用了一種更簡單、更有效的方法。

在搜索過程中,首先在每次迭代中為所有候選架構分配一個共享權重值,然后進行優化,以便在更寬的共享權重值范圍內執行良好。

用于搜索網絡拓撲空間的運算符

左:一個最小的網絡拓撲結構,輸入和輸出僅部分連接。

中間:網絡的改變有三種方式:

(1)插入節點:通過分割現有連接插入新節點。

(2)添加連接:通過連接兩個先前未連接的節點來添加一個新連接。

(3)更改激活:重新分配隱藏節點的激活函數。

右:可能的激活函數(線性,階躍,正弦, 余弦,高斯,tanh, sigmoid,inverse,絕對值,ReLU)

除了探索一系列與權重無關的神經網絡之外,重要的是還要尋找只需要復雜到它們所需的程度的網絡架構。我們利用多目標優化技術( multi-objective optimization),同時對網絡的性能和復雜度進行優化。

權重無關神經網絡搜索的概述,及其相應的網絡拓撲空間搜索算子。

訓練WANN架構

與傳統網絡不同的是,我們可以通過簡單地找到最佳的單個共享權重參數來訓練WANN,從而最大限度地提高其性能。在下面的例子中,可以看到我們的架構(在某種程度上)使用恒定的權重來完成一個 swing-up cartpole 任務:

WANN在不同的權重參數下執行 swing-up cartpole 任務,也使用微調的權重參數。

正如我們在上面的圖中看到的,雖然WANN可以使用一系列共享權重參數來執行其任務,但是其性能仍然無法與學習每個連接的權重的網絡相比較。

如果我們想進一步提高它的性能,我們可以使用WANN架構和最佳共享權重作為起點,使用學習算法微調每個連接的權重,就像通常訓練神經網絡的方法一樣。以網絡架構的權重無關特性為出發點,通過學習微調網絡的性能,可能有助于為理解動物如何學習提供有洞察力的類比。

通過在性能和網絡簡單性方面的多目標優化,我們的方法找到了一個簡單的WANN,用于賽車任務,它不需要顯式地訓練網絡的權重。

使用隨機權重的網絡架構不僅易于訓練,還具有其他優勢。例如,通過使用相同WANN架構的副本,但是為WANN的每個副本都分配不同的權重值,我們可以為同一任務創建多個不同模型的集合。這種集合通常比單個模型能獲得更好的性能。下面是一個MNIST分類器處理隨機權重的例子,可以說明這一點:

MNIST分類器進化為處理隨機權重。

具有隨機初始化的傳統網絡在 MNIST 上的精度約為 10%,但這種隨機權重的特殊網絡架構在 MNIST 上的精度 (》 80%) 明顯優于隨機初始化網絡。當使用一組WANNs,為每個WANN分配一個不同的共享權重時,精度提高到 》 90%。

即使不使用集成方法,也可以將網絡中的權重值壓縮到一個網絡,從而使網絡能夠快速調整。快速調整權重的能力可能在持續的終身學習(lifelong learning)中很有用,在這種學習中,agent在整個生命周期中獲得、適應和轉移技能。這使得WANN特別適合利用 Baldwin效應, Baldwin效應是一種進化壓力,即獎勵那些傾向于學習有用行為的個體,而不會陷入“learning to learn”這個昂貴的計算陷阱。

結論

我們希望這項工作可以作為一個墊腳石,幫助發現新的基礎神經網絡組件,如卷積網絡,其發現和應用已經在深度學習領域取得了令人難以置信的進展。自卷積神經網絡被發現以來,研究界可用的計算資源顯著增加。如果我們將這些資源投入到自動發現神經網絡架構中,并希望實現網絡架構的突破性改進,那么我們相信,使用新的構建塊來搜索也是值得的。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6231

    瀏覽量

    108110
  • 神經網絡
    +關注

    關注

    42

    文章

    4814

    瀏覽量

    103568

原文標題:“互聯網 + 海關”背景下,企業關務系統的選擇和應用以及與合規內控的結合

文章出處:【微信號:gh_baf5b3c5005b,微信公眾號:通關機器人】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    微電機關鍵零部件制造誤差對其質量的影響權重分析

    質量影響的權值,最后綜合計算出微電機關鍵零部件制造誤差對微電機質量影響的權重。該方法能很好解決不存在尺寸鏈或復雜尺寸鏈關系的零部件制造誤差對產品質量影響的權值計算問題。 純分享帖,需要者可點擊附件免費
    發表于 06-23 07:16

    告別延遲!Ethernetip轉modbustcp網關在熔煉車間監控的極速時代

    告別延遲!Ethernetip轉modbustcp網關在熔煉車間監控的極速時代
    的頭像 發表于 05-20 19:20 ?140次閱讀
    <b class='flag-5'>告別</b>延遲!Ethernetip轉modbustcp網關在熔煉車間監控的極速時代

    HJ55系列三相變頻電源 電壓可分調可統調

    HJ55系列三相變頻電源是一種高性能的電源設備,廣泛應用于工業、科研、測試等領域。它具備分調和統調功能,能夠滿足不同場景下的電壓和頻率調節需求。以下是關于HJ55系列三相變頻電源的分調和統調功能
    的頭像 發表于 03-26 11:55 ?694次閱讀
    HJ55系列三相變頻電源 電壓可分<b class='flag-5'>調</b>可統<b class='flag-5'>調</b>

    AI的“隨機性”挑戰:它們比人類更“不隨機”?

    你有沒有想過,人類真的能做出完全隨機的選擇嗎?答案可能出乎你的意料。事實上,人類天生就不擅長“隨機”,我們總能在看似無序的事物中發現規律,甚至在本該隨機的場景中創造出模式。這種“偽隨機
    的頭像 發表于 02-20 13:11 ?624次閱讀
    AI的“<b class='flag-5'>隨機</b>性”挑戰:它們比人類更“不<b class='flag-5'>隨機</b>”?

    BP神經網絡的調技巧與建議

    BP神經網絡的調是一個復雜且關鍵的過程,涉及多個超參數的優化和調整。以下是一些主要的調技巧與建議: 一、學習率(Learning Rate) 重要性 :學習率是BP神經網絡中最重要
    的頭像 發表于 02-12 16:38 ?806次閱讀

    hyper-v共享,Hyper-V 共享:Hyper-V的資源共享設置

    的解決方案。今天就為大家介紹Hyper-V共享:Hyper-V的資源共享設置。 ? ?在Hyper-V虛擬化環境中,資源共享是實現高效管理和靈活部署的關鍵功能之一。Hyper-V提供了多種資源
    的頭像 發表于 02-07 10:26 ?1003次閱讀
    hyper-v<b class='flag-5'>共享</b>,Hyper-V <b class='flag-5'>共享</b>:Hyper-V的資源<b class='flag-5'>共享</b>設置

    LD2410B/C新手必看攻略! 測試教程、模塊調一文詳解~

    關于LD2410B/C那些你不得不知道的事?免費申樣、接線教程、參數解析、APP調教程、上位機調教程、常見異常情況自檢等等內容,一文匯總~不管是萌新小白還是資深玩家,都可以快速入門
    的頭像 發表于 02-05 18:09 ?1555次閱讀
    LD2410B/C新手必看攻略! 測試教程、模塊<b class='flag-5'>調</b><b class='flag-5'>參</b>一文詳解~

    多通道相復雜調制信號產生系統

    多通道相復雜調制信號產生系統在無線通信MIMO、雷達接收系統測試、多目標雷達信號模擬和DBF算法研究應用中經常會用到多通道相復雜調制信號。MIMO無線通信系統中,用到兩個或者兩個以上的天線,通過
    的頭像 發表于 12-13 17:38 ?887次閱讀
    多通道相<b class='flag-5'>參</b>復雜調制信號產生系統

    多通道相且相位可調射頻信號產生系統

    多通道相且相位可調信號產生系統隨著無線通信、雷達、頻譜管理等技術的快速發展,精密信號處理對多通道相信號源的需求顯著增長。多通道相信號產生技術能夠在多個通道間實現相位精確同步調控,是相控陣雷達
    的頭像 發表于 12-05 01:05 ?1014次閱讀
    多通道相<b class='flag-5'>參</b>且相位可調射頻信號產生系統

    用VESC電調代替STLink給VESC電調刷固件 可刷所有的基于VESC的電調固件

    就只能是有程序的電調接電源供電,如果兩個電調的輸入都接了輸入電源,那兩個的VCC需要斷開。 三、使用VESC TOOL工具刷固件3.1、打開VESC調工具VESC TOOL,點擊co
    發表于 12-01 21:31

    循環神經網絡的常見調技巧

    循環神經網絡(Recurrent Neural Networks,簡稱RNN)是一種用于處理序列數據的深度學習模型,它能夠捕捉時間序列中的動態特征。然而,RNN的訓練往往比傳統的前饋神經網絡更具挑戰性。 1. 選擇合適的RNN變體 Vanilla RNN :最基本的RNN結構,但容易遇到梯度消失或梯度爆炸的問題。 LSTM(Long Short-Term Memory) :通過門控機制解決了梯度消失的問題,適合處理長序列。 GRU(Gated Recurrent Unit) :LSTM的簡化版本,參數更少,訓練更快,但在某些情況下可能不如LSTM表現
    的頭像 發表于 11-15 10:13 ?742次閱讀

    LSTM神經網絡的調技巧

    長短時記憶網絡(Long Short-Term Memory, LSTM)是一種特殊的循環神經網絡(RNN),它能夠學習長期依賴信息。在實際應用中,LSTM網絡的調是一個復雜且關鍵的過程,直接影響
    的頭像 發表于 11-13 10:01 ?1852次閱讀

    MMC DLL調

    電子發燒友網站提供《MMC DLL調優.pdf》資料免費下載
    發表于 10-11 11:48 ?0次下載
    MMC DLL<b class='flag-5'>調</b>優

    告別接線!手機一鍵調,Rd-Kit雷達藍牙底板,讓雷達模組使用更簡單

    Rd-Kit是由深圳市安信可科技有限公司開發的雷達藍牙底板。該藍牙底板核心處理器芯片PHY6252(SSOP24),是一款高集成度的低功耗藍牙系統級芯片(SoC),安信可對其進行了二次開發: 硬件上適配了 Rd-02B、Rd-02C、Rd-03、Rd-03D、Rd-03E、Rd-03L 和 Rd-04 共七款雷達 ,專為雷達的調試場景進行設計。 軟件上目前已適配Rd-03、Rd-03D、Rd-03E和Rd-04四款雷達 ,其中Rd-03有70cm分辨率的固件和24cm分辨率的固件,Rd-03E有精準測距固件和手勢識別固件。 正面 背面 01、硬件準備 02、軟
    的頭像 發表于 08-09 11:29 ?898次閱讀
    <b class='flag-5'>告別</b>接線!手機一鍵<b class='flag-5'>調</b><b class='flag-5'>參</b>,Rd-Kit雷達藍牙底板,讓雷達模組使用更簡單

    在用機器人與未來機器人并行推進的權重關系

    在用機器人與未來機器人并行推進的權重關系
    的頭像 發表于 08-01 08:14 ?734次閱讀
    在用機器人與未來機器人并行推進的<b class='flag-5'>權重</b>關系