女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

PEMN:參數集約型掩碼網絡

CVer ? 來源:CVer ? 作者:CVer ? 2022-12-15 14:09 ? 次閱讀

NeurIPS 2022 | Parameter-Efficient Masking Networks,美國東北大學,羅切斯特理工等,提出參數集約型掩碼網絡,探索有限數量隨機數的表征能力并提升神經網絡儲存和傳輸效率。

為了處理更復雜的任務,近年來神經網絡的規模也在不斷變大,如何高效的儲存和傳輸神經網絡變得十分重要。另一方面,隨著彩票假說(Lottery Ticket Hypothesis (LTH))的提出,隨機稀疏神經網絡最近展現出很強的潛力,如何利用這種潛力來提高網絡的存儲和傳輸效率也很值得探索。

來自美國東北大學和羅切斯特理工的研究者提出參數集約型掩碼網絡(Parameter-Efficient Masking Networks (PEMN))。作者首先探索了有限數量隨機數生成的隨機網絡的表征能力。實驗表明,即使網絡由有限數量的隨機數生成,通過選擇不同的子網絡結構,其依然具有很好的表征能力。通過這種探索性實驗,作者自然地提出使用一組有限數量隨機數作為prototype,結合一組mask來表達一個神經網絡。因為有限數量的隨機數和二值的mask占用很少的儲存空間,作者以此來提出一種新的思路來進行網絡壓縮。文章已被NeurIPS 2022 接受。代碼已開源。

1a33b5fe-7c3d-11ed-8abf-dac502259ad0.png

Parameter-Efficient Masking Networks

論文地址: https://arxiv.org/abs/2210.06699

論文代碼: https://github.com/yueb17/PEMN

1. 相關研究

MIT研究人員提出彩票假說 Lottery Ticket Hypothesis (ICLR’19):在一個隨機初始化網絡中,存在一個彩票子網絡(winning ticket)在被單獨訓練的情況下達到很好的效果。彩票假說探索了隨機稀疏網絡的可訓練性。Uber研究人員提出Supermask (NeurIPS’19):在一個隨機初始化網絡中,存在一個子網絡,可以直接用來做推斷而不需要訓練。Supermask探索了隨機稀疏網絡的可用性。華盛頓大學研究人員提出Edge-Popup (CVPR’20):通過反向傳播學習子網絡的mask,大幅提升了隨機稀疏網絡的可用性。

2. 研究動機/流程

以上相關研究從不同角度探索了隨機稀疏網絡的潛力,如可訓練性和可用性,其中可用性也可以理解為表征能力。在此工作中,作者感興趣的是由隨機數生成的神經網絡在不訓練權重的情況下有多強的表征能力。隨著對該問題的探索,作者提出了Parameter-Efficient Masking Networks (PEMN)。自然地,作者運用PEMN為網絡壓縮提供了一種新的思路,并作為一個例子對PEMN的潛在應用場景進行探索。

3. 探索隨機數構成的神經網絡的表征能力

給定一個隨機網絡,作者選擇Edge-Popup算法在其中選擇子網絡來探索其表征能力。不同的是,相對于對整個網絡進行隨機初始化,作者提出了三種參數集約型的網絡生成策略來使用一個prototype構建隨機網絡。

One-layer: 選擇網絡中重復結構的權重作為prototype來填充其他的與之結構相同的網絡層。

Max-layer padding (MP): 選擇參數量最多的網絡層作為prototype并且截斷相應的參數量來填充其他網絡層。

Random vector padding (RP): 選擇一定長度的隨機向量作為prototype并對其進行復制來填充整個網絡。

1a5d0a6c-7c3d-11ed-8abf-dac502259ad0.png

三種不同的隨機網絡生成策略把網絡中不重復參數值(unique values)的數量逐步變小,我們基于不同策略得到的隨機網絡來選擇子網絡,從而探索了有限數量隨機數生成的隨機網絡的表征潛力。

1a86ae1c-7c3d-11ed-8abf-dac502259ad0.png

上圖展示了使用ConvMixer 和 ViT 網絡CIFAR10圖像分類的實驗結果。Y軸為準確率,X軸為使用不同策略得到的隨機網絡。隨之X軸的變大,隨機網絡中不重復隨機數數量逐漸變小 (RP后的數字表示相比較于MP,RP中不重復隨機數數量的比例)。根據實驗結果,我們觀察到即使隨機網絡只有非常有限的不重復隨機數(比如PR_1e-3),依然可以很好的維持選擇出來的子網絡的表征能力。至此,作者通過不同的隨機網絡生成策略,探索了有限數量隨機數構成的神經網絡的表征能力并觀察到即使不重復隨機數非常有限,其對應的隨機網絡依然可以很好地對數據進行表征。同時作者基于這些隨機網絡生成策略,結合所得到的子網絡掩碼,提出了Parameter-Efficient Masking Networks(PEMN)這種新的神經網絡類型。

4. 一種新的網絡壓縮思路

本文選擇了神經網路壓縮為例來拓展PEMN的潛在應用。具體來說,文中所提出的不同隨機網絡生成策略可以高效的使用prototype來代表完整的隨機網絡,尤其是最細粒度的random vector padding (RP)策略。作者使用RP策略中的隨機向量prototype和與之對應的一組子網絡掩碼來表示一個隨機網絡。在其中prototype需要保存浮點數格式,而掩碼只需要保存成二值格式。因為RP中的prototype長度可以很短(因為有限數量的不重復隨機數仍有很強的表征能力),所以表示一個神經網絡的開銷會變得很小,即儲存一個長度有限的浮點數格式的隨機向量和一組二值格式的掩碼。相比較于傳統的稀疏網絡儲存子網絡的浮點值,本文提出了一種新的網絡壓縮思路用來高效的儲存和傳輸神經網絡。

1aa0ec96-7c3d-11ed-8abf-dac502259ad0.png

在上圖中,作者使用PEMN對網絡進行壓縮并與傳統的網絡剪枝方法進行對比。實驗使用ResNet網絡在CIFAR數據集做圖像分類任務。我們觀察到,新的壓縮方案表現普遍優于傳統的網絡剪枝,尤其是在很高的壓縮率下,PEMN仍然可以維持較好的準確率。

5. 結論

本文受近來隨機網絡展現出來的潛力所啟發,提出不同種參數集約策略來構建隨機神經網絡,進而探索了在只有有限的不重復隨機數的情況下所生成的隨機神經網絡的表征潛力,并提出參數集約型掩碼網絡Parameter-Efficient Masking Networks (PEMN)。作者將PEMN應用到網絡壓縮的場景中探索了其在實際應用方面的潛力并且為網絡壓縮提供了一種新的思路。作者提供了廣泛的實驗,表明了即使隨機網絡中只有非常有限的不重復隨機數,通過子網絡的選擇,其依然有較好的表征能力。此外,相比較于傳統剪枝算法,實驗表明新提出的方法可以取得更好的網絡壓縮效果,驗證了PEMN在該場景下的應用潛力。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4809

    瀏覽量

    102826
  • 算法
    +關注

    關注

    23

    文章

    4700

    瀏覽量

    94786

原文標題:NeurIPS 2022 | PEMN:參數集約型掩碼網絡

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    手把手教你如何調優Linux網絡參數

    在高并發網絡服務場景中,Linux內核的默認網絡參數往往無法滿足需求,導致性能瓶頸、連接超時甚至服務崩潰。本文基于真實案例分析,從參數解讀、問題診斷到優化實踐,手把手教你如何調優Lin
    的頭像 發表于 05-29 09:21 ?114次閱讀

    愛立信如何構建意圖驅動自主網絡

    意圖驅動服務編排與AI相互協同,正在徹底改變網絡和服務的管理方式。這種協同究竟會如何革新OSS服務管理方式?又將如何發掘自動化和可編程網絡的全部潛能?
    的頭像 發表于 04-12 15:00 ?5478次閱讀
    愛立信如何構建意圖驅動<b class='flag-5'>型</b>自主<b class='flag-5'>網絡</b>

    無法轉換TF OD API掩碼RPGA模型怎么辦?

    無法轉換重新訓練的 TF OD API 掩碼 RPGA 模型,該模型使用以下命令在 GPU 上工作: mo > --saved_model_dir
    發表于 03-06 06:44

    子網掩碼反運算的步驟和應用

    32位地址,主要用來區分IP地址中的網絡部分和主機部分。它是由一串連續的1和連續的0組成,其中的1表示網絡部分,0用來表示主機部分。子網掩碼與IP地址一起使用,用于確定IP地址的所屬網絡
    的頭像 發表于 12-09 09:27 ?521次閱讀

    一文分清IP地址、子網和子網掩碼的關系

    大家在進行IPv4地址配置時都看到過“子網掩碼”這樣的參數名,許多小伙伴都會疑惑這是個啥?有什么用呢? 下面帶領大家認識認識子網掩碼以及跟其密不可分的子網! 1 IP地址、子網和子網掩碼
    的頭像 發表于 12-07 10:20 ?2947次閱讀
    一文分清IP地址、子網和子網<b class='flag-5'>掩碼</b>的關系

    卷積神經網絡參數調整方法

    卷積神經網絡因其在處理具有空間層次結構的數據時的卓越性能而受到青睞。然而,CNN的成功很大程度上依賴于其參數的合理設置。參數調整是一個復雜的過程,涉及到多個超參數的選擇和優化。
    的頭像 發表于 11-15 15:10 ?1088次閱讀

    什么是小水電集約化管理?小水電集約化管理實現的價值

    小水電集約化管理,是指在集控運行中心通過網絡通道實現遠程對小水電站集群進行遠程控制、統一規范運行。以區域、流域為單元,集中相關資源和業務,專業化分工,實現區域、流域內水電站群集控運維、專業化的統一運營管理。
    的頭像 發表于 11-12 14:26 ?866次閱讀
    什么是小水電<b class='flag-5'>集約</b>化管理?小水電<b class='flag-5'>集約</b>化管理實現的價值

    N公頭性能參數是多少

    德索工程師說道N公頭,即N系列射頻同軸連接器的一種,因其獨特的設計、優質的材料選擇以及嚴格的制造工藝,在射頻(RF)和微波通信系統中展現出卓越的性能。以下是關于N公頭性能參數的詳細介紹
    的頭像 發表于 10-31 09:40 ?950次閱讀
    N<b class='flag-5'>型</b>公頭性能<b class='flag-5'>參數</b>是多少

    Linux ifconfig網絡參數詳解

    ifconfig 主要是可以手動啟動、觀察與修改網絡接口的相關參數。
    的頭像 發表于 10-24 17:31 ?1164次閱讀

    日本東京ip和子網掩碼

    日本東京的IP地址和子網掩碼是緊密相連的,它們共同決定了網絡中設備的通信方式。下面rak小編將詳細介紹日本東京的IP地址和子網掩碼。
    的頭像 發表于 10-12 10:13 ?767次閱讀

    電流反饋運放與電壓反饋運放

    ,選擇具有適當增益帶寬積(GBW)、轉換速率(SR)和輸入/輸出阻抗等參數的CFA器件。 (2)設計輸入和輸出網絡:根據所需的增益、帶寬和穩定性等要求,設計合適的輸入和輸出網絡。這可能包括電阻、電容和電感
    發表于 09-10 09:47

    IP地址與子網劃分

    子網的劃分,實際上就是設計子網掩碼的過程,它指的是指將一個給定的IP網絡地址空間劃分為更小的子網絡。 在子網掩碼中用1和0來分別網絡號和主機
    的頭像 發表于 09-06 09:46 ?722次閱讀

    嵌入式學習-常見的shell命令之網絡相關命令

    配給任何主機,僅用作廣播地址(三)IP地址127.0.0.1為回環結構,用于本地進行軟件測試4)子網掩碼子網掩碼是一個32位的二進制地址,用來屏蔽原來網絡地址的劃分情況,從而獲得一個范圍小的,可以實際使用
    發表于 08-21 09:41

    常見的shell命令之網絡相關命令

    配給任何主機,僅用作廣播地址(三)IP地址127.0.0.1為回環結構,用于本地進行軟件測試4)子網掩碼子網掩碼是一個32位的二進制地址,用來屏蔽原來網絡地址的劃分情況,從而獲得一個范圍小的,可以實際使用
    發表于 08-20 09:50

    神經網絡各個網絡參數的設定原則

    神經網絡各個網絡參數的設定原則是一個復雜而關鍵的過程,它直接影響到網絡的性能和學習效果。以下將從網絡節點、初始權值、訓練速率、動態
    的頭像 發表于 07-11 17:03 ?1960次閱讀