女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)中低精度計(jì)算產(chǎn)生高準(zhǔn)確度結(jié)果的解決方案

zhKF_jqr_AI ? 2018-03-29 16:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

有人認(rèn)為,用低精度訓(xùn)練機(jī)器學(xué)習(xí)模型會(huì)限制訓(xùn)練的精度,事實(shí)真的如此嗎?本文中,斯坦福大學(xué)的DAWN人工智能研究院介紹了一種名為bit recentering的技術(shù),它可以用低精度的計(jì)算實(shí)現(xiàn)高準(zhǔn)確度的解決方案。以下是論智對(duì)原文的編譯,文末附原論文地址。

低精度計(jì)算在機(jī)器學(xué)習(xí)中已經(jīng)吸引了大量關(guān)注。一些公司甚至已經(jīng)開(kāi)始研發(fā)能夠原生支持并加速低精度操作的硬件了,比如微軟的腦波計(jì)劃(Project Brainwave)和谷歌的TPU。雖然使用低精度計(jì)算對(duì)系統(tǒng)來(lái)說(shuō)有很多好處,但是低精度方法仍然主要用于推理,而非訓(xùn)練。此前,低精度訓(xùn)練算法面臨著一個(gè)基本困境(fundamental tradeoff):當(dāng)使用較少的位進(jìn)行計(jì)算時(shí),舍棄誤差就會(huì)增加,這就限制了訓(xùn)練的準(zhǔn)確度。根據(jù)傳統(tǒng)觀點(diǎn),這種制約限制了研究人員在系統(tǒng)中部署低精度訓(xùn)練算法的能力,但是這種限制能否改變?是否有可能設(shè)計(jì)一種使用低精度卻不會(huì)限制準(zhǔn)確度的算法呢?

答案是肯定的。在某些情況下我們可以從低精度訓(xùn)練中獲得高準(zhǔn)確度的解決方案,在這里我們使用了一種新的隨機(jī)梯度下降方法,稱為高準(zhǔn)確度低精度(HALP)法。HALP比之前的算法表現(xiàn)更好,因?yàn)樗鼫p少了兩個(gè)限制低精度隨機(jī)梯度下降準(zhǔn)確度的噪聲源:梯度方差和舍棄誤差。

為了減少梯度方差帶來(lái)的噪音,HALP使用常見(jiàn)的SVRG(stochastic variance-reduced gradient)技術(shù)。SVRG能定期使用完全梯度來(lái)減少隨機(jī)梯度下降中使用的梯度樣本的方差。

為了降低量化數(shù)字帶來(lái)的噪聲,HALP使用了名為“bit centering”的新技術(shù),它背后的原理是,當(dāng)我們接近最優(yōu)點(diǎn)時(shí),梯度漸變的幅度變小。也就是說(shuō)攜帶的信息變少,于是我們能對(duì)其進(jìn)行壓縮。通過(guò)動(dòng)態(tài)地重新調(diào)整低精度數(shù)字,我們可以在算法收斂時(shí)降低量化噪聲。

將這兩種技術(shù)結(jié)合,HALP能夠以和全精度SVRG同樣的線性收斂率生成任意準(zhǔn)確地解決方案,同時(shí)在低精度迭代時(shí)使用的是固定位數(shù)。這個(gè)結(jié)果顛覆了有關(guān)低精度訓(xùn)練算法的傳統(tǒng)觀點(diǎn)。

為什么低精度的隨機(jī)梯度下降有所限制?

首先先交代一下背景:我們想要解決以下這個(gè)訓(xùn)練問(wèn)題:

這是用來(lái)訓(xùn)練許多機(jī)器學(xué)習(xí)模型(包括深度神經(jīng)網(wǎng)絡(luò))的經(jīng)典實(shí)證問(wèn)題:讓風(fēng)險(xiǎn)最小化。解決這個(gè)問(wèn)題的標(biāo)準(zhǔn)方法之一是隨機(jī)梯度下降,它是一種通過(guò)運(yùn)行接近最佳值的迭代算法。

在每次迭代時(shí),it是從{1,..., N}中隨機(jī)挑選的一個(gè)指數(shù),我們雖然想運(yùn)行這樣的算法,但是要保證迭代wt是低精度的。也就是說(shuō),我們希望它們使用較少位的定點(diǎn)運(yùn)算(通常為8位或16位)。但是,當(dāng)直接對(duì)隨機(jī)梯度下降更新規(guī)則而進(jìn)行這項(xiàng)操作時(shí),我們遇到了問(wèn)題:?jiǎn)栴}的解決方案w可能無(wú)法再選中的定點(diǎn)表示中顯示出來(lái)。例如,如果一個(gè)8位的定點(diǎn)表示,可以儲(chǔ)存{-128,-127,…,127}之間的整數(shù),正確的解決方法是w*=100.5,那么我們與解決方案的距離不可能小于0.5,因?yàn)槲覀儾荒鼙硎痉钦麛?shù)。除此之外,將梯度轉(zhuǎn)換為定點(diǎn)導(dǎo)致的舍棄誤差可能會(huì)減慢收斂速度,這也影響了低精度SGD的準(zhǔn)確性。

Bit Centering

當(dāng)我們運(yùn)行隨機(jī)梯度下降時(shí),在某種意義上,我們世紀(jì)正對(duì)一堆梯度樣本進(jìn)行平均(或總結(jié))。Bit Centering背后的關(guān)鍵思想是隨著梯度漸變逐漸變小,我們可以用同樣的位數(shù)、以較小的誤差對(duì)它們求平均值。想要知道為什么,想像一下,你想對(duì)[-100, 100]之間的數(shù)字求平均值,然后和[-1, 1]的平均值作比較。在前一個(gè)集合中,我們需要選擇一個(gè)定點(diǎn)表示,它可以覆蓋整個(gè)集合(例如{-128,-127,…,127})。而在第二個(gè)集合中,我們選擇的定點(diǎn)要覆蓋[-1, 1],例如{-128/127,-127/127,..., 126/127,127/127}。這就意味著在固定位數(shù)情況下,第二種情況中的相鄰可表示數(shù)字之間的差值比第一種情況更小,因此舍棄誤差也更低。

這個(gè)關(guān)鍵的想法讓我們得到了啟發(fā)。為了在[-1, 1]中求出比[-100, 100]中更少誤差的平均數(shù),我們需要用一個(gè)不同的定點(diǎn)表示,即我們應(yīng)該不斷更新低精度表示:隨著梯度漸變得越小,我們應(yīng)該用位數(shù)更小的定點(diǎn)數(shù)字,覆蓋更小的范圍。

但是我們?cè)撊绾胃卤硎灸兀课覀円采w的范圍到底多大?如果目標(biāo)是帶有參數(shù)μ的強(qiáng)凸,那么不管我們何時(shí)在某一點(diǎn)w采取完整的梯度漸變是,都可以用以下公式限制最佳位置

這種不等式為最終的解決方案提供了一系列可能的定位,所以無(wú)論何時(shí)計(jì)算完整梯度,我們都可以重新居中并縮放低精度表示以覆蓋此范圍。下圖說(shuō)明了這一過(guò)程。

低精度計(jì)算產(chǎn)生高準(zhǔn)確度結(jié)果的解決方案

HALP

HALP是運(yùn)行SVRG并在每個(gè)時(shí)期都使用具有完全梯度的bit centering更新低精度表示的算法。原論文有對(duì)這一方法的具體描述,在這里我們只簡(jiǎn)單做些介紹。首先,我們證明了,對(duì)于強(qiáng)凸的Lipschitz光滑函數(shù),只要我們使用的位數(shù)b滿足

其中κ是該問(wèn)題的條件數(shù)字,那么為了適當(dāng)設(shè)置尺寸和時(shí)間長(zhǎng)度,HALP將以線性速度收斂到任意準(zhǔn)確度的解。更顯然的是,0<γ<1,

其中wk+1表示第K次迭代后的值。下表表現(xiàn)了這一變化過(guò)程

低精度計(jì)算產(chǎn)生高準(zhǔn)確度結(jié)果的解決方案

圖表通過(guò)對(duì)具有100個(gè)特征和1000個(gè)樣本的合成數(shù)據(jù)集進(jìn)行線性回歸,來(lái)評(píng)估HALP。將它與全精度梯度下降、SVRG、低精度的梯度下降和低精度的SVRG進(jìn)行比較。需要注意的是,盡管只有8位(受到浮點(diǎn)錯(cuò)誤的限制),HALP仍能收斂到精度非常高的結(jié)果上。在這種情況下,HALP可以比全精度SVRG收斂到更高精度的結(jié)果中,因?yàn)镠ALP較少使用浮點(diǎn)運(yùn)算,因此對(duì)浮點(diǎn)的非準(zhǔn)確性不敏感。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:斯坦福DAWN實(shí)驗(yàn)室實(shí)現(xiàn)用低精度計(jì)算產(chǎn)生高準(zhǔn)確度結(jié)果

文章出處:【微信號(hào):jqr_AI,微信公眾號(hào):論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    關(guān)于CAPSENSE?每個(gè) Vref 電壓的準(zhǔn)確度的疑問(wèn)求解

    我認(rèn)為CAPSENSE?在感應(yīng)電容時(shí)使用 Vref 電壓值。 根據(jù)組件數(shù)據(jù)表,Vref 電壓值根據(jù) VDDA 設(shè)置而變化。 PSoC? 4 電容式感應(yīng) ( CAPSENSE? ) 您能否告訴我們每個(gè) Vref 電壓(從 1.2V 到 2.743V)的準(zhǔn)確度?
    發(fā)表于 07-15 07:35

    電工儀表準(zhǔn)確度等級(jí)詳解

    一、準(zhǔn)確度等級(jí)的定義 以下是“JJF1001-2011通用計(jì)量術(shù)語(yǔ)”對(duì)準(zhǔn)確度級(jí)準(zhǔn)確度等級(jí)的相關(guān)定義: 1、測(cè)量準(zhǔn)確度 measurement accuracy,sccuracy
    的頭像 發(fā)表于 05-19 10:20 ?857次閱讀
    電工儀表<b class='flag-5'>準(zhǔn)確度</b>等級(jí)詳解

    直線測(cè)量?jī)x的精度如何評(píng)估?

    進(jìn)行測(cè)試,通過(guò)測(cè)量結(jié)果與標(biāo)準(zhǔn)值的對(duì)比,評(píng)估測(cè)量?jī)x的精度。這種方法直接且有效,但需要高精度的標(biāo)準(zhǔn)件作為參考。 2.與其他高精度儀器對(duì)比:將直線
    發(fā)表于 04-21 16:26

    校準(zhǔn)后,記憶示波器顯示頻率和幅度是否準(zhǔn)確

    和幅度是否漂移。 四、校準(zhǔn)后仍不準(zhǔn)確的可能原因及解決方案 [td]問(wèn)題可能原因解決方案 頻率測(cè)量誤差校準(zhǔn)源頻率不穩(wěn)定或示波器時(shí)基誤差。更換高精度校準(zhǔn)源,重新校準(zhǔn)時(shí)基。 幅度測(cè)量誤差探頭
    發(fā)表于 04-16 14:56

    利用隔離式精密信號(hào)鏈保持?jǐn)?shù)據(jù)采集的準(zhǔn)確度

    數(shù)字時(shí)代改變了解決問(wèn)題的范式,將智能引入邊緣可以應(yīng)對(duì)全新的復(fù)雜挑戰(zhàn)。數(shù)據(jù)采集(DAQ)系統(tǒng)成為了邊緣智能的核心。在數(shù)據(jù)采集領(lǐng)域,準(zhǔn)確度和可靠性至關(guān)重要。為確保達(dá)到準(zhǔn)確度和完整性,隔離式精密信號(hào)鏈的重要性不容忽視。
    的頭像 發(fā)表于 03-17 14:43 ?731次閱讀

    直線測(cè)量?jī)x如何測(cè)量鈦合金鋼管的全長(zhǎng)直線

    注意測(cè)量環(huán)境、測(cè)量精度、操作規(guī)范以及數(shù)據(jù)處理等方面的問(wèn)題,以確保測(cè)量結(jié)果準(zhǔn)確性和可靠性。 網(wǎng)站名稱:保定市藍(lán)鵬測(cè)控科技有限公司 可根據(jù)客戶需求提供解決方案,定制產(chǎn)品。 可以給我在線留
    發(fā)表于 03-10 14:52

    淺談晶振的頻率準(zhǔn)確度和頻率穩(wěn)定

    在選購(gòu)或者使用晶振時(shí),我們經(jīng)常會(huì)聽(tīng)到頻率準(zhǔn)確度和頻率穩(wěn)定這兩個(gè)概念。雖然兩者都與晶振的頻率變化相關(guān),但它們的關(guān)注重點(diǎn)不同。
    的頭像 發(fā)表于 02-25 18:07 ?997次閱讀
    淺談晶振的頻率<b class='flag-5'>準(zhǔn)確度</b>和頻率穩(wěn)定<b class='flag-5'>度</b>

    準(zhǔn)確度信號(hào)鏈解決方案快速實(shí)現(xiàn)七位半DMM

    在對(duì)準(zhǔn)確度有很高要求的行業(yè)里,七位半或更高分辨率的數(shù)字萬(wàn)用表(DMM)會(huì)被使用,這些DMM采用由分立元器件搭建的多斜率積分ADC。這些ADC雖然可以提供合理準(zhǔn)確度的測(cè)量結(jié)果,但對(duì)于大多數(shù)工程師來(lái)說(shuō)
    的頭像 發(fā)表于 12-03 10:55 ?1147次閱讀

    如何實(shí)現(xiàn)七位半或更高準(zhǔn)確度的DMM

    許多儀器儀表應(yīng)用要求準(zhǔn)確度,例如數(shù)字萬(wàn)用表(DMM)、三相標(biāo)準(zhǔn)表、現(xiàn)場(chǎng)儀表校準(zhǔn)器、準(zhǔn)確度DAQ系統(tǒng)、電子秤/實(shí)驗(yàn)室天平、地震物探儀以及自動(dòng)測(cè)試設(shè)備(ATE)中的源表(SMU)/功率
    的頭像 發(fā)表于 11-28 11:50 ?1012次閱讀
    如何實(shí)現(xiàn)七位半或更高<b class='flag-5'>準(zhǔn)確度</b>的DMM

    AFE4404可否用于運(yùn)動(dòng)時(shí)心率檢測(cè)?準(zhǔn)確度如何?

    AFE4404可否用于運(yùn)動(dòng)時(shí)心率檢測(cè)?準(zhǔn)確度如何?
    發(fā)表于 11-19 08:26

    數(shù)字壓力表的準(zhǔn)確度如何?是否適用于精密測(cè)量?

    在工業(yè)和科研領(lǐng)域,壓力的測(cè)量工作至關(guān)重要,而數(shù)字壓力表因其直觀的數(shù)字顯示和高精度的特性,成為了這些領(lǐng)域不可或缺的測(cè)量工具。那么,數(shù)字壓力表的準(zhǔn)確度到底如何,它是否能滿足精細(xì)測(cè)量的需求呢?
    的頭像 發(fā)表于 11-07 13:58 ?701次閱讀
    數(shù)字壓力表的<b class='flag-5'>準(zhǔn)確度</b>如何?是否適用于精密測(cè)量?

    光電軸角編碼器 準(zhǔn)確度等級(jí)5級(jí)是多少

    光電軸角編碼器的準(zhǔn)確度等級(jí)是衡量其測(cè)量精度的一個(gè)重要指標(biāo)。對(duì)于準(zhǔn)確度等級(jí)為5級(jí)的光電軸角編碼器,其相關(guān)的計(jì)量特性通常包括分度誤差、測(cè)角重復(fù)性和零位誤差等。 一、分度誤差 分度誤差是編碼器每?jī)蓚€(gè)相鄰
    的頭像 發(fā)表于 10-12 09:50 ?877次閱讀

    深度剖析在線長(zhǎng)度測(cè)量?jī)x:機(jī)器視覺(jué)引領(lǐng)高精度測(cè)量新時(shí)代

    系統(tǒng)具備強(qiáng)大的計(jì)算能力,可以對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理、計(jì)算和分析,并將計(jì)算結(jié)果以圖形、表格或數(shù)值等形式輸出給用戶。 二、主要特點(diǎn) 高精度:在線長(zhǎng)度測(cè)量?jī)x通常采用高
    發(fā)表于 10-10 16:51

    噪聲測(cè)量?jī)x器精度應(yīng)達(dá)到幾級(jí)以上

    精度依次降低。 0型聲級(jí)計(jì)的準(zhǔn)確度是±0.4分貝,是實(shí)驗(yàn)室標(biāo)準(zhǔn)聲級(jí)計(jì)。 1型聲級(jí)計(jì)的準(zhǔn)確度是±0.7分貝,一般在實(shí)驗(yàn)室或聲學(xué)條件可以嚴(yán)格控制的現(xiàn)場(chǎng)使用。 2型聲級(jí)計(jì)的準(zhǔn)確度是±1分貝,
    的頭像 發(fā)表于 10-09 15:09 ?1745次閱讀

    影響電源紋波測(cè)試準(zhǔn)確性的因素

    出相應(yīng)的解決方案。 測(cè)試設(shè)備的選擇 測(cè)試設(shè)備的選擇是影響電源紋波測(cè)試準(zhǔn)確性的首要因素。測(cè)試設(shè)備的性能、精度、穩(wěn)定性等都會(huì)對(duì)測(cè)試結(jié)果產(chǎn)生影響。
    的頭像 發(fā)表于 08-02 09:42 ?1191次閱讀