女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用粗粒度可重構(gòu)陣列加速處理

星星科技指導(dǎo)員 ? 來源:嵌入式計(jì)算設(shè)計(jì) ? 作者:Monique DeVoe ? 2022-06-14 10:05 ? 次閱讀

隨著性能需求的增加和對(duì)低功耗設(shè)計(jì)的推動(dòng),需要更有效的方法來執(zhí)行處理任務(wù),因?yàn)橛捎诠β氏拗疲瑢⒏?a target="_blank">處理器投入性能問題不再可行。加速器旨在以更快的速度和更低的功耗進(jìn)行計(jì)算,但今天的加速器在功耗和性能方面存在缺陷。

加速器陣容

亞利桑那州立大學(xué)計(jì)算、信息學(xué)和決策系統(tǒng)工程學(xué)院副教授 Aviral Shrivastava 正在對(duì)可編程加速器進(jìn)行研究,以增強(qiáng)當(dāng)今的加速技術(shù)。Shrivastava 列出了當(dāng)今使用的三種常見類型的加速器:硬件加速器、FPGAGPU。硬件加速器將特定的計(jì)算元素專用于處理計(jì)算,而不是在 CPU 上運(yùn)行它們。它們速度快、功耗低,但不適合當(dāng)今快速變化的技術(shù)迭代,因?yàn)樗鼈儾豢删幊?。FPGA 是可編程的——開發(fā)人員可以在其上編寫任何邏輯并且它們可以充當(dāng)加速器——但 Shrivastava 說它們通常過于通用并且消耗太多功率。GPU 是當(dāng)今流行的加速器,

粗粒度可重構(gòu)陣列

Shrivastava 正在開發(fā)粗??芍貥?gòu)陣列 (CGRA),它可以加速非并行循環(huán),并在 GPU 的并行循環(huán)優(yōu)勢(shì)之上實(shí)現(xiàn)更多加速功能。CGRA 由一個(gè)由算術(shù)邏輯單元 (ALU) 和寄存器組成的二維網(wǎng)格組成,這些單元接收輸入和指令,計(jì)算指令的算術(shù)或邏輯運(yùn)算,并將輸出發(fā)送給它的四個(gè)鄰居以計(jì)算下一個(gè)步驟(圖 1)。

圖 1:粗粒度可重構(gòu)陣列。

pYYBAGKn7RuAfDpEAATcUI-H07s228.png

CGRA 的潛力來自于他們能夠在消耗很少的電力的情況下執(zhí)行操作。在常規(guī)處理器中執(zhí)行加法運(yùn)算需要很大的功率:它必須經(jīng)過 20 多個(gè)流水線階段。在 CGRA 中,只需要從鄰居那里獲取操作數(shù)并執(zhí)行加法運(yùn)算。CGRA 可以通過流水線加速——循環(huán)的操作被布置在 CGRA 的 PE 上,數(shù)據(jù)在它們之間流動(dòng)。

CGRA 本身并不新鮮,但開發(fā)人員對(duì)現(xiàn)有的 CGRA 進(jìn)行編程以僅執(zhí)行一種類型的計(jì)算。Shrivastava 說,挑戰(zhàn)在于映射,因?yàn)檠h(huán)內(nèi)核需要映射到 CGRA,操作映射到節(jié)點(diǎn),數(shù)據(jù)依賴關(guān)系映射到 CGRA 的路徑。Shrivastava 的目標(biāo)是消除耗時(shí)的手動(dòng)編碼,并使任何類型的循環(huán)或計(jì)算能夠通過編譯器映射到 CGRA,這是一種相對(duì)較新的方法。他正在開發(fā)一個(gè)生成映射代碼的編譯器工具鏈。

Shrivastava 說 CGRA 的研究引起了 IBM 的興趣,IBM 希望將這種方法應(yīng)用于并行循環(huán)輕型服務(wù)器應(yīng)用程序。用于科學(xué)研究和多媒體擴(kuò)展的圖形和高性能計(jì)算也可以從使用 CGRA 中獲益。

解決分支分歧問題

所有現(xiàn)有加速技術(shù)面臨的一個(gè)挑戰(zhàn)是“分支分歧”。當(dāng)執(zhí)行具有“if-then-else”結(jié)構(gòu)的循環(huán)時(shí),加速器分配資源以執(zhí)行來自分支的兩條路徑(真路徑和假路徑)的指令,然后丟棄假路徑指令的影響。FPGA 將兩個(gè)路徑的功能映射到計(jì)算資源上,GPU 執(zhí)行來自兩個(gè)分支路徑的指令并丟棄錯(cuò)誤路徑指令的結(jié)果。加速器必須這樣做,因?yàn)樵诜峙浞种窂劫Y源時(shí),分支的結(jié)果在編譯時(shí)是未知的(分支的結(jié)果是在運(yùn)行時(shí)計(jì)算的,當(dāng)執(zhí)行分支時(shí))。這種冗余執(zhí)行會(huì)導(dǎo)致分支花費(fèi)雙倍的性能時(shí)間和執(zhí)行能力。

Shrivastava 和他的團(tuán)隊(duì)提出了通過智能硬件-軟件協(xié)同設(shè)計(jì)解決分支分歧問題的方法。不是為真路徑分配一些PE,而為假路徑分配一些PE,而是分配相同的PE來執(zhí)行來自兩條路徑的指令。來自真路徑和來自假路徑的指令都發(fā)給PE。在運(yùn)行時(shí),PE 只選擇正確的一個(gè)來執(zhí)行。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19828

    瀏覽量

    233835
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4919

    瀏覽量

    130770
  • 編譯器
    +關(guān)注

    關(guān)注

    1

    文章

    1657

    瀏覽量

    49948
收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    清微智能官宣:國(guó)產(chǎn)重構(gòu)芯片全球出貨量突破2000萬顆

    近日,由北京智源人工智能研究院主辦的第7屆北京智源大會(huì)成功舉辦。作為國(guó)產(chǎn)原創(chuàng)重構(gòu)芯片架構(gòu)領(lǐng)導(dǎo)者,清微智能受邀出席,向大眾展示了前沿高階國(guó)產(chǎn)算力技術(shù)成果。 在本次大會(huì)上,清微智能首次官宣,公司
    的頭像 發(fā)表于 06-12 17:15 ?123次閱讀
    清微智能官宣:國(guó)產(chǎn)<b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>芯片全球出貨量突破2000萬顆

    ?數(shù)字孿生熱管理:NTC熱敏電阻陣列與熱場(chǎng)重構(gòu)算法的動(dòng)態(tài)適配

    本文以東莞市平尚電子科技有限公司(平尚科技)的NTC熱敏電阻陣列與熱場(chǎng)重構(gòu)算法為核心,探討其在車載數(shù)字孿生熱管理系統(tǒng)中的動(dòng)態(tài)適配技術(shù)。通過高精度NTC陣列、多物理場(chǎng)耦合模型及實(shí)時(shí)反饋控制算法,實(shí)現(xiàn)熱
    的頭像 發(fā)表于 06-06 17:59 ?113次閱讀
    ?數(shù)字孿生熱管理:NTC熱敏電阻<b class='flag-5'>陣列</b>與熱場(chǎng)<b class='flag-5'>重構(gòu)</b>算法的動(dòng)態(tài)適配

    支持實(shí)時(shí)物體識(shí)別的視覺人工智能微處理器RZ/V2MA數(shù)據(jù)手冊(cè)

    DRP-AI 采用了一種由動(dòng)態(tài)重構(gòu)處理器(DRP)和 AI-MAC組成的人工智能加速器,該加速器可加速
    的頭像 發(fā)表于 03-18 18:12 ?389次閱讀
    支持實(shí)時(shí)物體識(shí)別的視覺人工智能微<b class='flag-5'>處理</b>器RZ/V2MA數(shù)據(jù)手冊(cè)

    FRED案例:矩形微透鏡陣列

    介紹 小透鏡陣列可應(yīng)用在很多方面,其中包含光束均勻化。本文演示了一個(gè)用于在探測(cè)器上創(chuàng)建均勻的非相干照度的成像微透鏡陣列的設(shè)計(jì)。輸入光束具有高斯輪廓,半寬度等于微透鏡陣列大小,并且顯示了其功率輪廓被微
    發(fā)表于 03-05 09:41

    粒度控制在結(jié)晶過程中的從小規(guī)模試驗(yàn)到放大應(yīng)用

    引言 結(jié)晶作為API生產(chǎn)的最后一道工序,除了用于純化外,還可以實(shí)現(xiàn)晶型與粒度控制。晶型和粒度影響口服藥物生物利用度。其中,粒度分布(PSD)是一個(gè)重要的粉體性質(zhì),它影響晶漿的過濾速率、濾餅的干燥效率
    的頭像 發(fā)表于 02-18 09:45 ?563次閱讀
    <b class='flag-5'>粒度</b>控制在結(jié)晶過程中的從小規(guī)模試驗(yàn)到放大應(yīng)用

    突破傳統(tǒng)桎梏,富唯重構(gòu)柔性裝配系統(tǒng)引領(lǐng)行業(yè)新變革

    在當(dāng)今競(jìng)爭(zhēng)激烈的制造業(yè)領(lǐng)域,傳統(tǒng)裝配系統(tǒng)正面臨著諸多難以突破的困境。多層控制器架構(gòu)冗余、產(chǎn)線生產(chǎn)種類單一、對(duì)人員要求過高以及標(biāo)準(zhǔn)化程度低等問題,嚴(yán)重制約著企業(yè)的發(fā)展與創(chuàng)新。而富唯智能基于 AI-ICDP 打造的重構(gòu)柔性裝配系統(tǒng),宛如一顆璀璨的新星,為行業(yè)帶來了全新的希望
    的頭像 發(fā)表于 02-13 14:22 ?353次閱讀
    突破傳統(tǒng)桎梏,富唯<b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>柔性裝配系統(tǒng)引領(lǐng)行業(yè)新變革

    陣列式位移計(jì)生產(chǎn)廠家:什么是陣列式位移計(jì)

    ,成為了結(jié)構(gòu)變形監(jiān)測(cè)的首選工具。下面是南京陣列式位移計(jì)生產(chǎn)廠家給大家介紹的相關(guān)內(nèi)容:陣列式位移計(jì)傳感器采用了先進(jìn)的MEMS加速度計(jì)技術(shù),并配備了完善的配套附件,使得其
    的頭像 發(fā)表于 12-12 14:20 ?558次閱讀
    <b class='flag-5'>陣列</b>式位移計(jì)生產(chǎn)廠家:什么是<b class='flag-5'>陣列</b>式位移計(jì)

    什么是麥克風(fēng)陣列

    什么是麥克風(fēng)陣列?想象一下一個(gè)小型音響部隊(duì)在你面前,它們站成一排,用不同的麥克風(fēng)捕捉聲音。這就是麥克風(fēng)陣列的基本概念。麥克風(fēng)陣列由多個(gè)麥克風(fēng)組成,按照特定的布局排列在一起,用來捕捉和處理
    的頭像 發(fā)表于 11-30 01:08 ?1408次閱讀
    什么是麥克風(fēng)<b class='flag-5'>陣列</b>

    基于相變材料的重構(gòu)超構(gòu)表面用于圖像處理

    光學(xué)超構(gòu)表面(metasurface)實(shí)現(xiàn)了在亞波長(zhǎng)尺度內(nèi)的模擬計(jì)算和圖像處理,并具備更低的功耗、更快的速度。雖然人們已經(jīng)展示了各種圖像處理超構(gòu)表面,但大多數(shù)考慮的器件都是靜態(tài)的,缺乏重構(gòu)
    的頭像 發(fā)表于 11-13 10:24 ?7306次閱讀
    基于相變材料的<b class='flag-5'>可</b><b class='flag-5'>重構(gòu)</b>超構(gòu)表面用于圖像<b class='flag-5'>處理</b>

    微流控陣列芯片和普通芯片的區(qū)別

    微流控陣列芯片與普通芯片在設(shè)計(jì)與應(yīng)用上存在顯著差異 設(shè)計(jì)原理:微流控陣列芯片以微米級(jí)通道操控流體,集成多種實(shí)驗(yàn)功能;普通芯片則通?;诰w管,用于電子信號(hào)處理。 應(yīng)用領(lǐng)域:微流控陣列
    的頭像 發(fā)表于 10-30 15:10 ?623次閱讀

    FPGA加速深度學(xué)習(xí)模型的案例

    FPGA(現(xiàn)場(chǎng)可編程門陣列加速深度學(xué)習(xí)模型是當(dāng)前硬件加速領(lǐng)域的一個(gè)熱門研究方向。以下是一些FPGA加速深度學(xué)習(xí)模型的案例: 一、基于FPGA的AlexNet卷積運(yùn)算
    的頭像 發(fā)表于 10-25 09:22 ?1115次閱讀

    共模電感漆包線越電流越大嗎

    電子發(fā)燒友網(wǎng)站提供《共模電感漆包線越電流越大嗎.docx》資料免費(fèi)下載
    發(fā)表于 09-04 11:49 ?0次下載

    基于FPGA的陣列相機(jī)的實(shí)時(shí)監(jiān)測(cè)和大容量存儲(chǔ)

    ,在后續(xù)的設(shè)計(jì)中,可以進(jìn)行豐富的圖像處理工作,比如 FPGA 預(yù)處理數(shù)據(jù),GPU 加速,PC 跑算法等,具 有較強(qiáng)的完備性和升級(jí)性; 4.2
    發(fā)表于 06-20 20:10

    高速信號(hào)處理板卡設(shè)計(jì)原理圖:519-基于ZU19EG的4路100G光纖的PCIe 雷達(dá)信號(hào)處理

    XCZU19EG板卡 , XCZU19EG存儲(chǔ)陣列 , 高速信號(hào)處理 , 智能加速計(jì)算卡
    的頭像 發(fā)表于 06-19 10:48 ?777次閱讀
    高速信號(hào)<b class='flag-5'>處理</b>板卡設(shè)計(jì)原理圖:519-基于ZU19EG的4路100G光纖的PCIe 雷達(dá)信號(hào)<b class='flag-5'>處理</b>卡

    麥格納為中國(guó)本土汽車制造商提供重構(gòu)座椅系統(tǒng)

    在過去的逾65年時(shí)間里,麥格納始終致力于重新定義駕乘體驗(yàn)和車輛設(shè)計(jì)概念。如今,麥格納再一次顛覆傳統(tǒng)座艙設(shè)計(jì),為一家中國(guó)本土汽車制造商提供重構(gòu)座椅系統(tǒng),這也是麥格納全球的首個(gè)重構(gòu)座椅
    的頭像 發(fā)表于 06-18 17:13 ?2113次閱讀