女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

RapidStream:FPGA HLS設(shè)計(jì)的并行物理實(shí)現(xiàn)

SSDFans ? 來(lái)源:SSDFans ? 作者: EVE ? 2022-05-25 09:50 ? 次閱讀

FPGA的布局布線軟件向來(lái)跑得很慢。事實(shí)上,F(xiàn)PGA供應(yīng)商已經(jīng)花了很大的精力使其設(shè)計(jì)軟件在多核處理器上運(yùn)行得更快。

最近,在ACM的FPGA 2022會(huì)議上發(fā)表了一篇題為“RapidStream: FPGA HLS設(shè)計(jì)的并行物理實(shí)現(xiàn)”的論文,論文中描述了一種非常有趣的方法,通過(guò)FPGA設(shè)計(jì)軟件推動(dòng)HLS設(shè)計(jì)更快地運(yùn)行在多核處理器上。

這篇論文由UCLA、AMD-Xilinx、根特大學(xué)和康奈爾大學(xué)的研究團(tuán)隊(duì)撰寫,描述了RapidStream自動(dòng)分區(qū)算法,將數(shù)據(jù)流設(shè)計(jì)分割成多個(gè)“island”,在劃分的island之間插入“anchor regions”,然后通過(guò)anchor regions中的寄存器將每個(gè)island的信號(hào)連起來(lái)整合到整個(gè)設(shè)計(jì)中。

所有這些劃分和拼接背后的目的是將HLS設(shè)計(jì)分割成小塊,交付給現(xiàn)代服務(wù)器中的多個(gè)核心。這種策略已經(jīng)有悠久的歷史,現(xiàn)在被用于加速FPGA的開(kāi)發(fā)。

這個(gè)過(guò)程有三個(gè)主要的HLS級(jí)約束:

1、非重疊分區(qū)——并行化不同island的物理實(shí)現(xiàn);

2、流水線化的island間連接——每個(gè)island間連接都流水線化,以滿足時(shí)序要求;

3、直接連接——每個(gè)island只能與相鄰的island直接連接。當(dāng)并行化設(shè)計(jì)布局布線時(shí),這個(gè)約束是至關(guān)重要的。

(注意:這些約束與用于控制邏輯綜合的各種約束完全不同,它處于一個(gè)更高的層次。)

RapidStream的開(kāi)發(fā)者將數(shù)據(jù)流設(shè)計(jì)定義為一組并行處理元素(processing element,簡(jiǎn)稱PE)和一組根據(jù)設(shè)計(jì)的數(shù)據(jù)流需求將PE連接起來(lái)的FIFO。PE內(nèi)部可以很復(fù)雜,但只能通過(guò)FIFO接口與其他PE進(jìn)行數(shù)據(jù)通信

如上所述,RapidStream將FPGA fabric劃分為兩種region:大小相同的region和在相鄰region之間以窄列和行放置的anchor region。有趣的是,RapidStream似乎是專門為AMD-Xilinx Virtex UltraScale+ FPGA構(gòu)建的,這是由FPGAchiplet(AMD-Xilinx語(yǔ)言中的超級(jí)邏輯區(qū)域,簡(jiǎn)稱SLR)制成的2.5D器件。

a247143c-dbbf-11ec-ba43-dac502259ad0.png

這篇論文包含了幾個(gè)描述RapidStream工作性能的圖表。下圖顯示了在分區(qū)后,六種不同的數(shù)據(jù)流設(shè)計(jì)與沒(méi)有分區(qū)的流水線/非流水線版本時(shí)鐘速率的比較。

a2b9d65c-dbbf-11ec-ba43-dac502259ad0.png

從上圖可以看出,RapidStream比所有非流水線版本的時(shí)鐘速率更高。這是意料之中的,因?yàn)榱魉€是FPGA時(shí)鐘速度改進(jìn)的核心。然而,六種情況中,有五種情況RapidStream的結(jié)果比相同設(shè)計(jì)的流水線RTL版本要好,這個(gè)結(jié)果要引起我們的注意。

下面是布局布線的時(shí)間結(jié)果對(duì)比:

a33394ce-dbbf-11ec-ba43-dac502259ad0.png

RapidStream的布局布線運(yùn)行時(shí)間比未分區(qū)設(shè)計(jì)的結(jié)果要好得多。這是因?yàn)镽apidStream可以將每個(gè)分區(qū)送給不同的處理器核心來(lái)布局布線。

雖然FPGA供應(yīng)商試圖讓布局布線算法在多核處理器上工作得更快,但RapidStream的開(kāi)發(fā)人員根據(jù)經(jīng)驗(yàn)發(fā)現(xiàn),如果FPGA設(shè)計(jì)沒(méi)有分區(qū),在超過(guò)兩個(gè)處理器核心上運(yùn)行AMD-Xilinx Vivado設(shè)計(jì)工具時(shí)并沒(méi)有太大改善。

如果有讀者正在用FPGA開(kāi)發(fā)HLS設(shè)計(jì)——特別是AMD-Xilinx FPGA,那么應(yīng)該會(huì)對(duì)RapidStream感興趣。更細(xì)節(jié)的內(nèi)容可以在GitHub上找到。

原文標(biāo)題:HLS分區(qū)加速FPGA布局布線!

文章出處:【微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1643

    文章

    21937

    瀏覽量

    613203
  • Xilinx
    +關(guān)注

    關(guān)注

    73

    文章

    2181

    瀏覽量

    124149
  • 布局布線
    +關(guān)注

    關(guān)注

    1

    文章

    89

    瀏覽量

    15319
  • HLS
    HLS
    +關(guān)注

    關(guān)注

    1

    文章

    131

    瀏覽量

    24601

原文標(biāo)題:HLS分區(qū)加速FPGA布局布線!

文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Linux系統(tǒng)中通過(guò)預(yù)留物理內(nèi)存實(shí)現(xiàn)ARM與FPGA高效通信的方法

    管理子系統(tǒng)管理。因此,需要預(yù)留一部分物理內(nèi)存,使其不被內(nèi)核管理。接下來(lái)將為大家詳細(xì)介紹在 Linux 系統(tǒng)中通過(guò)預(yù)留物理內(nèi)存實(shí)現(xiàn) ARM 與 FPGA 高效通信的方法,預(yù)留
    的頭像 發(fā)表于 04-16 13:42 ?476次閱讀
    Linux系統(tǒng)中通過(guò)預(yù)留<b class='flag-5'>物理</b>內(nèi)存<b class='flag-5'>實(shí)現(xiàn)</b>ARM與<b class='flag-5'>FPGA</b>高效通信的方法

    Vivado HLS設(shè)計(jì)流程

    為了盡快把新產(chǎn)品推向市場(chǎng),數(shù)字系統(tǒng)的設(shè)計(jì)者需要考慮如何加速設(shè)計(jì)開(kāi)發(fā)的周期。設(shè)計(jì)加速主要可以從“設(shè)計(jì)的重用”和“抽象層級(jí)的提升”這兩個(gè)方面來(lái)考慮。Xilinx 推出的 Vivado HLS 工具可以
    的頭像 發(fā)表于 04-16 10:43 ?530次閱讀
    Vivado <b class='flag-5'>HLS</b>設(shè)計(jì)流程

    如何使用FPGA驅(qū)動(dòng)并行ADC和DAC芯片,使用不同編碼方式的ADC與DAC時(shí)的注意事項(xiàng)

    ADC和DAC是FPGA與外部信號(hào)的接口,從數(shù)據(jù)接口類型的角度劃分,有低速的串行接口和高速的并行接口。FPGA經(jīng)常用來(lái)采集中高頻信號(hào),因此使用并行ADC和DAC居多。本文將介紹如何使用
    的頭像 發(fā)表于 03-14 13:54 ?933次閱讀
    如何使用<b class='flag-5'>FPGA</b>驅(qū)動(dòng)<b class='flag-5'>并行</b>ADC和DAC芯片,使用不同編碼方式的ADC與DAC時(shí)的注意事項(xiàng)

    FPGA+AI王炸組合如何重塑未來(lái)世界:看看DeepSeek東方神秘力量如何預(yù)測(cè)......

    ,涵蓋了通信、人工智能、工業(yè)自動(dòng)化、視頻處理等多個(gè)領(lǐng)域: ? 通信行業(yè):用于基站、網(wǎng)絡(luò)邊緣計(jì)算等場(chǎng)景,處理復(fù)雜的物理協(xié)議和邏輯控制。 ? 人工智能:FPGA并行處理能力使其在高性能計(jì)算應(yīng)用中表
    發(fā)表于 03-03 11:21

    使用HLS流程設(shè)計(jì)和驗(yàn)證圖像信號(hào)處理設(shè)備

    STMicroelectronics成像部門負(fù)責(zé)向消費(fèi)者、工業(yè)、安全和汽車市場(chǎng)提供創(chuàng)新的成像技術(shù)和產(chǎn)品。該團(tuán)隊(duì)精心制定了一套通過(guò)模板實(shí)現(xiàn)的High-Level Synthesis(HLS)高層次綜合流程,使得上述產(chǎn)品能夠迅速上市。對(duì)于汽車市場(chǎng),該流程符合ISO 26262
    的頭像 發(fā)表于 01-08 14:39 ?534次閱讀
    使用<b class='flag-5'>HLS</b>流程設(shè)計(jì)和驗(yàn)證圖像信號(hào)處理設(shè)備

    基于FPGA實(shí)現(xiàn)圖像直方圖設(shè)計(jì)

    簡(jiǎn)單,單采用FPGA來(lái)實(shí)現(xiàn)直方圖的統(tǒng)計(jì)就稍顯麻煩。若使用Xilinx和Altera的FPGA芯片,可以使用HLS來(lái)進(jìn)行圖像的加速處理。但這暫時(shí)不是我的重點(diǎn)。 用C語(yǔ)言
    的頭像 發(fā)表于 12-24 10:24 ?632次閱讀
    基于<b class='flag-5'>FPGA</b><b class='flag-5'>實(shí)現(xiàn)</b>圖像直方圖設(shè)計(jì)

    助力AIoT應(yīng)用:在米爾FPGA開(kāi)發(fā)板上實(shí)現(xiàn)Tiny YOLO V4

    受限的設(shè)備上運(yùn)行,尤其在低功耗、實(shí)時(shí)檢測(cè)的邊緣計(jì)算設(shè)備中表現(xiàn)出色。相比傳統(tǒng) GPU,FPGA 能在小面積和低功耗下實(shí)現(xiàn)類似的推理性能,非常契合 AIoT 應(yīng)用。像米爾 ZU3EG 這樣的 FPGA
    發(fā)表于 12-06 17:18

    SATA主機(jī)協(xié)議的物理層的實(shí)現(xiàn)過(guò)程

    這里講解SATA主機(jī)協(xié)議的物理層的實(shí)現(xiàn)過(guò)程。
    的頭像 發(fā)表于 10-22 15:17 ?765次閱讀
    SATA主機(jī)協(xié)議的<b class='flag-5'>物理</b>層的<b class='flag-5'>實(shí)現(xiàn)</b>過(guò)程

    如何在FPGA實(shí)現(xiàn)按鍵消抖

    FPGA(現(xiàn)場(chǎng)可編程門陣列)中實(shí)現(xiàn)按鍵消抖是一個(gè)重要的設(shè)計(jì)環(huán)節(jié),特別是在處理用戶輸入時(shí),由于物理按鍵的機(jī)械特性和電氣特性,按鍵在按下和釋放的瞬間會(huì)產(chǎn)生抖動(dòng)現(xiàn)象,這種抖動(dòng)可能導(dǎo)致系統(tǒng)錯(cuò)誤地識(shí)別為多次
    的頭像 發(fā)表于 08-19 18:15 ?3105次閱讀

    優(yōu)化 FPGA HLS 設(shè)計(jì)

    減少錯(cuò)誤并更容易調(diào)試。然而,經(jīng)常出現(xiàn)的問(wèn)題是性能權(quán)衡。在高度復(fù)雜的 FPGA 設(shè)計(jì)中實(shí)現(xiàn)高性能需要手動(dòng)優(yōu)化 RTL 代碼,而這對(duì)于HLS開(kāi)發(fā)環(huán)境生成的 RTL 代碼來(lái)說(shuō)是不可能的。然而,存在一些解決方案
    發(fā)表于 08-16 19:56

    FPGA在人工智能中的應(yīng)用有哪些?

    以承擔(dān)機(jī)器人路徑規(guī)劃、環(huán)境感知、運(yùn)動(dòng)控制等任務(wù),結(jié)合外部傳感器的反饋信息,實(shí)現(xiàn)高效、準(zhǔn)確的機(jī)器人控制系統(tǒng)。 四、優(yōu)勢(shì)總結(jié) 高并行性:FPGA的高并行性使其在處理大規(guī)模
    發(fā)表于 07-29 17:05

    在多FPGA集群上實(shí)現(xiàn)高級(jí)并行編程

    今天我們看的這篇論文介紹了在多FPGA集群上實(shí)現(xiàn)高級(jí)并行編程的研究,其主要目標(biāo)是為非FPGA專家提供一個(gè)成熟且易于使用的環(huán)境,以便在多個(gè)并行
    的頭像 發(fā)表于 07-24 14:54 ?1704次閱讀

    基于FPGA的圖像采集與顯示系統(tǒng)設(shè)計(jì)

    源和固有的并行處理能力,在數(shù)字信號(hào)處理、硬件加速、汽車電子等領(lǐng)域得到了廣泛應(yīng)用。在圖像采集與顯示系統(tǒng)中,FPGA能夠實(shí)現(xiàn)高速、并行的數(shù)據(jù)處理,顯著提高系統(tǒng)的實(shí)時(shí)性和性能。本文設(shè)計(jì)了一個(gè)
    的頭像 發(fā)表于 07-17 10:58 ?2574次閱讀

    一種在HLS中插入HDL代碼的方式

    很多人都比較反感用C/C++開(kāi)發(fā)(HLSFPGA,大家第一拒絕的理由就是耗費(fèi)資源太多。但是HLS也有自己的優(yōu)點(diǎn),除了快速構(gòu)建算法外,還有一個(gè)就是接口的生成,尤其對(duì)于AXI類接口,按照標(biāo)準(zhǔn)語(yǔ)法就可以很方便地生成相關(guān)接口。
    的頭像 發(fā)表于 07-16 18:01 ?1315次閱讀
    一種在<b class='flag-5'>HLS</b>中插入HDL代碼的方式

    請(qǐng)問(wèn)如何使用fx3芯片來(lái)對(duì)FPGA進(jìn)行并行配置?

    我閱讀過(guò)AN84868,了解到fx3可以對(duì)連接的FPGA芯片進(jìn)行串行配置;但是我的項(xiàng)目中,希望能盡量縮短FPGA配置的時(shí)間,因此希望能夠了解是否有辦法使用fx3芯片對(duì)外接的FPGA芯片進(jìn)行并行
    發(fā)表于 05-28 08:30