女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何區分RapidStream自動分區算法

科技綠洲 ? 來源:SSDFans ? 作者:SSDFans ? 2022-05-25 10:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

FPGA的布局布線軟件向來跑得很慢。事實上,FPGA供應商已經花了很大的精力使其設計軟件在多核處理器上運行得更快。

最近,在ACM的FPGA 2022會議上發表了一篇題為“RapidStream: FPGA HLS設計的并行物理實現”的論文,論文中描述了一種非常有趣的方法,通過FPGA設計軟件推動HLS設計更快地運行在多核處理器上。

這篇論文由UCLA、AMD-Xilinx、根特大學和康奈爾大學的研究團隊撰寫,描述了RapidStream自動分區算法,將數據流設計分割成多個“island”,在劃分的island之間插入“anchor regions”,然后通過anchor regions中的寄存器將每個island的信號連起來整合到整個設計中。

所有這些劃分和拼接背后的目的是將HLS設計分割成小塊,交付給現代服務器中的多個核心。這種策略已經有悠久的歷史,現在被用于加速FPGA的開發。

這個過程有三個主要的HLS級約束:

1、非重疊分區——并行化不同island的物理實現;

2、流水線化的island間連接——每個island間連接都流水線化,以滿足時序要求;

3、直接連接——每個island只能與相鄰的island直接連接。當并行化設計布局布線時,這個約束是至關重要的。

(注意:這些約束與用于控制邏輯綜合的各種約束完全不同,它處于一個更高的層次。)

RapidStream的開發者將數據流設計定義為一組并行處理元素(processing element,簡稱PE)和一組根據設計的數據流需求將PE連接起來的FIFO。PE內部可以很復雜,但只能通過FIFO接口與其他PE進行數據通信

如上所述,RapidStream將FPGA fabric劃分為兩種region:大小相同的region和在相鄰region之間以窄列和行放置的anchor region。有趣的是,RapidStream似乎是專門為AMD-Xilinx Virtex UltraScale+ FPGA構建的,這是由FPGA chiplet(AMD-Xilinx語言中的超級邏輯區域,簡稱SLR)制成的2.5D器件。

poYBAGKNjhaAUxPIAAEoZSVbt0k599.png

這篇論文包含了幾個描述RapidStream工作性能的圖表。下圖顯示了在分區后,六種不同的數據流設計與沒有分區的流水線/非流水線版本時鐘速率的比較。

pYYBAGKNjh-AJRblAACQ8BvDUQM665.png

從上圖可以看出,RapidStream比所有非流水線版本的時鐘速率更高。這是意料之中的,因為流水線是FPGA時鐘速度改進的核心。然而,六種情況中,有五種情況RapidStream的結果比相同設計的流水線RTL版本要好,這個結果要引起我們的注意。

下面是布局布線的時間結果對比:

poYBAGKNjiiANNsXAACO00o9gDE819.png

RapidStream的布局布線運行時間比未分區設計的結果要好得多。這是因為RapidStream可以將每個分區送給不同的處理器核心來布局布線。

雖然FPGA供應商試圖讓布局布線算法在多核處理器上工作得更快,但RapidStream的開發人員根據經驗發現,如果FPGA設計沒有分區,在超過兩個處理器核心上運行AMD-Xilinx Vivado設計工具時并沒有太大改善。

如果有讀者正在用FPGA開發HLS設計——特別是AMD-Xilinx FPGA,那么應該會對RapidStream感興趣。更細節的內容可以在GitHub上找到。

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1645

    文章

    22036

    瀏覽量

    618095
  • 數據
    +關注

    關注

    8

    文章

    7255

    瀏覽量

    91806
  • 多核處理器
    +關注

    關注

    0

    文章

    109

    瀏覽量

    20308
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    基于動態區分矩陣的屬性約簡算法

    在分析基于靜態區分矩陣的屬性約簡算法基礎上,提出一種基于動態區分矩陣的屬性約簡算法。該算法采用2種不同的
    發表于 04-09 08:41 ?16次下載

    基于外極線分區的動態立體匹配算法

    基于區域的立體匹配算法僅針對支撐窗內的灰度信息定義匹配代價函數,導致在弱(無)紋理區域采用WTA優化出現歧義性。該文在外極線分區的基礎上,改用區域作為匹配基元,針對歧
    發表于 04-11 08:37 ?21次下載

    最佳集水分區模擬之研究

    本研究是以南投縣水里溪集水區為研究對象,運用集水分區分析法來進行最佳集水分區之工作,以協助集水區管理策略的制定。為了提升集水區管理效率,必須進行集水分區之工作,而
    發表于 04-10 12:15 ?30次下載

    一種多核混合分區調度算法設計與實現

    一種多核混合分區調度算法設計與實現_郝繼鋒
    發表于 01-07 19:00 ?1次下載

    一種基于能量均衡的分區成鏈路由算法

    一種基于能量均衡的分區成鏈路由算法_潘琢金
    發表于 01-07 19:08 ?0次下載

    基于分區連通性恢復算法DCRA

    針對現有算法恢復分區連通性存在容錯性差的問題,提出了分區雙連通性恢復算法DCRA。該算法旨在網絡中心區域構建骨干多邊形,
    發表于 11-21 14:35 ?3次下載
    基于<b class='flag-5'>分區</b>連通性恢復<b class='flag-5'>算法</b>DCRA

    基于迭代填充的內存計算框架分區映射算法

    針對內存計算框架Spark在作業Shuffle階段一次分區產生的數據傾斜問題,提出一種內存計算框架的迭代填充分區映射算法(IFPM)。首先,分析Spark作業的執行機制,建立作業效率模型和分區
    發表于 12-05 16:32 ?0次下載
    基于迭代填充的內存計算框架<b class='flag-5'>分區</b>映射<b class='flag-5'>算法</b>

    基于場景分區的隨機潮流解析算法

    可再生能源在電力系統中的滲透率日益提高,隨機因素的波動范圍逐漸增大,這對常規半不變量法的精度帶來了很大的挑戰。文中提出一種基于場景分區的隨機潮流新算法:首先,采用場景削減算法獲取系統典型運行場景
    發表于 12-15 15:21 ?0次下載
    基于場景<b class='flag-5'>分區</b>的隨機潮流解析<b class='flag-5'>算法</b>

    基于區分對象集的啟發式屬性約簡算法

    基于正域的屬性約簡算法是利用下近似思想,僅考慮被正確區分樣本數的約簡算法。借鑒上近似的思想,利用鄰域信息粒的概念定義了區分對象集,探討了其基本性質,并提出了基于
    發表于 01-05 11:28 ?0次下載

    Spark漸進填充分區映射算法

    定義求解,設計了漸進填充分區映射算法(PFPM,progressive filling partitioning and mapping algorithm),通過擴展式分區和漸進填充映射,建立適應
    發表于 01-14 16:50 ?0次下載
    Spark漸進填充<b class='flag-5'>分區</b>映射<b class='flag-5'>算法</b>

    硬盤為什么要分區 怎么分區

    磁盤的分區 裝過系統的人都知道必須要分區后才能安裝系統,形象點的說比如windows里C:,D:之類的東西;如果你要問硬盤為什么要分區,我也說不上來很嚴格的原因,首先從使用習慣上來講,我們不希望數據雜亂無章堆積在一起。
    發表于 04-19 14:52 ?7928次閱讀
    硬盤為什么要<b class='flag-5'>分區</b> 怎么<b class='flag-5'>分區</b>

    HIGHT算法的積分攻擊

    對輕量級分組密碼算法HIGHT在積分攻擊方法下的安全性進行了研究。首先糾正了現有研究成果在構造區分器時的不當之處,重新構造了HIGHT算法的11輪積分區分器,并構造了相應高階積分擴展下
    發表于 02-09 16:48 ?0次下載

    基于RC模型的多分區權值約簡微博社區檢測算法

    傳統社區檢測算法直接引入第三方算法會降低計算效率。為此,基于RC模型,設計多分區權值約簡有限區間限定算法進行微博社區檢測。研究微博社區發現RC模型,分析參數加權約簡曲線性質,借鑒凸優
    發表于 11-16 18:06 ?16次下載
    基于RC模型的多<b class='flag-5'>分區</b>權值約簡微博社區檢測<b class='flag-5'>算法</b>

    LICi算法抵抗積分攻擊的相關實驗及分析

    為分析目前LiCi算法抵抗積分攻擊的能力,利用基于比特的可分性質,結合MILP搜索工具對LiCi算法的積分區分器進行搜索。搜索得到最長輪數積分區分器為12輪積
    發表于 03-30 14:05 ?18次下載
    LICi<b class='flag-5'>算法</b>抵抗積分攻擊的相關實驗及分析

    基于向量分區和三維骨架化的CT圖像算法

    基于向量分區和三維骨架化的CT圖像算法
    發表于 06-25 15:19 ?22次下載