女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

電子發燒友App

硬聲App

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示
電子發燒友網>電子資料下載>電子資料>ThunderGP:基于HLS的FPGA圖形處理框架

ThunderGP:基于HLS的FPGA圖形處理框架

2022-10-27 | zip | 0.52 MB | 次下載 | 免費

資料介紹

描述

“整個互聯網電子商務世界都是由圖分析驅動的”,因為圖結構可以自然地代表許多重要應用領域的數據集,例如社交網絡、網絡安全和機器學習。來自這些應用程序的數據對高性能圖形處理提出了迫切的需求。

大量研究構建基于 FPGA 的高效圖形處理加速器;但是,高級圖形應用程序與底層 CPU-FPGA 平臺之間仍然存在差距,這需要開發人員了解硬件細節并進行大量編程(例如,使用硬件描述語言進行編程、調整管道和進行內存優化) . 這一差距在很大程度上阻礙了數據中心應用程序開發人員采用 FPGA。

ThunderGP 有什么大不了的?

ThunderGP 通過為 FPGA 加速圖形處理帶來性能和可編程性來彌補上述差距,并已在FPGA'21中被接受。

ThunderGP 是 FPGA 上基于 HLS 的開源圖形處理框架,支持 Vitis 和 SDAccel 開發環境,適用于 Xilinx Alveo 平臺,如 U50、U200、U250 和 VCU1525。使用 ThunderGP,開發人員只需要編寫使用基于顯式高級語言 (C++) 且與硬件無關的 API 的高級函數。隨后,ThunderGP 在具有多個超級邏輯區域 (SLR) 的最先進 FPGA 平臺上自動生成高性能加速器并管理加速器的部署。

pYYBAGNYkpmAERC5AAEBnp1A6Bo506.png
圖 1:ThunderGP 概覽。它與 Vitis 和 SDAccel 工具兼容。
?

ThunderGP 的概述如圖 1 所示。我們簡要說明主要構建塊如下。

  • 內置加速器模板。ThunderGP 采用 Gather-Apply-Scatter (GAS) 模型作為各種圖算法的抽象,并通過內置的高并行和內存高效的加速器模板來實現模型。
  • 自動加速器生成。自動加速器生成可產生可合成的加速器,釋放底層 FPGA 平臺的全部潛力。除了內置加速器模板外,它還采用圖形算法的分散、聚集和應用階段(來自 GAS 模型)和 FPGA 平臺模型(例如,U50)的用戶定義函數 (UDF) ) 來自開發人員作為輸入。
  • 圖分區和調度。ThunderGP 采用基于目標頂點的垂直分區方法,無需引入邊緣排序等繁重的預處理操作,即可通過片上 RAM 實現頂點緩沖。
  • 高級API。ThunderGP 提供了兩組基于 C++ 的 API:用于自定義圖形算法加速器的加速器 API (Acc-API) 和用于加速器部署和執行的 Host-API。

有關 GAS 模型、API 和 ThunderGP 設計的詳細信息,請參閱ThunderGP 技術報告(附件或GitHub 上)。

ThunderGP 的易用性如何?

我們進行了一個案例研究——使用 Vitis 2020.1 在 Alveo U50 板上進行 COVID-19 的傳播預測——以展示 ThunderGP 如何輕松應用于現實生活中的圖形處理問題。

及時預測人口水平上隨時間變化的感染流行率對于部署適當的封鎖措施(例如隔離或社交距離)以減輕病毒傳播具有重要作用。當前的傳播預測模型一般由空間元胞自動機(CA)和時間易感感染清除(SIR)模型組成,其中單元代表一個居民區(如縣)并保持其狀態(如感染率)由 SIR 模型根據相鄰小區之間的傳輸進行更新。因此,傳播可以表述為一個圖處理問題,其中縣及其連接由圖表示,并且 SIR 通過圖中的傳播更新。

我們使用 ThunderGP 實現了三個傳播模型:CA-SIR [1]、CA-SEIR [2] 和 CA-SAIR [3] 模型。該數據集來自 COVID-19 影響分析平臺 [4],包含 3.1K 縣和 2.3M 連接。

在這里,我們展示了為清單 1 中的 CA-SAIR 模型實現加速器的示例。對于分散階段,每個縣(一個小區)根據其感染率及其連接強度計算感染率以推送到相鄰縣它量化了縣際流動的數量和頻率。對于聚集階段,該縣會累積推到它的所有感染率。在申請階段,收集到的感染率用于計算感染率。注意apply階段涉及到很多用戶自定義參數(ThunderGP支持apply階段自定義參數,詳見技術報告)。

pYYBAGNYkpyAIMe0AAG51Gwcl_Q925.png
清單 1:用于在 U50 平臺上加速 COVID-19 傳播預測的用戶輸入。
?

圖 2 顯示了使用公共數據集進行預測一周后美國感染風險的可視化。結果與在 CPU 端執行的開源 Python 程序 [3] 相匹配。

pYYBAGNYkp6ARHlUAAESLIipjbI602.png
圖 2:從預測時間開始一周后感染風險的可視化。
?

表 1 量化了 ThunderGP 在此任務上所涉及的開發工作,并顯示了與基于 Python 的 CPU 實現的性能比較[3]。根據結果??,使用 ThunderGP 解決這個問題的好處是雙重的。首先,ThunderGP 比基于 CPU 的解決方案實現了高達419 倍的加速。能夠在短時間內預測傳播可以幫助對傳播狀況做出快速及時的反應。其次,CA-SIR 模型隨著對病毒認識的不斷深入而快速發展。使用 ThunderGP,開發者只需編寫幾十行代碼用于加速預測通常一天,這最大限度地減少了開發工作。這個初步結果是有希望的,并且系統是開源的,我們相信可以進行更多的案例研究來進一步評估可編程性的改進。

pYYBAGNYkqGASc_zAAC4rUUSJJM386.png
表 1:ThunderGP 在 U50 平臺上對 COVID-19 傳播預測的開發工作。將數據集格式化為標準圖形格式的代碼不計算在內。FPGA 映像的編譯時間不包括在開發時間中。
?

[1] 馬富恩特斯等人。物理學 A:統計力學及其應用,1999。

[2] 何塞 M Carcione 等人。基于確定性 seir 模型的 covid-19 流行病模擬arXiv,2020 年。

[3] 周一望等。用于告知美國縣級 covid-19 風險的時空流行病學預測模型。哈佛數據科學評論,2020 年。

[4] 馬里蘭大學 COVID-19 影響分析平臺。https: //data.covid.umd.edu,2020-09-10。

ThunderGP 的效率如何?

如前所述,已有大量基于 FPGA 的圖形處理加速器的研究工作。在本章中,我們將與最先進的設計進行公平比較,以展示 ThunderGP 的效率。數據集和圖應用請參考ThunderGP 技術報告

我們首先將 ThunderGP 與最先進的基于 RTL 的工作:Hitgraph [1] 進行比較,如表 2 所示。性能指標是每秒百萬邊緣遍歷 (MTEPS)。所有的實現都基于四個 SLR,但不同之處在于 HitGraph 沒有考慮使用多個 SLR 的開銷,因為它的性能是基于模擬的,只是簡單地縮放到多個 SLR 的內存帶寬。性能加速高達 2.9 倍。更重要的是我們讓設計在真實硬件上執行。

poYBAGNYkqSACbIdAACmJ7-Cfog822.png
表 2:與最先進設計的性能比較[1]。
?

然后我們將 ThunderGP 與基于 HLS 的框架進行比較:Chen 等人。[2] 和 GraphOps[3]。由于他們的實驗不是使用多個 SLR 進行的,因此內存帶寬較少,為了進行公平比較,我們使用帶寬效率 (MTEPS/(GB/s)) 作為衡量標準。如表 3 所示,ThunderGP 比 GraphOps 實現了高達 29.2 倍的絕對加速和 12.3 倍的帶寬效率提升,比 Chen 等人實現了 5.2 倍的絕對加速和 2.4 倍的帶寬效率提升。

poYBAGNYkqaANZgsAAFAf0TAh2c776.png
表 3:在絕對性能和帶寬效率(BW 效率)方面與最先進的基于 HLS 的框架進行比較。
?

加速來自 ThunderGP 的先進設計。請查看技術報告了解更多設計細節。

[ 1 ]周世杰等.HitGraph:FPGA 上的高吞吐量圖處理框架。TPDS,2019 年

[2] 陳新宇等。用于在基于 opencl 的 fpgas 上進行圖形處理的動態并行數據混洗。FPL,2019

[3] Tayo Oguntebi 等人。Graphops:用于圖形分析加速的數據流庫。FPGA,2016 年。

讓我們開始使用 ThunderGP!

到目前為止,您可能對 ThunderGP 感興趣!

不用擔心,我們在 GitHub 存儲庫中提供了使用 ThunderGP 的分步指南。

對于第一級使用,我們為只需要內置圖形處理算法的用戶編寫指南。

對于二級使用,我們引導用戶使用系統提供的API為自己的應用定制加速器。

查看 README https://github.com/Xtra-Computing/ThunderGP/tree/develop_u50 中的詳細說明。

?


下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1山景DSP芯片AP8248A2數據手冊
  2. 1.06 MB  |  532次下載  |  免費
  3. 2RK3399完整板原理圖(支持平板,盒子VR)
  4. 3.28 MB  |  339次下載  |  免費
  5. 3TC358743XBG評估板參考手冊
  6. 1.36 MB  |  330次下載  |  免費
  7. 4DFM軟件使用教程
  8. 0.84 MB  |  295次下載  |  免費
  9. 5元宇宙深度解析—未來的未來-風口還是泡沫
  10. 6.40 MB  |  227次下載  |  免費
  11. 6迪文DGUS開發指南
  12. 31.67 MB  |  194次下載  |  免費
  13. 7元宇宙底層硬件系列報告
  14. 13.42 MB  |  182次下載  |  免費
  15. 8FP5207XR-G1中文應用手冊
  16. 1.09 MB  |  178次下載  |  免費

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234315次下載  |  免費
  3. 2555集成電路應用800例(新編版)
  4. 0.00 MB  |  33566次下載  |  免費
  5. 3接口電路圖大全
  6. 未知  |  30323次下載  |  免費
  7. 4開關電源設計實例指南
  8. 未知  |  21549次下載  |  免費
  9. 5電氣工程師手冊免費下載(新編第二版pdf電子書)
  10. 0.00 MB  |  15349次下載  |  免費
  11. 6數字電路基礎pdf(下載)
  12. 未知  |  13750次下載  |  免費
  13. 7電子制作實例集錦 下載
  14. 未知  |  8113次下載  |  免費
  15. 8《LED驅動電路設計》 溫德爾著
  16. 0.00 MB  |  6656次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935054次下載  |  免費
  3. 2protel99se軟件下載(可英文版轉中文版)
  4. 78.1 MB  |  537798次下載  |  免費
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420027次下載  |  免費
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234315次下載  |  免費
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費
  11. 6電路仿真軟件multisim 10.0免費下載
  12. 340992  |  191187次下載  |  免費
  13. 7十天學會AVR單片機與C語言視頻教程 下載
  14. 158M  |  183279次下載  |  免費
  15. 8proe5.0野火版下載(中文版免費下載)
  16. 未知  |  138040次下載  |  免費