女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于Xilinx FPGA的SDK端的深度學習開發工具包

電子工程師 ? 來源:祥瑞Coding ? 作者:祥瑞Coding ? 2021-03-30 10:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

背景:深鑒科技的DNNDK,是一個基于Xilinx FPGASDK端的深度學習開發工具包,能夠快速的實現深度學習的硬件化。

目的:了解深鑒科技DNNDK內容。

參考內容:

http://www.deephi.com/technology/dnndk

deephi_dnndk_1.10_betadocs user Guide

本篇目錄

1. 概覽

1.1 DNNDK基于什么?

1.2DP-8000開發板

2. DNNDK Framework

3. DPU應用部署

3.1模型壓縮

3.2模型編譯

4. DPU編程

4.1DPU Kernel

4.2DPU Task

4.3DPU Node

4.4DPU Tensor

5. 混合編譯

6. 運行

7. 重要信息

7.1 板子是否為xilinx的開發板?

7.2 源碼是否公開?

正文

1概覽

DNNDK (Deep Neural Network Development Kit) - DeePhi deep learning SDK, is designed as an integrated framework, which aims to simplify & accelerate DL (Deep Learning) applications development and deployment on DeePhi DPU (Deep Learning Processing Unit) platform. (Click DNNDK for more information.)

1.1 DNNDK基于什么?

深鑒科技基于 XILINX FPGA芯片 (包括 ZYNQ-7020,ZU2,ZU3,ZU9, KU115等)實現了多個DPU開發平臺(2018年將對外提供深鑒自主研發的對外提供深鑒自主研發的 DPU Soc芯片) ,DNNDK對所有 DPU開發平臺向用 戶提供統一的工具鏈和戶編程接口 APIs。

1.2DP-8000開發板

運用zynq7020芯片,開發板與FPGA芯片是不一樣的。

A complete set of solid optimization toolchains, covering compression, compilation and runtime

Lightweight standard C/C++ programming APIs

Easy-to-use & flat/gentle learning curve

2DNNDK Framework

DNNDK組成:

DEep ComprEssioN Tool (DECENT),深度壓縮工具:提供剪枝和定點化運算。

Deep Neural Network Compiler (DNNC), 神經網絡編譯器:將網絡算法編譯到DPU平臺高效運行。運用DECENT后的caffe網絡模型作為輸入。

Deep Neural Network Assembler (DNNAS), 神經網絡集成器:將DPU指令流會編程標準的ELF二進制文件

Neural Network Runtime (N2Cube), 神經網絡運行,運行時支持環境,神經網絡的加載,資源管理,調度。N2Cube核心組件包括四個部分 : DPU驅動程序 (Driver),加載器 (Loader)、性能分析器 (Profiler)及編程開發庫編程開發庫 (Library)。

DPU Simulator and Profiler. 深度學習處理單元模擬器。simulator用于驗證二進制指令流,只是深鑒科技內部使用,沒有對外發布。

e04dd5cc-8c65-11eb-8b86-12bb97331649.png

3DPU應用部署

1. 模型壓縮 (主機)
2. 模型編譯 (主機)
3. DPU編程開發 (主機或開發板)
4. 混合編譯 (開發板)
5. 運行 (開發板)

3.1模型壓縮

DECENT工具:

e0b7bc58-8c65-11eb-8b86-12bb97331649.png

3.2模型編譯

e11b24dc-8c65-11eb-8b86-12bb97331649.png

編譯器前端( Parser)主要處理網絡模型的分析與轉換,解析輸入網絡模型的拓撲結構并將其為 DNNC內部與深度學習框架生成的計算圖用IR表示。

中端為優化器 (Optimizer),它基于內部IR實施各種編譯優化遍 ,包括融合計算圖中不同節點間的操作 、高效調度指令 、充分復用 DPU片上數據等 。

代碼生成器 (Code-generator)為DNNC編譯后端, 主要負責把經過中端優化后的計算圖IR映射成為高效運行在DPU上的指令流 。

4DPU編程

4.1DPU Kernel

將神經網絡實現為FPGA上實體(可以看作IPcore)。DPU Kernel可以理解為在DPU平臺上部署的平臺上部署的一個深度學習網絡模型的實 體。每個神經網絡對應 一個 DPU匯編文件,通過調用DPU運行N2Cube時的dpuLoadKernel()成為一個可運行實體。 DPU的運行時將其加載到特定內存空間并為其分配硬件資源。 然后通過調用 dpuCreateTask()將其實例化為多個DPU Task。

4.2DPU Task

DPU Task是 DPU Kernel的一個運行實例 。每個 DPU Task中處理一個具體的計算任務。每個 DPU Task之間的內存空間相互獨立,使得我們可以通過多線程來運行多個 DPU Task,以此來提高系統效率和吞吐量 。

4.3DPU Node

DPU Node是DPU上運行網絡模型的一個組成部分 。每個 DPU Node都有其對應的輸入、出以及其對應的輸入、出以及相關參數。DPU Node依靠其名稱來索引,我們可以依靠其名稱來索引,我們可以通過 DNNDK提供的 API來獲取每個 Node的相關信息 的相關信息 。

4.4DPU Tensor

DPU Tensor是多維數據的集合 ,用來存儲網絡在運行過程中的數據信息。我們可以通過DNNDK提供的 API獲取某個 Tensor對應的屬性,如 Height, Width,Channel以及地址信息。

5混合編譯

e17b2756-8c65-11eb-8b86-12bb97331649.png

6運行

e1cd9fa4-8c65-11eb-8b86-12bb97331649.png

DPU運行時主要包含四部分:加載器 (Loader)、性能 、性能分析器( Profiler)、庫( Library)和 DPU驅動( DPU Driver)。

7重要信息

7.1 板子是否為xilinx的開發板?

不是Xilinx的開發板,只是包含Xilinx的FPGA芯片7z020,開發板是深鑒科技的開發板DP-8000,但是有DPU及相應工具的情況下可以運用Xilinx的開發板來實現。

7.2 源碼是否公開?

僅僅公開了主函數和.h頭文件,并沒有公開驅動和IPcore的源碼。

相當于對DPU的定義封裝到安裝文件和二進制文件中,無法看到源碼。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4814

    瀏覽量

    103482
  • Xilinx
    +關注

    關注

    73

    文章

    2184

    瀏覽量

    125210
  • 驅動程序
    +關注

    關注

    19

    文章

    861

    瀏覽量

    49089

原文標題:深鑒科技DNNDK概覽

文章出處:【微信號:HXSLH1010101010,微信公眾號:FPGA技術江湖】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    IQM 宣布 Resonance 量子云平臺重大升級,推出全新軟件開發工具包

    進程,并為終端用戶帶來性能強大的新一代量子系統。 此次升級將 Qrisp——一個源自德國弗勞恩霍夫 FOKUS 研究所的項目——設為平臺新的默認軟件開發工具包 (SDK)。Qrisp 為量子開發
    的頭像 發表于 07-11 11:03 ?89次閱讀

    rk3568開發工具

    rk3568開發工具
    發表于 04-16 17:03 ?2次下載

    AI開發工具分類與功能

    當下,AI開發工具不僅簡化了AI開發的復雜流程,還提高了開發效率,推動了AI技術的廣泛應用。下面,AI部落小編為大家介紹AI開發工具的分類及其功能。
    的頭像 發表于 04-12 10:12 ?335次閱讀

    云計算開發工具包的功能

    隨著云計算技術的不斷成熟,越來越多的企業開始將應用和服務遷移到云端,以享受彈性計算資源、高可用性和成本效益等優勢。為了加速這一進程,云計算服務提供商推出了各種開發工具包。下面,AI部落小編帶您了解云計算開發工具包的主要功能。
    的頭像 發表于 02-21 11:02 ?291次閱讀

    極海發布G32R5xx SDK,簡化MCU軟件遷移

    近日,極海正式推出了其最新的G32R5xx SDK(軟件開發工具包)。這款SDK以其高兼容性設計為核心亮點,旨在顯著簡化實時控制微控制器(MCU)的軟件遷移工作,為開發者帶來前所未有的
    的頭像 發表于 02-18 13:57 ?540次閱讀

    Labview聲音和振動工具包示例文件Sound Level

    Labview 聲音和振動工具包示例文件,聲壓測試,有模擬和DAQ兩個文件。
    發表于 01-05 09:15 ?2次下載

    最新Simplicity SDK軟件開發工具包發布

    最新的SimplicitySDK軟件開發工具包已經發布!此次更新針對SiliconLabs(芯科科技)第二代無線開發平臺帶來了包括藍牙6.0的信道探測(Channel Sounding
    的頭像 發表于 12-24 09:47 ?870次閱讀

    基于EasyGo Vs工具包和Nl veristand軟件進行的永磁同步電機實時仿真

    EasyGo Vs Addon是一款領先的FPGA仿真工具包軟件,它強大地連接了VeriStand軟件與Matlab/Simulink,為實時測試和驗證領域帶來了前所未有的便利和效率,特別適用于汽車
    的頭像 發表于 11-27 11:28 ?1032次閱讀
    基于EasyGo Vs<b class='flag-5'>工具包</b>和Nl veristand軟件進行的永磁同步電機實時仿真

    云計算開發工具包括什么

    云計算開發工具種類繁多,包括IDE、虛擬化軟件、容器化平臺、自動化部署工具和云平臺等。
    的頭像 發表于 11-22 10:11 ?538次閱讀

    FPGA加速深度學習模型的案例

    FPGA(現場可編程門陣列)加速深度學習模型是當前硬件加速領域的一個熱門研究方向。以下是一些FPGA加速深度
    的頭像 發表于 10-25 09:22 ?1196次閱讀

    FPGA仿真工具包軟件EasyGo Vs Addon介紹

    EasyGo Vs Addon是一款領先的FPGA仿真工具包軟件,它強大地連接了VeriStand軟件與Matlab/Simulink,為實時測試和驗證領域帶來了前所未有的便利和效率,特別適用于汽車、航空航天和能源電力等實時測試和驗證至關重要的行業。
    的頭像 發表于 10-24 15:55 ?1105次閱讀
    <b class='flag-5'>FPGA</b>仿真<b class='flag-5'>工具包</b>軟件EasyGo Vs Addon介紹

    Altera推出一系列FPGA軟、硬件和開發工具

    近期,英特爾子公司Altera推出了一系列FPGA軟、硬件和開發工具,使其可編程解決方案更易應用于廣泛的用例和市場。Altera在年度開發者大會上公布了下一代能效與成本優化的Agilex 3
    的頭像 發表于 10-12 10:47 ?1003次閱讀

    瑞星微刷機工具開發工具

    瑞星微刷機工具開發工具
    發表于 10-09 11:14 ?3次下載

    FPGA深度學習能走多遠?

    、高效的開發工具和編程模型,降低 FPGA開發門檻,吸引更多的開發者參與到 FPGA深度
    發表于 09-27 20:53

    FPGA開發工具

    學習開發FPGA,需要預先準備好的工具嗎?比如示波器‘邏輯分析儀之類的。畢竟側重于硬件方面的處理。不知道和單片機開發有多少不同,和需要注意的
    發表于 07-29 22:04