女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI引擎架構和陣列編程要求

Xilinx賽靈思官微 ? 來源:Xilinx賽靈思官微 ? 作者:Xilinx賽靈思官微 ? 2022-12-08 09:18 ? 次閱讀

Versal AI Core 系列可借助 AI 引擎提供突破性的 AI 推斷加速。此系列應用范圍廣泛,包括用于云端動態工作負載以及超高帶寬網絡,同時還可提供高級安全性功能。AI 和數據科學 家以及軟硬件開發者均可充分利用高計算密度的優勢來加速提升任何應用的性能。

AI 引擎是超長指令字 (VLIW) 處理器陣列,具有高度優化的單指令流多數據流 (SIMD) 矢量單元,專用于各種計算密集 型應用,尤其是數字信號處理 (DSP)、5G 無線應用和人工智能 (AI) 技術(如機器學習 (ML))等。同時,AI 引擎還是硬化的塊,可提供多級并行處理能力,包括指令級并行處理和數據級并行處理。

本指南闡述了對 AI 引擎 graph 應用進行編譯與仿真、使用 Vitis 工具流程來集成應用、使用 Vitis IDE、調試 AI 引擎應用、映射器/布線器方法論、AI 引擎硬件剖析和調試方法論等內容。

本文選取 AI 引擎架構概述部分。

AI 引擎陣列編程要求充分理解要實現的算法、AI 引擎的功能以及各功能單元之間的整體數據流。AI 引擎陣列支持三種 級別的并行度:

SIMD:通過矢量寄存器,允許并行計算多個元素。

指令級別:通過 VLIW 架構,允許在單個時鐘周期內執行多項指令。

多核:通過 AI 引擎陣列,即可在其中并行執行數百個 AI 引擎。

雖然對于 AI 引擎而言,大部分標準 C 語言代碼均可編譯,但代碼可能需要大幅重構才能在 AI 引擎陣列上實現最優性能。AI 引擎的優勢在于,它能夠在每個時鐘周期內執行矢量 MAC 運算、為下一項運算加載 2 個 256 位矢量、存儲來自上一項運算的單個 256 位矢量并遞增一個指針或執行另一次標量運算。AI 引擎編譯器不會執行任何自動矢量化或基于編譯指示的矢量化。代碼必須重寫后才能使用 SIMD 內部數據類型(例如,v8int32)和矢量內部函數(例如, mac(…)),而這些都必須在單個流水打拍循環內執行,才能達成最優性能。32 位標量 RISC 處理器具有一個 ALU、 部分非線性函數和數據類型轉換。每個 AI 引擎所能訪問的存儲器量是有限的,這表示大型數據集需要分區。

AI 引擎內核即 AI 引擎上運行的函數,這些函數構成數據流 graph 規范的基本構建塊。數據流 graph 是 Kahn 進程網絡,具有確定性行為,不依賴于各種計算延遲或通信延遲。AI 引擎內核聲明為空的 C/C++ 函數,通過提取窗口實參或串流實參來建立 graph 連接。內核還可包含靜態數據和運行時參數實參,包括異步實參或觸發實參。每個內核都應在其自己的源文件內定義。

為了達成總體系統性能,必須廣泛閱讀了解有關架構、分區、AI 引擎數據流 graph 生成和數據流連接最優化等方面的 知識,積累相關經驗。

AMD 賽靈思提供了 DSP 和通信庫,其中包含經最優化的代碼,可用于 AI 引擎,應盡可能多加利用。其中提供的源代碼也提供了強大的資源,供用戶學習有關 AI 引擎內核編碼的信息。

AI 引擎組件

AI 引擎陣列由二維 AI 引擎拼塊 (tile) 陣列構成,其中每個 AI 引擎拼塊均包含一個 AI 引擎、存儲器模塊和拼塊互連模 塊。

AI 引擎:每個 AI 引擎都是一個超長指令字 (VLIW) 處理器,其中包含一個標量單元、一個矢量單元、兩個加載單元和一個存儲單元。

AI 引擎拼塊:每個 AI 引擎拼塊都包含一個 AI 引擎、一個本地存儲器模塊,搭配多條通信路徑以促進拼塊間的數據交換。

AI 引擎陣列:AI 引擎陣列是指 AI 引擎拼塊的完整二維陣列。

AI 引擎程序:AI 引擎程序包含以 C/C++ 編寫的數據流 graph 規范。該程序是使用 AI 引擎工具鏈來編譯并執行的。

AI 引擎內核:內核是使用 AI 引擎矢量數據類型和內部函數以 C/C++ 編寫的。這些函數均為 AI 引擎上運行的計算函數。內核構成數據流 graph 規范的基本構建塊。

ADF graph:ADF graph 是具有單個 AI 引擎內核或多個 AI 引擎內核(以數據串流連接)的網絡。它憑借如下特定構造來與可編程邏輯、全局存儲器和處理器系統進行交互,此類構造有:PLIO(graph 編程中的端口屬性,用于建立往來可編程邏輯的串流連接)、GMIO(graph 編程中的端口屬性,用于建立往來全局存儲器的外部存儲器映射連接)和 RTP。

工具

Vitis 集成設計環境

Vitis 集成設計環境 (IDE) 可用于為賽靈思器件執行系統編程,包括含多個 AI 引擎內核的 Versal 器件。在此工具中,有下列功能特性可用。

最優化 C/C++ 編譯器,用于編譯內核與 graph 代碼,執行所有必要的連接、布局和檢查以確保器件上的各項功能正常工作。

周期近似的仿真器、加速的功能仿真器和剖析工具。

調試環境,可在仿真環境和硬件環境下使用。

Vitis 命令行工具

命令行工具可用于構建、仿真以及生成輸出文件和報告。捕獲由 IDE 生成的命令行輸出后,有助于后續集成到客戶構建環境內。Vitis 分析器 IDE 可用于查看報告并分析由命令行工具生成的輸出文件和報告。

Vitis Model Composer

Vitis Model Composer 可提供基于 MATLABSimulink 的高層次圖形輸入環境,用于包含 AI 引擎、HLS 和 RTL 組件的設計仿真與代碼生成。

將 AI 引擎內核、graph、HLS 內核與基于 RTL 的塊導入同一個 Simulink 設計,用于快速協同仿真。

從 Simulink 庫瀏覽器中,將經過最優化的 AI 引擎函數(例如,有限脈沖響應 (FIR) 和 FFT 濾波器)拖放到設計中。

使用 MATLAB 或 Simulink 中生成的激勵來驗證設計、直觀顯示結果并將結果與黃金參考結果進行比較。生成 graph 代碼并測試矢量。

匯編導入的代碼和塊庫代碼以供饋送到下游工具中。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    34256

    瀏覽量

    275399
  • 引擎
    +關注

    關注

    1

    文章

    366

    瀏覽量

    22889

原文標題:AI 引擎工具和流程用戶指南

文章出處:【微信號:賽靈思,微信公眾號:Xilinx賽靈思官微】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    如何基于Kahn處理網絡定義AI引擎圖形編程模型

    本白皮書探討了如何基于 Kahn 處理網絡( KPN )定義 AI 引擎圖形編程模型。KPN 模型有助于實現數據流并行化,進而提高系統的整體性能。
    的頭像 發表于 04-17 11:31 ?256次閱讀
    如何基于Kahn處理網絡定義<b class='flag-5'>AI</b><b class='flag-5'>引擎</b>圖形<b class='flag-5'>編程</b>模型

    RAKsmart高性能服務器集群:驅動AI大語言模型開發的算力引擎

    RAKsmart高性能服務器集群憑借其創新的硬件架構與全棧優化能力,成為支撐大語言模型開發的核心算力引擎。下面,AI部落小編帶您了解RAKsmart如何為AI開發者提供從模型訓練到落地
    的頭像 發表于 04-15 09:40 ?173次閱讀

    首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手

    正式提出“智能體化用戶體驗”方向,并啟動“天璣智能體化體驗領航計劃”。更值得注意的是,其三大AI工具鏈的發布——天璣開發工具集、AI開發套件2.0,以及升級的天璣星速引擎與旗艦芯片天璣9400+,標志著聯發
    發表于 04-13 19:52

    AI Agent 應用與項目實戰》閱讀心得3——RAG架構與部署本地知識庫

    技術不僅解決了LLM的知識更新問題,更為構建專業領域的智能問答系統提供了完整的技術方案。通過與向量數據庫的深度集成,RAG實現了知識的動態擴展和精準檢索,這種架構設計為AI系統的持續進化提供了可能。在
    發表于 03-07 19:49

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......

    暢想! 一、關于FPGA的前世今生——“無處不在的加速引擎”我們首先一文科普什么是FPGA?FPGA(Field-Programmable Gate Array,現場可編程陣列)是一種可
    發表于 03-03 11:21

    明遠智睿SD2351核心板首發:四核A35+硬核AI引擎,賦能工業AIoT

    ARM Cortex-A35架構,主頻高達1.5GHz,集成智能視頻引擎(IVE)與智能處理單元(IPU),支持多模態AI分析與實時視頻處理,為邊緣計算場景提供強勁算力支持。 核心配置亮點: 處理
    發表于 02-20 14:11

    AI技術與PLC編程融合

    如何將AI技術融入PLC編程軟件
    發表于 02-14 15:55

    什么是AI查詢引擎

    AI 查詢引擎可高效處理、存儲和檢索大量數據,以增強生成式 AI 模型的輸入。
    的頭像 發表于 01-10 10:00 ?1152次閱讀

    使用 AMD Versal AI 引擎釋放 DSP 計算的潛力

    更低的功耗獲得高性能 DSP^1^以及更少的可編程邏輯資源。^2^ “Versal AI 引擎可以在降低功耗預算的情況下提高 DSP 計算密度,”
    的頭像 發表于 11-29 14:07 ?1103次閱讀

    《算力芯片 高性能 CPUGPUNPU 微架構分析》第3篇閱讀心得:GPU革命:從圖形引擎AI加速器的蛻變

    標量、向量、矩陣的表示;從硬件實現看,不同廠商各顯神通。谷歌TPU采用脈動陣列計算單元,通過數據流向的精心編排提升計算密度;NVIDIA張量核心支持多精度計算,Hopper架構更是引入了稀疏性加速。華為
    發表于 11-24 17:12

    使用AMD Versal AI引擎加速高性能DSP應用

    AMD Versal AI 引擎使您能夠擴展數字信號處理( DSP )算力與面向未來的設計,從而適應當前和下一代計算密集型 DSP 應用。借助 Versal AI 引擎,客戶能以更低的
    的頭像 發表于 11-20 16:35 ?788次閱讀

    【「大模型時代的基礎架構」閱讀體驗】+ 未知領域的感受

    算法的引擎GPU、GPU硬件架構剖析、GPU服務器的設計與實現、GPU集群的網絡設計與實現、GPU板卡級算力調度技術、基于云平臺的GPU集群的管理與運營等等: 翻閱部分章節,從GPU板卡到GPU服務器
    發表于 10-08 10:40

    AI引擎機器學習陣列指南

    AMD Versal AI Core 系列和 Versal AI Edge 系列旨在憑借 AI 引擎機器學習 ( ML ) 架構來提供突破性
    的頭像 發表于 09-18 09:16 ?711次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>引擎</b>機器學習<b class='flag-5'>陣列</b>指南

    ai服務器是什么架構類型

    AI服務器,即人工智能服務器,是專門為人工智能應用設計的高性能計算服務器。AI服務器的架構類型有很多種,以下是一些常見的架構類型: CPU架構
    的頭像 發表于 07-02 09:51 ?1749次閱讀

    螞蟻數科發布新一代融合AI風控引擎“AIR Engine”

    在數字化浪潮的推動下,金融科技領域的風控技術正迎來新的突破。近日,螞蟻數科旗下的蟻盾風控團隊正式發布了新一代融合AI風控引擎——“AIR Engine(AIFUSERiskEngine)”,該引擎在原有的決策式
    的頭像 發表于 06-26 18:20 ?1780次閱讀