女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

TOPS 與現實世界的性能:AI 加速器的基準性能

juju宇哥 ? 來源:juju宇哥 ? 作者:juju宇哥 ? 2022-07-14 17:17 ? 次閱讀

蓬勃發展的機器學習人工智能新興用例有望通過加速信息處理和提高決策準確性為行業創造重大價值。但機器學習模型是計算密集型、需要高頻和實時 AI 分析場景,這導致企業依賴于使用每秒萬億次操作 (TOPS) 指標的性能指導。TOPS 捕捉到“加速器在一秒鐘內可以提供多少數學運算?” 比較和確定給定推理任務的最佳加速器。

雖然 TOPS 是一個“容易”計算的指標,但它通常無法為實際工作負載提供可靠的性能指標。受限于加速器中乘法器和加法器的數量,該指標無法考慮處理神經網絡模型的計算硬件結構。隨著數據網絡模型更快地處理數據,企業如何通過更快、更可靠的決策進行擴展,尤其是在邊緣?

在這篇文章中,我們將回顧 TOPS、它在測量延遲方面的挑戰以及它與現實世界的性能計算有何不同,并提供一種通過基準測試來計算性能的替代方法,它提供了一種更可靠的方法來解釋計算硬件結構。

TOPS 作為績效衡量標準的現實

TOPS 是一個簡化指標:它告訴您 AI 加速器在一秒鐘內可以處理多少計算操作,并且利用率為 100%。本質上,它著眼于加速器可以在很短的時間內解決多少數學運算問題。

例如,如果一個 AI 加速器提供 5 TOPS,另一個提供 15 TOPS,則推斷后者比前者快三倍。但是,就像 CPU 速度的兆赫茲和千兆赫茲一樣,TOPS 也失去了確定整體計算機性能的相關性。隨著人們對 AI 應用的興趣日益濃厚,最新的 AI 加速器可以比簡單的算術更快地處理數據,并且更復雜。

然而,TOPS 很少準確地捕捉到 AI 處理器在整個硬件設備中的重要性。如今,相機、邊緣服務器和計算機中的 AI 處理器通常是決定計算能力和能源效率的關鍵組件之一。事實上,TOPS 未能考慮到現實世界的工作量。通常,由于諸如空閑計算機單元等待來自內存的數據、加速器不同部分之間的同步開銷和控制開銷等因素,實際性能可能會顯著低于 TOPS 值。根據加速器的架構和工作負載特性,

更高的 TOPS 不等于更高的性能

雖然較高的 TOPS 值可以表示具有更多計算元素的更大 AI 加速器,但現實情況可能恰恰相反。更高的 TOPS 通常會導致更大的加速器具有更多的計算元素和內存塊,以將數據饋送到這些計算單元,這會導致更高的成本和功耗。另一方面,高效的加速器使用較少數量的計算資源提供更高的性能,因此 TOPS 評級較低。最終,理想的 AI 加速器是使用低 TOPS 提供高性能的加速器。

TOPS 不包括所有計算類型

TOPS 指標考慮了加速器的乘法器和加法器,這通常會導致性能指標不準確,因為加速器可以擁有除此之外的其他計算資源。例如,Kinara 的架構采用歸約樹而不是加法器陣列,從而顯著降低能耗。由于在此計算中未捕獲歸約樹的計算能力,TOPS 指標將不夠準確。ResNet50、MobileNet V1 和 YOLO_v3 等標準神經網絡在比較不同的加速器時非常有用,因為它們也可以用作“猜測”給定加速器是否能夠滿足開發人員自身工作負載需求的代理。

推理延遲是評估 AI 加速器性能的指標

對于在 Edge AI 上進行投資的企業,通過基準測試計算性能提供了一種可靠的方法來計算計算硬件結構與 TOPS。由于大多數實際應用程序需要極快的推理時間,因此衡量性能的最佳方法是運行特定的工作負載,通常是 ResNet-50、EfficientDet、Transformer 或自定義模型,以了解加速器的效率。使用不同類型、大小、拓撲和輸入分辨率的網絡進行實時處理,可以得出推理延遲度量。該指標計算加速器完成一個特定 AI 模型的干擾的執行時間。

隨著 AI 工作負載及其支持計算架構的發展,通過準確的性能測量確保其可預測性具有重大影響,可以引導開發人員做出更優化的決策。通過使用推理延遲計算,它有助于處理和預測現代 AI 工作負載中的數據流,即使這些工作負載碎片化并且新架構的發展導致更多的不可預測性。最終,基準測試應用程序提供了一種可信且更可靠的 TOPS 替代方案,而 AI 加速器支持更有效的評估。

審核編輯 黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 加速器
    +關注

    關注

    2

    文章

    823

    瀏覽量

    38914
  • AI
    AI
    +關注

    關注

    87

    文章

    34197

    瀏覽量

    275353
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    Banana Pi 發布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發

    低功耗特性。搭載 Renesas 獨有的 DRP-AI 加速器,支持 15 Sparse TOPSAI 計算能力,使其在計算機視覺、邊緣 AI
    發表于 03-19 17:54

    嵌入式AI加速器DRP-AI 詳細介紹

    的嵌入式設備。此外,人工智能正在不斷發展,新的算法不時被開發出來。 在人工智能快速發展的過程中,瑞薩開發了人工智能加速器(DRP-AI)和軟件(DRP-AI翻譯),既提供高
    的頭像 發表于 03-15 16:13 ?865次閱讀
    嵌入式<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>DRP-<b class='flag-5'>AI</b> 詳細介紹

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......

    。? AI加速器的開發:FPGA被廣泛用于開發專為AI算法優化的加速器,例如深度學習推理加速器。這種定制化的硬件設計能夠顯著提升
    發表于 03-03 11:21

    英特爾Gaudi 2D AI加速器助力DeepSeek Janus Pro模型性能提升

    近日,DeepSeek公司發布了備受矚目的Janus Pro模型,其憑借超強性能和高精度在業界引發了廣泛關注。為了進一步提升該模型的應用效能,英特爾宣布其Gaudi 2D AI加速器已針對Janus
    的頭像 發表于 02-10 11:10 ?549次閱讀

    EE-436:使用ADSP-SC59x/2159x高性能FIR/IIR加速器

    電子發燒友網站提供《EE-436:使用ADSP-SC59x/2159x高性能FIR/IIR加速器.pdf》資料免費下載
    發表于 01-07 14:12 ?0次下載
    EE-436:使用ADSP-SC59x/2159x高<b class='flag-5'>性能</b>FIR/IIR<b class='flag-5'>加速器</b>

    從版本控制到全流程支持:揭秘Helix Core如何成為您的創意加速器

    加速器
    龍智DevSecOps
    發布于 :2024年11月26日 13:42:47

    IBM與AMD攜手部署MI300X加速器,強化AI與HPC能力

    舉措預計將于2025年上半年正式推出。 此次合作的核心目標是提升通用人工智能(AI)模型的性能與能效,并為企業客戶提供高性能計算(HPC)應用的強大支持。AMD的Instinct MI300X
    的頭像 發表于 11-21 11:07 ?641次閱讀

    IBM將在云平臺部署AMD加速器

    IBM與AMD近期宣布了一項重要合作協議,根據協議,IBM將在其云平臺上部署AMD Instinct MI300X加速器。這一舉措旨在提升企業客戶在生成式AI模型方面的性能和能效,進一步推動A
    的頭像 發表于 11-19 16:24 ?502次閱讀

    IBM與AMD攜手將在IBM云上部署AMD Instinct MI300X加速器

    近日,全球領先的科技企業IBM與AMD共同宣布了一項重要合作。雙方計劃在IBM云上部署AMD的Instinct MI300X加速器服務,以滿足企業客戶對于高性能和高效能AI模型的需求。 據悉,這項
    的頭像 發表于 11-19 11:03 ?754次閱讀

    樹莓派新推AI HAT+:26 TOPS性能版本震撼登場

    供了兩種性能配置供用戶選擇。其中,基礎版配備了Hailo-8L加速器性能達到13 TOPS(每秒萬億次操作),售價為70美元;而更為強大的高端版本則采用了Hailo-8
    的頭像 發表于 11-07 13:44 ?1044次閱讀

    最強服務CPU來了!AI性能直接翻倍

    以及AI服務AI數據中心場景的CPU產品。它不僅能支持廣泛的第三方GPU及AI加速器,與它們組合形成強大的異構計算平臺,還能在其中補足G
    的頭像 發表于 09-29 11:00 ?933次閱讀
    最強服務<b class='flag-5'>器</b>CPU來了!<b class='flag-5'>AI</b><b class='flag-5'>性能</b>直接翻倍

    SiFive發布MX系列高性能AI加速器IP

    AI技術日新月異的今天,RISC-V IP設計領域的領軍企業SiFive再次引領行業潮流,正式推出了其革命性的SiFive Intelligence XM系列高性能AI加速器IP。這
    的頭像 發表于 09-24 14:46 ?705次閱讀

    TDA4 Edge AI處理性能和效率基準測試

    電子發燒友網站提供《TDA4 Edge AI處理性能和效率基準測試.pdf》資料免費下載
    發表于 09-11 09:21 ?0次下載
    TDA4 Edge <b class='flag-5'>AI</b>處理<b class='flag-5'>器</b>的<b class='flag-5'>性能</b>和效率<b class='flag-5'>基準</b>測試

    刷新AI PC NPU算力,AMD銳龍AI 9 HX 375領銜55 TOPS

    電子發燒友網報道(文/黃晶晶)最近AMD官網上線了銳龍AI 300系列中的最新成員銳龍AI 9 HX 375處理。原本Ryzen AI 9 HX 370的NPU達到了50
    的頭像 發表于 08-07 00:28 ?4516次閱讀
    刷新<b class='flag-5'>AI</b> PC NPU算力,AMD銳龍<b class='flag-5'>AI</b> 9 HX 375領銜55 <b class='flag-5'>TOPS</b>

    NPU和AI TOPS是什么?它們有哪些性能

    可運行AI模型的性能、準確性和效率。如今,TOPS(每秒萬億次運算)是衡量處理AI性能的主要方
    的頭像 發表于 06-13 10:33 ?1561次閱讀