女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

不要相信報告的深度學習TOPS指標

蕭藹晨 ? 來源:njlbdz ? 作者:njlbdz ? 2022-07-15 16:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能公司通常會關注一個標準:每秒更多 tera 操作 (TOPS)。不幸的是,當硅制造商宣傳他們的 TOPS 指標時,他們并沒有真正提供準確的指導。在大多數情況下,被炒作的數字并不是真正的 TOPS,而是峰值 TOPS。換句話說,你認為你在卡中獲得的 TOPS 數字實際上是芯片在一個非常完美的世界中表現的最佳情況。

我將討論行業因錯誤標記性能指標而造成的問題,并解釋用戶如何獨立評估現實世界的 TOPS。

人造上衣與真上衣

AI 應用程序開發人員通常會通過衡量芯片制造商發布的 TOPS 性能數據是否足以支持他們的項目來開始進行盡職調查。

假設您嘗試在 U-Net 神經網絡上以 10 fps(每秒幀數)重新制作全高清圖像。由于 U-Net 操作每張圖像需要 3 TOPS,簡單的數學表示您需要 30 TOPS 才能以所需的 FPS 完成項目。因此,在購買芯片時,您會假設聲稱運行 50、40 甚至 32 TOPS 的卡對項目來說是安全的。在一個完美的世界里,是的,但你很快就會發現這張卡很少能達到廣告的數字。而且我們不是在談論僅僅幾滴TOPS;計算效率可低至 10%。

雖然調整神經網絡以從卡中獲得更好的性能當然是可能的,但您幾乎不可能接近供應商列出的峰值 TOPS。試圖獲得 60% 或 70% 的計算效率將耗費大量時間。如果神經網絡發生任何變化,您將不得不回到原點重新優化所有內容——但它甚至可能不適用于您的應用程序。這個問題對于小批量處理尤其明顯;你會很幸運能獲得超過 15% 的峰值 TOPS。

計算效率

此時,您可能想知道如何計算真正的 TOPS。這很簡單!

要了解特定卡將提供多少真實 TOPS,您首先需要確定該卡的計算效率。理想情況下,這可以通過簡單地在目標卡上運行所需的神經網絡來完成。但是,您可能沒有該卡。您仍然可以通過查看供應商的營銷數據的詳細信息來進行估算。通常可以獲得像 ResNet50(或類似的)這樣的神經網絡的性能數據。假設這是一個典型的 ResNet50 實現,您可以找到計算單個圖像的每秒千兆操作數(GOPS,而不是 TOPS)。然后,只需將其乘以供應商宣傳的每秒圖像數 (IPS),瞧!您就有了更真實的 TOPS 或“真實”TOPS。

效率只是 real 除以峰值 TOPS 的比率,或者:

峰值 TOPS x 計算效率 = 實際 TOPS

這個公式使用戶能夠在購買任何東西之前比較卡在運行神經網絡時的真實效率。您可以使用所需的 TOPS 重用效率,看看它是否符合您的需求。雖然功率和批量大小等因素會影響結果,但如果您知道卡的效率,則此公式可以很好地估計其在實際用例中的實際性能。當然,供應商發布的神經網絡的 IPS 仍然可以質疑,但至少估計比比較你真正需要的 TOPS 和一張卡的峰值 TOPS 更好。

還值得注意的是,這不僅僅是 GPU 問題。大多數專業 ASIC 的實際效率非常低,即使他們的營銷促進了高效率。只需使用 IPS、已知的網絡 GOPS 和簡單的乘法運算,您就可以了解一個真實的數字。

高效的替代品

盡管 GPU 和 ASIC 都在效率和性能上苦苦掙扎,但有一種替代解決方案不涉及這些芯片中的任何一個。

2020 年 10 月的 MLPerf 結果表明,與推理加速相結合的 FPGA 比其他替代方案的效率要高得多,因此可以更接近其他芯片制造商宣傳的最高 TOPS 數。

pYYBAGLO9LqAb-1dAACNdthL3nw757.jpg


比較不同架構下每個發布的 TOPS 數據的每秒幀數 (FPS)(來源:Mipsology)

FPGA 不僅在計算方面更高效,而且在計算硅片使用方面也更高效。從本質上講,這些卡“事半功倍”,從而以一小部分成本獲得更好的神經網絡性能。

值得重復一遍:買家不應該因為 TOPS 營銷炒作而墮落。這是一個夸大的性能數字,大多數神經網絡在現實條件下永遠不會看到。相反,利用這個公式:

峰值 TOPS x 計算效率 = 實際 TOPS

這樣做將幫助您快速、輕松、準確地將您的性能需求與芯片的實際性能進行比較,而不是任何夸大的供應商聲稱。

——Ludovic Larzul 是 Mipsology 的創始人兼首席執行官。



審核編輯 黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4814

    瀏覽量

    103608
  • AI
    AI
    +關注

    關注

    88

    文章

    35143

    瀏覽量

    279826
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    用樹莓派搞深度學習?TensorFlow啟動!

    介紹本頁面將指導您在搭載64位Bullseye操作系統的RaspberryPi4上安裝TensorFlow。TensorFlow是一個專為深度學習開發的大型軟件庫,它消耗大量資源。您可以在
    的頭像 發表于 03-25 09:33 ?440次閱讀
    用樹莓派搞<b class='flag-5'>深度</b><b class='flag-5'>學習</b>?TensorFlow啟動!

    如何排除深度學習工作臺上量化OpenVINO?的特定層?

    無法確定如何排除要在深度學習工作臺上量化OpenVINO?特定層
    發表于 03-06 07:31

    軍事應用中深度學習的挑戰與機遇

    人工智能尤其是深度學習技術的最新進展,加速了不同應用領域的創新與發展。深度學習技術的發展深刻影響了軍事發展趨勢,導致戰爭形式和模式發生重大變化。本文將概述
    的頭像 發表于 02-14 11:15 ?538次閱讀

    BP神經網絡與深度學習的關系

    BP神經網絡與深度學習之間存在著密切的關系,以下是對它們之間關系的介紹: 一、BP神經網絡的基本概念 BP神經網絡,即反向傳播神經網絡(Backpropagation Neural Network
    的頭像 發表于 02-12 15:15 ?859次閱讀

    百度深度學習專利申請量位列全球第一

    近日,全球領先的知識產權解決方案提供商Questel,發布全球深度學習專利全景報告
    的頭像 發表于 01-15 09:29 ?560次閱讀

    NPU在深度學習中的應用

    隨著人工智能技術的飛速發展,深度學習作為其核心驅動力之一,已經在眾多領域展現出了巨大的潛力和價值。NPU(Neural Processing Unit,神經網絡處理單元)是專門為深度學習
    的頭像 發表于 11-14 15:17 ?1912次閱讀

    Pytorch深度學習訓練的方法

    掌握這 17 種方法,用最省力的方式,加速你的 Pytorch 深度學習訓練。
    的頭像 發表于 10-28 14:05 ?656次閱讀
    Pytorch<b class='flag-5'>深度</b><b class='flag-5'>學習</b>訓練的方法

    GPU深度學習應用案例

    GPU在深度學習中的應用廣泛且重要,以下是一些GPU深度學習應用案例: 一、圖像識別 圖像識別是深度學習
    的頭像 發表于 10-27 11:13 ?1363次閱讀

    激光雷達技術的基于深度學習的進步

    信息。這使得激光雷達在自動駕駛、無人機、機器人等領域具有廣泛的應用前景。 二、深度學習技術的發展 深度學習是機器學習的一個分支,它通過模擬人
    的頭像 發表于 10-27 10:57 ?1066次閱讀

    FPGA加速深度學習模型的案例

    FPGA(現場可編程門陣列)加速深度學習模型是當前硬件加速領域的一個熱門研究方向。以下是一些FPGA加速深度學習模型的案例: 一、基于FPGA的AlexNet卷積運算加速 項目名稱
    的頭像 發表于 10-25 09:22 ?1233次閱讀

    AI大模型與深度學習的關系

    AI大模型與深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 一、深度學習是AI大模型的基礎 技術支撐 :深度
    的頭像 發表于 10-23 15:25 ?2889次閱讀

    深度學習GPU加速效果如何

    圖形處理器(GPU)憑借其強大的并行計算能力,成為加速深度學習任務的理想選擇。
    的頭像 發表于 10-17 10:07 ?613次閱讀

    FPGA做深度學習能走多遠?

    ,共同進步。 歡迎加入FPGA技術微信交流群14群! 交流問題(一) Q:FPGA做深度學習能走多遠?現在用FPGA做深度學習加速成為一個熱門,深鑒科技,商湯,曠視科技等都有基于FPG
    發表于 09-27 20:53

    ARMxy ARM嵌入式計算機搭載 1 TOPS NPU支持深度學習

    ARMxy ARM嵌入式計算機BL410系列內置了1TOPS算力 NPU,它每秒可以執行高達一萬億次的浮點運算,這為復雜的圖像處理和深度學習任務提供了充足的計算資源。在產品缺陷檢測領域,ARMxy ARM嵌入式計算機具備的這一算
    的頭像 發表于 08-20 11:53 ?849次閱讀
    ARMxy ARM嵌入式計算機搭載 1 <b class='flag-5'>TOPS</b> NPU支持<b class='flag-5'>深度</b><b class='flag-5'>學習</b>

    NVIDIA推出全新深度學習框架fVDB

    在 SIGGRAPH 上推出的全新深度學習框架可用于打造自動駕駛汽車、氣候科學和智慧城市的 AI 就緒型虛擬表示。
    的頭像 發表于 08-01 14:31 ?1146次閱讀