女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

你知道TinyML運行效能誰說了算嗎?

jf_cVC5iyAO ? 來源:易心Microbit編程 ? 2023-08-03 16:06 ? 次閱讀

AI芯片或神經加速處理器(Neural Network Processing Unit, NPU或Deep Learning Accelerator, DLA)領域中,大家也都說自家的芯片世界最棒,對手看不到車尾燈,難道沒有一個較為公正衡量芯片運行(推論)效能,就像手機跑分軟件一樣,讓大家比較信服的基準嗎?

其實在AI芯片領域中所謂的「效能」,可能因關心的重點不同而會有不同定義和解讀。分別可從硬件每秒可執行乘加的次數(又可細分FP32,FP16及INT8等)、對于特定模型在指定推論精度下每秒可執行次數或推論一次所需時間(包含有無模型優化處理)、特定模型推論功耗(推論一次耗費焦耳數)、每瓦特可執行乘加指令次數及其它特定規范時的表現,甚至有用每塊美金獲得算力來當成基準。所以常會遇到誰也不服誰,老王賣瓜自賣自夸的現象。

目前較被大家接受的就是ML Commons所提出的MLPerf規范,其中包含訓練及推論兩大項,而推論部份又可細分為數據中心(Datacenter)、邊緣(Edge)、行動(Mobile)及微型(Tiny,大多為MCU)。前不久(2023/6/27)才剛公布了Tiny v1.1測試結果報告,接下來就幫大家解讀一下這份報告,讓大家能更了解未來單芯片運行AI的方向及可行性。

評測場景及項目

目前ML Commons在Tiny部份先前已經過三輪(v0.5, v0.7, v1.0)測試,此次公布的是v1.1結果。測試時分為封閉(Closed)及開放(Open)型式,前者依官方規范測,而后者廠商可提出依自己規范測試更優的結果,不過不是每輪評測都會有開放型式。

目前主要評測項目如Fig.1 所示,共有四個項目,包含關鍵詞偵測(Keyword Spoting, KS)、視覺喚醒字(Visual Wake Words, VW)、影像分類(Image Classification, IC)及異常偵測(Anomaly Detection, AD)。而每個項目都是采單串流數據(Single Stream)方式進行,即推論完一筆再取下一筆進行推論。依照不同項目,分別使用對應的數據集和模型,并在指定的推論質量下進行評量。

wKgZomTLYEaANXFwAAFCAFJOc0s385.jpg

Fig.1 MLPerf v1.1 工作場景及效能評量項目

參與評測公司、硬件及軟件

本次參與評測的項目共有32項,以下依不同項目分別介紹。

參與評測公司:共有10家,Krai, Nuvoton(新唐科技), STMicroelectronics(簡稱STM), Skymizer(臺灣發展軟件科技), cTuning, fpgaconvnet, Plumerai, Syntiant, Robert Bosh GmbH, kai-jiang(個人)。

參與評測開發板:共有14種,規格下如下所示。

STM NUCLEO-H7A3ZI-Q, Arm Cortex-M7(DSP+FPU) @280MHz

STM NUCLEO-L4R5ZI, Arm Cortex-M4(DSP+FPU) @120MHz

STM NUCLEO-U575ZI-Q, Arm Cortex-M33(DSP+FPU) @160MHz

STM NUCLEO-G0B1RE, Arm Cortex-M0+ @64MHz

STM DISCO-F746NG, Arm Cortex-M7(DSP+FPU) @216MHz

Nordic nRF5340 DK, Arm Cortex-M33(DSP+FPU) @128MHz

Nuvoton NUMAKER-M467HJ, Arm Cortex-M4F @200MHz

DIGILENT Cora Z7, Arm Cortex-A9 @667MHz

DIGILENT ZC706, Arm Cortex-A9 @650MHz

DIGILENT ZedBoard, Arm Cortex-A9 @650MHz

DIGILENT ZyBo, Arm Cortex-A9 @650MHz

Infineon CY8CPROTO-062-4343W, Arm Cortex-M4 (DSP + FPU) @150MHz

Syntiant NDP9120, HiFi3+M0 @30.7MHz/98.7MHz

ZCU106, RISC-V @20MHz

主要CPU規格:共有7大類。只有1項使用RISC-V,1項為MCU+NPU,其余皆是Arm Based。Cortex-M為單芯片(MCU)等級,Cortex-A為微處理器(MPU)等級芯片,用于手機或單板微電腦

Arm Cortex-M0+ (1項)

Arm Cortex-M33 (4項)

Arm Cortex-M4/M4F (13項)

Arm Cortex-M7 (7項)

Arm Cortex-A9 (4項)

Syntiant HiFi3+M0 (2項)

RISC-V (1項)

主要軟件及函式庫:共有9種。

Skymizer ONNC

MicroTVM

Plumerai Inference Engine

Syntiant TDK+SDK

Bosch Hardware-Aware Lowering Engine(HALE)

STM X-CUBE-AI

fpgaConvNet(Model+Optimiser)

Arm CMSIS-5

TVM

評測結果:

由于芯片等級落差頗大,單從推論時間(毫秒ms)及能耗(微焦耳uJ 比較可能會有點不公平,所以這里依CPU等級及工作頻率來分會更清楚些。Fig. 2分別列出各等級中推論速度表現最好的。

wKgaomTLYEaAHbHTAAP1WwqQPI8795.jpg

Fig.2 MLPerf Tiny v1.1各等級CPU及不同應用表現最佳清單。

另外從此次提交的項目亦可看出Arm Cortex-M4已成為TinyML的主流,若推論仍不夠快時,則可再提升到Cortex-M7。而新上市的Cortex-M33效能已高過Cortex-M4,略低于Cortex-M7,讓使用者有多一點性價比的選擇空間。

小結

在邊緣智能(Edge AI)裝置及智能物聯網(AIoT)應用中使用單芯片(MCU)來運行AI(TinyML)已是現在進行式,透過此次的評比結果,可讓大家更了解各家芯片性能及模型優化工具的進展,未來隨著MCU+NPU的普及,相信下一次的評比結果可能就有更大躍升,就讓大家一起期待吧!



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • ARM處理器
    +關注

    關注

    6

    文章

    361

    瀏覽量

    42439
  • MPU
    MPU
    +關注

    關注

    0

    文章

    409

    瀏覽量

    49652
  • Cortex-M4
    +關注

    關注

    6

    文章

    97

    瀏覽量

    47030
  • 加速處理器
    +關注

    關注

    0

    文章

    8

    瀏覽量

    6492
  • AI芯片
    +關注

    關注

    17

    文章

    1968

    瀏覽量

    35689

原文標題:TinyML (MCU AI) 運行效能誰說了算?

文章出處:【微信號:易心Microbit編程,微信公眾號:易心Microbit編程】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    知道船用變壓器有哪些嗎?

    在船舶和海洋平臺上,電力系統的穩定運行至關重要,而船用變壓器作為其中的關鍵設備,其種類繁多,各具特點。知道船用變壓器有哪些嗎?讓我們一起來揭開它們的神秘面紗。CSD船用變壓器是船舶供電系統中
    的頭像 發表于 06-01 00:00 ?89次閱讀
    <b class='flag-5'>你</b><b class='flag-5'>知道</b>船用變壓器有哪些嗎?

    推拉力測試設備制造廠商,專不專業您說了算!#專業制造廠家#工廠#

    測試儀
    力標精密設備
    發布于 :2025年05月16日 16:52:35

    熵基科技實現BioCV TinyML與DeepSeek大模型融合

    近日,熵基科技宣布了一項重大技術突破。該公司自主研發的“BioCV TinyML模型”已成功與全球知名的LLM大模型DeepSeek實現接入與融合。 這一融合成果不僅彰顯了熵基科技在智能物聯和智慧
    的頭像 發表于 02-19 16:15 ?662次閱讀

    中心的力如何衡量?

    作為當下科技發展的重要基礎設施,其力的衡量關乎其能否高效支撐人工智能、大數據分析等智能應用的運行。以下是對智中心算力衡量的詳細闡述:一、力的基本定義與單位1、
    的頭像 發表于 01-16 14:03 ?1870次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b>力如何衡量?

    推拉力機夾具效果檢測,好不好說了算#測試儀器 #推拉力測試

    推拉力測試機
    力標精密設備
    發布于 :2024年11月11日 17:07:50

    金句來了!聽深開鴻和TA的伙伴們都說了什么?

    金句來了!聽深開鴻和TA的伙伴們都說了什么?
    的頭像 發表于 09-30 08:06 ?487次閱讀
    金句來了!聽深開鴻和TA的伙伴們都<b class='flag-5'>說了</b>什么?

    淺析三大力之異同

    隨著一年多前ChatGPT的出現引爆人工智能(AI)浪潮,支撐大模型背后的“力”概念突然闖進我們的視野,成為科技圈炙手可熱的新詞,引領著最新潮流。作為數字經濟時代新生產力,也許不少人知道力有許多
    的頭像 發表于 08-30 12:56 ?1896次閱讀
    淺析三大<b class='flag-5'>算</b>力之異同

    虹科技術 全新Linux環境PCAN驅動程序發布!CAN/CAN FD通信體驗全面升級!

    ”。想要體驗字符模式設備驅動接口(chardev)的便捷,還是SocketCAN設備驅動接口(netdev)的高效?都由您說了算! 新版本驅動包概覽 1、設備驅動程序模塊源代碼及Makefile文件,確保
    的頭像 發表于 08-29 09:36 ?724次閱讀
    虹科技術 全新Linux環境PCAN驅動程序發布!CAN/CAN FD通信體驗全面升級!

    知道影響貼片電感發熱的因素有哪些嗎?

    知道影響貼片電感發熱的因素有哪些嗎?
    的頭像 發表于 08-17 14:24 ?769次閱讀
    <b class='flag-5'>你</b><b class='flag-5'>知道</b>影響貼片電感發熱的因素有哪些嗎?

    知道貼片電感故障時可能出現的癥狀嗎?

    知道貼片電感故障時可能出現的癥狀嗎?
    的頭像 發表于 08-17 14:20 ?708次閱讀
    <b class='flag-5'>你</b><b class='flag-5'>知道</b>貼片電感故障時可能出現的癥狀嗎?

    國產芯上運行TinyMaxi輕量級的神經網絡推理庫-米爾基于芯馳D9國產商顯板

    是面向單片機的超輕量級的神經網絡推理庫,即 TinyML 推理庫,可以讓你在任意單片機上運行輕量級深度學習模型~ 開源地址:https://github.com/sipeed/TinyMaix搭建
    發表于 08-09 18:26

    知道共模電感用錯了會有什么影響嗎

    電子發燒友網站提供《知道共模電感用錯了會有什么影響嗎.docx》資料免費下載
    發表于 07-30 10:42 ?0次下載

    瑞薩電子推出Reality AI Explorer Tier,用于開發AI與TinyML解決方案

    全球半導體解決方案供應商瑞薩電子(TSE:6723)宣布推出Reality AI Explorer Tier——作為Reality AI Tools軟件的免費版本,可用于開發工業、汽車和商業應用中的AI與TinyML解決方案。
    的頭像 發表于 07-19 10:03 ?662次閱讀

    浪潮信息攜手天府云數據科技推出了42kW智風冷力倉

    不僅標志著我國智基礎設施邁入了全新的高密度、高效能時代,更為人工智能、自動駕駛、生物制藥、AIGC(人工智能生成內容)及智能制造等多個前沿領域提供了強有力的力支撐。
    的頭像 發表于 07-15 16:18 ?873次閱讀