最近的視覺AI模型必須處理動態和復雜的環境,因此在實時應用中需要更高的能效和速度。
為了滿足市場需求,瑞薩發布了下一代動態可重構人工智能處理器(DRP-AI)加速器。DRP-AI加速器提供10 TOPS/W的高功率效率,比傳統技術高出10倍,它可以在低功耗的傳統嵌入式處理器(MPU)上面運行復雜的圖像AI模型,而不需要像以前一樣采用高功耗的GPU來運行。
除了這個AI加速器外,高端RZ/V2H MPU還配備了使用動態可重構處理器(DRP)的圖像處理加速器、運行頻率高達1.8GHz的四核Linux處理器Arm Cortex-A55、雙核800MHz Arm Cortex-R8高速實時處理器和I/O處理Arm Cortex-M33子內核,采用異構多處理器配置。
動態可重構處理器(DRP)
七個基于Arm的CPU內核、下一代DRP-AI和DRP的組合,可以立即處理機械控制中的圖像識別和AI判斷結果,使其成為下一代自主機器人、自主移動機器人、無人機和其他應用的理想AI處理器。
下一代AI加速器DRP-AI
RZ/V2M、RZ/V2L和RZ/V2MA嵌入了瑞薩電子獨創的DRP-AI加速器,但瑞薩已將其獨創的AI加速器DRP-AI升級為下一代,以滿足最近的市場需求。
為了大幅提高電源效率,DRP-AI應用了INT8量化和硬件支持,用于非結構化修剪,這是傳統AI加速器難以實現的,以實現高達80 TOPS的推理性能和10 TOPS/W的電源效率。
下一代高能效AI加速器(DRP-AI3):自治系統高級AI中的嵌入式處理速度提高10倍”白皮書
下圖1顯示了AI推理性能與其他RZ/V產品的比較。以ResNet-50為例,典型的分類卷積神經網絡(CNN)的性能比不修剪的RZ/V2L高14倍(密集模型),采用模型修剪后的RZ/V2H比RZ/V2L(密集模型)性能高45倍。
圖1 RZ/V系列AI推理性能(不包括前/后處理)
通過動態可重構處理器DRP打開CV加速
甚至在深度學習出現之前,各種方法就已被用于圖像識別和決策的應用中。OpenCV這個開源的計算機視覺庫就是這樣一個例子。即使現在有了AI圖像處理,OpenCV仍然是一項非常有用的技術。Vision AI和OpenCV現在都在適當的場景一起使用。
為了加速AI和OpenCV等各種圖像處理算法,RZ/V2H MPU設計了與DRP-AI分離的動態可重構處理器,為OpenCV加速器提供DRP庫,充分利用其靈活性。
圖2比較了具有DRP的OpenCV加速器與RZ/V2H四核CPU的性能。例如,通過使用DRP加速,用于圖像邊緣檢測的Sobel濾波器從7.6fps提高到123fps的速度,提高了16倍。
圖2 OpenCV加速器性能基準測試
AI異構配置+高速實時控制
雖然快速多核Linux處理器是圖像AI的最佳選擇,但它需要大量的內存資源,并且很難實現機械控制所需的亞毫秒級實時性能。
為了解決這個問題,RZ/V2H使用四核Cortex-A55來運行包括AI處理在內的Linux程序,并使用專用的高速實時處理器在需要高實時性能的應用(如電機控制)中進行RTOS處理。
通過使用OpenAMP進行處理器間不同操作系統的通信連接,DRP-AI和Linux處理器做出的決策結果可以反映在RTOS處理器的實時機械控制中。
圖3 RZ/V2H框圖
具有這些獨特功能的RZ/V2H嵌入式AI微處理器已投入量產,RZ/V2H評估板也可用于快速啟動您的下一個視覺AI開發。
審核編輯:劉清
-
處理器
+關注
關注
68文章
19799瀏覽量
233438 -
機器人
+關注
關注
213文章
29463瀏覽量
211429 -
加速器
+關注
關注
2文章
823瀏覽量
38883 -
MPU
+關注
關注
0文章
409瀏覽量
49630 -
人工智能
+關注
關注
1804文章
48677瀏覽量
246230
原文標題:RZ/V2H MPU提高了機器人和自主應用中的AI性能和實時控制
文章出處:【微信號:瑞薩MCU小百科,微信公眾號:瑞薩MCU小百科】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
Banana Pi 發布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發
3D圖形和視頻編解碼器引擎的通用微處理器RZ/V2L數據手冊

Banana Pi 與瑞薩電子攜手共同推動開源創新:BPI-AI2N
蘋果加入UALink聯盟,共推AI加速器新標準
AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感
《AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得
Samtec AI 應用詳述 | 人工智能加速器所需的連接器

IBM發布Telum II處理器:DPU性能飆升70%,引領技術創新浪潮
下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統高級AI中更快的嵌入處理

瑞薩高性能AI加速處理器DRP-AI解析

評論