概述
我們正在開發的 AI 編譯器是可以從預訓練的深度神經網絡為瑞薩的 R-Car 設備生成高性能可執行代碼的軟件。
背景
實時執行 CNN 推理是一項非常具有挑戰性的工作,因為嵌入式硬件在計算和功耗的硬件資源方面面臨著嚴格的限制。為了在 R-Car V 系列設備上有效地執行 CNN 推理,瑞薩設計了異構架構,該架構分為可編程處理器 (CPU) 和專用于計算網絡各層的加速器。
至于AI編譯器,常見的軟件架構包含兩部分:編譯器“前端”和編譯器“后端”,如圖所示。深度神經網絡在 AI 編譯器中被翻譯成多級 IR。編譯器前端負責與硬件無關的轉換(圖 IR)和圖優化,而編譯器后端負責特定于硬件的優化、代碼生成。
例子
瑞薩主要開發硬件相關的優化算法,最大限度地利用R-Car V系列的異構架構。為了進一步提高性能,有必要了解與深度神經網絡相關的最新論文,并與工程師進行技術討論。我們正在尋找該領域積極進取的工程師。
結論
深度神經網絡是近年來得到廣泛研究并不斷發展的技術領域之一。瑞薩將提供先進的人工智能工具來協助自動駕駛技術的發展。
圖像
審核編輯:郭婷
-
神經網絡
+關注
關注
42文章
4814瀏覽量
103568 -
AI
+關注
關注
88文章
35099瀏覽量
279539 -
編譯器
+關注
關注
1文章
1662瀏覽量
50203
發布評論請先 登錄
邊緣設備AI部署:編譯器如何實現輕量化與高性能?
BP神經網絡與卷積神經網絡的比較
BP神經網絡與深度學習的關系
深度學習入門:簡單神經網絡的構建與實現
Triton編譯器在機器學習中的應用
Triton編譯器與其他編譯器的比較
Triton編譯器功能介紹 Triton編譯器使用教程
卷積神經網絡的實現工具與框架
卷積神經網絡與傳統神經網絡的比較
深度學習中的卷積神經網絡模型
Moku人工神經網絡101

評論