從理論上講,異構多核設備可以配備針對給定用例可以拋出的任何類型的操作而優化的計算塊。用于視頻處理的 GPU、用于對象識別的神經網絡處理器、運行操作系統的 CPU 等。與同一級別的同類處理器相比,不同的適合用途的內核為 SoC 提供了更大的靈活性,因此在更廣泛的工作負載范圍內具有更高的性能和更低的功耗。
但是,當您開始考慮基于邊緣的AI,計算機視覺等應用程序的要求時,事實是I / O和內存變得與原始處理性能一樣嚴格,如果不是更多的話。
“內存速度只會上升得這么快,對吧?”,英偉達副總裁兼嵌入式與邊緣計算總經理Deepu Talla說。“它沒有呈指數級增長。由于大小的原因,位寬大致相同:它是16位,32位,64位,128位,等等。大多數嵌入式處理器通常具有32位甚至16位接口,這也是由于成本和尺寸的原因。
“記憶的速度每一代只增長2倍,這通常每三年發生一次,”他繼續說道。“但是,SoC中的計算要求可能增加了10倍或20倍。
您如何協調計算性能的不成比例的提高與內存技術相對較小的進步?特別是隨著處理器演變成獨特的邏輯集合,這些邏輯集合都需要自己訪問內存等資源。
根據塔拉的說法,你把它給他們。以下是嵌入式存儲器架構為滿足下一代異構多核處理器的需求而不斷發展的三種方式。
#1.特定于內核的靜態存儲器
“如果你看看很多這樣的嵌入式處理器,它們過去一直都有SRAM,”Talla說。“現在,對于每個特定的單元,我們有本地SRAM,它從DRAM獲取數據,將其存儲在本地并進行處理,然后發回最終輸出。
特定于內核的SRAM具有一些優勢,首先是無需將臨時數據寫回片外DRAM所帶來的內存性能提升。
這種架構還具有降低功耗的額外好處,因為極低電壓的SRAM模塊位于SoC中相應的邏輯IP附近或附近。
“如果你去DRAM,那可能是一個數量級的功率,所以你實際上通過使用這些技術來節省功率,”Talla解釋說。
#2.增加系統內存
如今,嵌入式處理器具有多達 4 MB 至 8 MB 的系統內存。此系統內存不專用于任何一個特定內核,并且可以在 CPU、GPU 和加速器等元素之間共享。
與專用SRAM類似,更多共享系統內存的主要好處是更少的DRAM訪問。例如,傳統的視頻編碼序列如下所示:
數字內存 -》 視頻編碼器 -》 數字內存 -》 附加計算 -》 DRAM
增加的系統緩存可實現以下功能:
DRAM -》 視頻編碼器 -》 系統內存 -》 附加計算 -》 DRAM
如前所述,不同之處在于單獨的內核不必不斷從片外DRAM獲取數據,因為大型系統內存消除了對中間步驟的需求。
#3.增加的緩存大小
最后,隨著較新的處理技術使更高容量的內存更實惠,緩存大小將不可避免地增加。在異構 SoC 上為 CPU、GPU、DSP 和其他核心架構提供更大的緩存也將減少 DRAM 流量。
將增加的緩存大小與前兩項改進相結合,開始產生一些重大收益。
Talla指出:“更多的SRAM,通用的系統內存,以及更多的高容量緩存,可以讓你在未來三到五年內將性能提高10倍到100倍,即使內存帶寬可能只增加了一倍或四倍。
審核編輯:郭婷
-
處理器
+關注
關注
68文章
19813瀏覽量
233615 -
嵌入式
+關注
關注
5141文章
19542瀏覽量
315178 -
gpu
+關注
關注
28文章
4912瀏覽量
130681
發布評論請先 登錄
精選好文!噪聲系數測量的三種方法
Linux系統中通過預留物理內存實現ARM與FPGA高效通信的方法

如何提高嵌入式代碼質量?
三種常見平方根算法的電路設計及Verilog實現與仿真

基于全志T113-i多核異構處理器的全國產嵌入式核心板簡介
【「嵌入式Hypervisor:架構、原理與應用」閱讀體驗】+ 了解Hypervisor
Windows管理內存的三種主要方式
嵌入式系統的未來趨勢有哪些?
七大嵌入式GUI盤點
學習hypervisor嵌入式產品安全設計
MCUXpresso IDE下在線聯合調試雙核MCU工程的三種方法

如何提升嵌入式編程能力?
一文解析嵌入式多核異構方案,東勝物聯RK3588多核異構核心板系列一覽

評論