Imec和GlobalFoundries已展示了一種內存處理器芯片,該芯片可以實現高達2900 TOPS / W的能效,比當今的商用內存處理器芯片高約兩個數量級。該芯片采用了既定的思想,即模擬計算,并在GlobalFoundries的22nm完全耗盡絕緣體上硅(FD-SOI)工藝技術中的SRAM中實現。Imec的模擬內存計算(AiMC)將作為一項功能提供給GlobalFoundries客戶,該功能可以在公司的22FDX平臺上實現。
由于神經網絡模型可能具有數以千萬計的權重,因此在內存和處理器之間來回發送數據效率很低。模擬計算使用存儲器陣列來存儲權重,并且還執行乘法累加(MAC)操作,因此無需進行存儲器到處理器的傳輸。每個憶阻器元件(也許是ReRAM單元)的電導率都編程為與所需重量成比例的模擬水平。
施加與輸入激活成比例的電壓(通過數模轉換-在下圖的左側)意味著通過每個元件的電流與激活與重量的乘積成比例。流過每條垂直位線(下圖中的垂直線)的電流是這些激活權重乘積的總和,可以通過模數轉換器饋送電流。激活權積的總和對于神經網絡算法的計算至關重要。
“在實踐中,除了ReRAM以外,還有許多其他選擇–我們可以使用MRAM,Flash,DRAM……該程序的目的是了解最適合該應用程序的應用程序,并針對每個應用程序域優化這些選項,”該程序的Diederik Verkest解釋說。 Imec機器學習總監。
測試芯片
Imec基于GlobalFoundries的22nm FD-SOI工藝構建了一個稱為模擬推理加速器(AnIA)的測試芯片。AnIA的512k SRAM單元陣列以及包括1024個DAC和512個ADC的數字基礎架構占用4mm 2的空間。它可以執行大約一百萬
基于6位(加號位)輸入激活,三進制權重(-1、0,+ 1)和6位輸出的每個操作周期的計算。
Imec機器學習小組的Ioannis Papistas說:“我們能夠在0.8和0.6V的不同電源電壓下產生矩陣矢量乘法輸出。” 在較低的電源電壓下運行而不影響操作的準確性可以顯著降低操作的功耗,這對于推斷能量受限系統特別重要。這是我們設計的一項重要功能,通過22FDX流程實現,可以在邊緣進行競爭性推理。”
Imec在CIFAR 10數據集上顯示了對象識別推理的準確性結果,與類似的量化基準相比,該結果僅下降了一個百分點。在0.8 V的電源電壓下,在23.5 TOPS時AnIA的能效在1050至1500 TOPS / W之間。對于0.6 V的電源電壓,AnIA在1800-2900 TOPS / W左右達到了5.8 TOPS。
-
存儲器
+關注
關注
38文章
7625瀏覽量
166272 -
神經網絡
+關注
關注
42文章
4804瀏覽量
102649 -
處理器芯片
+關注
關注
0文章
118瀏覽量
20013
發布評論請先 登錄
【「芯片通識課:一本書讀懂芯片技術」閱讀體驗】初識芯片樣貌
處理器和芯片的區別是什么 處理器是指cpu嗎
Ampere發布最新192核12內存通道AmpereOne M處理器
內存和微處理器的互聯演變
盛顯科技:拼接處理器是什么設備類型
相比上一代低功耗藍牙芯片,CC2745P到底升級了什么?
對稱多處理器的特點是什么
對稱多處理器和非對稱多處理器的區別
微處理器的內部結構和分類
ARM處理器的結構和特點

評論