電子發燒友網報道(文/李寧遠)自1965年戈登摩爾提出摩爾定律以后,半導體行業在摩爾定律上已經繁榮發展了半個多世紀。芯片,已經成為時代發展的重要引擎。但隨著晶體管尺寸逐漸逼近物理極限,近年來摩爾定律發展已放緩,甚至面臨失效無法延續,需要建立新的芯片秩序。
而且在現在的人工智能時代,算力是無法替代的先進生產力,是人工智能、大數據、物聯網等先進技術落地應用的基礎支撐,而國內正處在高端算力芯片供應鏈被封鎖的形勢。如何繞開專利、技術被封鎖的束縛,找出一條新的道路來也是至關重要。
與現有高端GPU相比,實現了算力提升三千余倍,能效提升四百萬余倍的表現,ACCEL光電計算芯片為超高性能芯片的研發開辟了全新的路徑。
ACCEL架構光電計算實現高速視覺處理性能飛躍
現在我們使用的各種設備和系統,絕大多數通過晶體管以電信號來進行計算,以現在市面上用于人工智能算力芯片內集成的晶體管數量已經以百億、千億來算。這些晶體管操縱電流實現超大規模的計算。
人工智能算力正在崛起成為剛需,而摩爾定律正在衰落,尋找新興技術革新硬件計算是目前前沿科技的一大技術熱點。量子計算、神經形態芯片、光子計算等都是有可能實現計算性能飛躍的技術路線,光子計算是其中有力的競爭者,近期ACCEL光電計算芯片的突破也印證了這一技術路線的可行性。
面向高速視覺任務的純模擬光電計算芯片基于光電深度融合計算框架,將光芯片與電芯片結合,在一枚芯片上突破大規模計算單元集成、高效非線性、高速光電接口三個國際難題,由清華大學自動化系(戴瓊海院士、吳嘉敏助理教授)與電子工程系(方璐副教授、喬飛副研究員)聯合攻克。
不同于傳統計算,光子計算不是通過將電流表示成0和1來編碼和操作數據,而是利用光的物理特性來進行計算。光子計算使用光,這使得它更快、更有效、更緊湊。光子計算的確能夠更快、更節能地處理視覺數據。
因此,清華大學團隊提出了一種結合電子和光計算(ACCEL)的全模擬芯片架構,將衍射光學模擬計算(OAC)和電子模擬計算(EAC)融合在一個芯片中,具有可擴展性、非線性和靈活性。根據論文數據,其系統能效為74.8Peta-OPS/W,計算速度為4.6Peta-OPS,而且計算的99%都由光學部分實現。
不論是系統能效還是計算速度,和現在最先進的計算處理相比,ACCEL都有著數量級上絕對的領先。
具體來說,ACCEL的系統級算力穩定達到現有高性能芯片的數千倍,同時系統級能效較現有的高性能 GPU、TPU、光計算和模擬電計算架構,提升了兩千到數百萬倍不等。
對于視覺數據來說,ACCEL無疑讓處理性能實現了飛躍,也表明了“掙脫”摩爾定律的全新計算架構的可行性。
全新顛覆性計算架構,助力***領域彎道超車
ACCEL架構光芯片與電芯片的融合性能的大幅提升已經被證實,而且該芯片光學部分的加工最小線寬僅采用百納米級,而電路部分僅采用180nm CMOS工藝。如果采用更先進的工藝技術,ACCEL能進一步大幅降低更高時鐘頻率下運行的控制單元功耗。
成熟的工藝卻實現了超越先進制程GPU的性能,未來光子計算的霸權或許不是說說而已。
根據清華團隊的說法,如果將OAC層數進一步提高,ACCEL的性能將進一步提高,實現靈敏度更高的光電二極管陣列并行輸出。增加SRAM位數將進一步拓展ACCEL可分類的視覺類別數量。其未來的發展還有很大的提升空間。
更高算力和更優秀的能耗比只是ACCEL兩個最直觀的特點,在論文中,還披露了大量技術細節。
ACCEL將衍射光學計算作為光學編碼器進行特征提取后,誘導光電流直接用于進一步計算,無需模數轉換器。在同一任務不同類型的數字神經網絡的端到端延遲和能耗對比中,ACCEL實現了每幀72 ns的超低計算延遲和每幀4.38 nJ的能耗,遠小于NVIDIA A100的每幀0.26 ms延遲和每幀18.5 mJ的能耗。
論采用哪種方式計算操作,在實際應用中實現相同精度時,ACCEL與先進GPU上的數字神經網絡相比,全模擬的ACCEL都能將系統延遲和能耗降低了幾個數量級。
可以說ACCEL的全新計算架構,極具顛覆性,繞過了模擬數字轉換器速度、精度與功耗相互制約的物理瓶頸,充分利用了光電技術的優勢,芯片實現了計算效率和能耗的極致優化。大量的實驗數據對比也打消了人們對光子計算算力“有效性”的顧慮。
雖然這一技術目前還只是停留在實驗室階段,但從實際應用價值來看,這一成果對于推動芯片技術進步、降低能耗和提高計算效率具有重要意義。在國內先進制程面臨制約的情況下,清華大學團隊在顛覆性計算架構取得的成果給我國高性能芯片研發開辟了一條全新的路徑,是打破芯片專利、技術封鎖的一個方向。
光電芯片在量產后,也足夠顛覆現在的半導體格局,也將在未來實際應用落地后推動人工智能等領域的創新與發展。
小結
目前,該團隊正在研究規模更大、算力更強的模擬域光電融合系統,這需要在算法層面和硬件層面,開展更高層次的聯合設計優化。目標應用也拓展至和高速處理相關的領域,如時延降低四個數量級的超高速圖像計算、自動駕駛、野外監測、物聯網傳感器網絡等等。
采用全新原理研發出計算芯片需要越過很多難關,不可能一蹴而就,但ACCEL的出現也意味著新一代計算架構時代的來臨可能會比料想中的更早。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
光電
+關注
關注
8文章
775瀏覽量
82227 -
gpu
+關注
關注
28文章
4909瀏覽量
130648
發布評論請先 登錄
相關推薦
熱點推薦
iTOP-3588S開發板四核心架構GPU內置GPU可以完全兼容0penGLES1.1、2.0和3.2。
性能強
iTOP-3588S開發板采用瑞芯微RK3588S處理器,是全新一代AloT高端應用芯片,搭載八核64位CPU,四核Cortex-A76和四核Cortex-A55架構主頻高達2
發表于 05-15 10:36
Nordic新一代旗艦芯片nRF54H20深度解析
異構架構??的芯片集成了:
??雙Cortex-M33內核??(主頻320MHz,性能達nRF5340的2倍)
??RISC-V協處理器集群??(專為實時任務優化)
??超大存儲配置?
發表于 04-26 23:25
一文讀懂分貝(dB)【強烈建議收藏】
來,計算信號經過多個放大或衰減環節后的總增益或損耗就變得輕松多了。
舉個例子,如果一個信號經歷了 4千倍的增益,我們可以將 4千倍分解為 1
發表于 03-24 12:03
寶馬發布全新一代智能電子電氣架構
"超級大腦"賦能寶馬新世代車型智能駕駛樂趣 全新一代電子電氣架構搭載新世代車型,覆蓋全動力系統和全細分車型 全新一代電子電氣架構集成算力提升20倍
芯原發布新一代Vitality架構GPU IP系列
芯原股份近日宣布,正式推出全新Vitality架構的圖形處理器(GPU)IP系列。這一新一代GPU架構以其卓越的
《CST Studio Suite 2024 GPU加速計算指南》
和不支持的NVIDIA GPU硬件,如支持的有L40S、RTX 5000 Ada Gen等,不支持的如Kepler和Maxwell部分型號被標記為棄用。同時提到GPU計算要求64位計算機架構
發表于 12-16 14:25
《算力芯片 高性能 CPUGPUNPU 微架構分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變
對卷積核優化的思考。
GPU的存儲體系采用了獨特的倒金字塔結構,在我看來這是其計算性能的關鍵。大容量寄存器設計破解了傳統馮諾依曼架構的內存瓶頸,合并訪存機制巧妙解決了內存帶寬限制。NV
發表于 11-24 17:12
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--了解算力芯片GPU
本篇閱讀學習第七、八章,了解GPU架構演進及CPGPU存儲體系與線程管理
█從圖形到計算的GPU架構演進
發表于 11-03 12:55
如何提高GPU性能
學習和機器學習等領域發揮著重要作用。 1. 硬件升級 a. 更換高性能GPU 最直接的提高GPU性能的方法是升級到更高性能的顯卡。隨著技術的
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽
、GPU、NPU,給我們剖析了算力芯片的微架構。書中有對芯片方案商處理器的講解,理論聯系實際,使讀者能更好理解算力芯片。
全書共11章,
發表于 10-15 22:08
名單公布!【書籍評測活動NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構分析
和像素統一的G80到現在重金難求的H100;AMD的Zen系列CPU和RDNA系列GPU兩線作戰;中國的高性能計算芯片逐步獲得更多TOP50
發表于 09-02 10:09
IaaS+on+DPU(IoD)+下一代高性能算力底座技術白皮書
,在其上掛載了各種計算、存儲資源的節點,對于系統的資源彈性、運行效率、性能都大有益處。但是這種使用方式的變化,需要對現有云計算架構進行一定程
發表于 07-24 15:32
美光科技發布新一代GDDR7顯存
在近日舉行的臺北國際電腦展上,美國存儲芯片巨頭美光科技正式發布了其新一代GDDR7顯存。這款新型GPU顯卡內存基于美光的1βDRAM架構,將
評論