談到如何設(shè)計AI加速器,許多工程師都會給出不同的答案,但歸根結(jié)底仍是在一顆先進(jìn)制程的芯片上排列組合數(shù)十億個晶體管。然而當(dāng)前超大規(guī)模的AI推理依然面臨著不少挑戰(zhàn),比如成本和復(fù)雜度高居不下,傳統(tǒng)架構(gòu)下的性能、功耗和可編程性無法滿足超大規(guī)模的要求等。初創(chuàng)公司Esperanto作為去年才開始冒頭的初創(chuàng)企業(yè),卻打算用RISC-V來解決這一問題。
Esperanto創(chuàng)立于2014年,其董事長Dave Ditzel曾在英特爾負(fù)責(zé)下一代微處理器架構(gòu)的設(shè)計。Esperanto的工作方向是基于RISC-V這一開放架構(gòu),開發(fā)高性能、高效率的計算方案。為此,他們打造了ET-SoC-1,一個千核的RISC-V處理器,也是他們開發(fā)的首個AI加速器。

ET-SoC-1 / Esperanto
ET-SoC-1的名字寓意并不是傳統(tǒng)的SoC,而是面向超大規(guī)模數(shù)據(jù)中心的“片上超級電腦”。它包含了近乎1100個RISC-V核心,近240億晶體管。需要指出的是,ET-SoC-1是一個AI推理加速器,并不是訓(xùn)練加速器。
據(jù)CEO Art Swift介紹,該芯片采用了臺積電7nm制程,在特定的工作任務(wù)上,能耗效率提高可至100倍。ET-SoC-1在其他關(guān)鍵工作任務(wù)上,性能提升要遠(yuǎn)高于傳統(tǒng)的CPU加GPU方案。比如在模擬測試中,用于推薦網(wǎng)絡(luò)時,其性能提升高達(dá)50倍,在圖像分類上,性能提升高達(dá)30倍。雖然這些暫時只是紙面測試參數(shù),但這樣的性能和功耗無疑可以給AI客戶帶來很大的吸引力。
據(jù)了解,這一芯片直至2021年第二季度才正式流片,預(yù)計2022年早期才會開始量產(chǎn)。這是因為Esperanto花了很多時間在驗證上,作為一家初創(chuàng)公司,Esperanto采用了架構(gòu)、硬件和軟件聯(lián)合設(shè)計的方式,這樣一來雖然節(jié)省了時間,卻也讓規(guī)格一直在持續(xù)變動。因此Esperanto在驗證團(tuán)隊上投入了許多精力,也率先采用了新思的ZeBu FPGA仿真方案,以求減少查錯和除錯時間。

ET-SoC-1芯片架構(gòu) / Esperanto
ET-SoC-1用到了兩種Esperanto自研的RISC-V核心,分別是4個ET-Maxion(超標(biāo)量亂序核)和1089個ET-Minion(順序多線程核心)。ET-Maxion是一顆可以運行Linux的大核心,核心頻率超過2GHz,作為ET-SoC-1的控制CPU,而ET-Minion則用于矩陣乘法等重度機(jī)器學(xué)習(xí)數(shù)據(jù)處理。
ET-Maxion作為核心頻率超過2GHz的10級流水線RISC-V核心,其實原本是伯克利大學(xué)Boom V2開源核心的的分支,但Esperanto對此進(jìn)行了大刀闊斧的改進(jìn)。在SPEC2006測試下,其性能已經(jīng)超過了Cortex-A57,不過還是次于Cortex-A72以及SiFive最近公布的P550。
雖然是一個小核,但ET-Minion也是一個64位RISC-V核心。ET-SoC-1內(nèi),32個ET-Minion和4MB的L2 SRAM組成了“Minion Shire”,一共34個Shire采用Mesh的方式連接在一起,多出來的一個ET-Minion則用作服務(wù)處理器。Esperanto用這一千多個ET-Minion做到了強(qiáng)大的浮點性能,某些傳統(tǒng)加速器僅支持INT8運算,而ET-SoC-1在FP16或FP32上都能展現(xiàn)出不俗的優(yōu)勢。

搭載6個ET-SoC-1的Glacier Point v2 / Esperanto
Art Swift提到,F(xiàn)acebook推出的開源AI板卡Glacier Point v2可以搭載6個ET-SoC-1芯片,這樣以來就可以直接接入已有的開源計算項目(OCP)設(shè)備中。這一張卡上就包含了6558個RISC-V核心和192GB的LPDDR4X DRAM,帶寬可達(dá)822GB/s的同時還擁有較低的功耗。據(jù)估計,這一設(shè)計的板卡峰值性能可達(dá)800 TOPS(INT8)以上。
在軟件層面上,Esperanto也為C++、Pytorch和TensorFlow常見的機(jī)器學(xué)習(xí)框架提供了支持。只需采用Facebook的開源編譯器,就可以在多個ET-SoC-1芯片上運行機(jī)器學(xué)習(xí)模型。
結(jié)語
RISC-V雖然在傳統(tǒng)的CPU與GPU市場還未徹底崛起,但在AI加速上,已經(jīng)以其獨到的優(yōu)勢迅速攻城略地。這種千核式的設(shè)計其實已經(jīng)應(yīng)用于Arm等架構(gòu),不少數(shù)據(jù)中心、超算卻依然在嘗試用RISC-V作為加速器。
RISC-V憑借其開放性、擴(kuò)展性和自主性,并沒有像Arm那樣由低至高地發(fā)展市場,而是低端和高端兩頭抓,一旦消費市場也開始普及RISC-V生態(tài),那時的RISC-V就有與Arm全市場爭霸的希望了。
Esperanto創(chuàng)立于2014年,其董事長Dave Ditzel曾在英特爾負(fù)責(zé)下一代微處理器架構(gòu)的設(shè)計。Esperanto的工作方向是基于RISC-V這一開放架構(gòu),開發(fā)高性能、高效率的計算方案。為此,他們打造了ET-SoC-1,一個千核的RISC-V處理器,也是他們開發(fā)的首個AI加速器。

ET-SoC-1 / Esperanto
ET-SoC-1的名字寓意并不是傳統(tǒng)的SoC,而是面向超大規(guī)模數(shù)據(jù)中心的“片上超級電腦”。它包含了近乎1100個RISC-V核心,近240億晶體管。需要指出的是,ET-SoC-1是一個AI推理加速器,并不是訓(xùn)練加速器。
據(jù)CEO Art Swift介紹,該芯片采用了臺積電7nm制程,在特定的工作任務(wù)上,能耗效率提高可至100倍。ET-SoC-1在其他關(guān)鍵工作任務(wù)上,性能提升要遠(yuǎn)高于傳統(tǒng)的CPU加GPU方案。比如在模擬測試中,用于推薦網(wǎng)絡(luò)時,其性能提升高達(dá)50倍,在圖像分類上,性能提升高達(dá)30倍。雖然這些暫時只是紙面測試參數(shù),但這樣的性能和功耗無疑可以給AI客戶帶來很大的吸引力。
據(jù)了解,這一芯片直至2021年第二季度才正式流片,預(yù)計2022年早期才會開始量產(chǎn)。這是因為Esperanto花了很多時間在驗證上,作為一家初創(chuàng)公司,Esperanto采用了架構(gòu)、硬件和軟件聯(lián)合設(shè)計的方式,這樣一來雖然節(jié)省了時間,卻也讓規(guī)格一直在持續(xù)變動。因此Esperanto在驗證團(tuán)隊上投入了許多精力,也率先采用了新思的ZeBu FPGA仿真方案,以求減少查錯和除錯時間。

ET-SoC-1芯片架構(gòu) / Esperanto
ET-SoC-1用到了兩種Esperanto自研的RISC-V核心,分別是4個ET-Maxion(超標(biāo)量亂序核)和1089個ET-Minion(順序多線程核心)。ET-Maxion是一顆可以運行Linux的大核心,核心頻率超過2GHz,作為ET-SoC-1的控制CPU,而ET-Minion則用于矩陣乘法等重度機(jī)器學(xué)習(xí)數(shù)據(jù)處理。
ET-Maxion作為核心頻率超過2GHz的10級流水線RISC-V核心,其實原本是伯克利大學(xué)Boom V2開源核心的的分支,但Esperanto對此進(jìn)行了大刀闊斧的改進(jìn)。在SPEC2006測試下,其性能已經(jīng)超過了Cortex-A57,不過還是次于Cortex-A72以及SiFive最近公布的P550。
雖然是一個小核,但ET-Minion也是一個64位RISC-V核心。ET-SoC-1內(nèi),32個ET-Minion和4MB的L2 SRAM組成了“Minion Shire”,一共34個Shire采用Mesh的方式連接在一起,多出來的一個ET-Minion則用作服務(wù)處理器。Esperanto用這一千多個ET-Minion做到了強(qiáng)大的浮點性能,某些傳統(tǒng)加速器僅支持INT8運算,而ET-SoC-1在FP16或FP32上都能展現(xiàn)出不俗的優(yōu)勢。

搭載6個ET-SoC-1的Glacier Point v2 / Esperanto
Art Swift提到,F(xiàn)acebook推出的開源AI板卡Glacier Point v2可以搭載6個ET-SoC-1芯片,這樣以來就可以直接接入已有的開源計算項目(OCP)設(shè)備中。這一張卡上就包含了6558個RISC-V核心和192GB的LPDDR4X DRAM,帶寬可達(dá)822GB/s的同時還擁有較低的功耗。據(jù)估計,這一設(shè)計的板卡峰值性能可達(dá)800 TOPS(INT8)以上。
在軟件層面上,Esperanto也為C++、Pytorch和TensorFlow常見的機(jī)器學(xué)習(xí)框架提供了支持。只需采用Facebook的開源編譯器,就可以在多個ET-SoC-1芯片上運行機(jī)器學(xué)習(xí)模型。
結(jié)語
RISC-V雖然在傳統(tǒng)的CPU與GPU市場還未徹底崛起,但在AI加速上,已經(jīng)以其獨到的優(yōu)勢迅速攻城略地。這種千核式的設(shè)計其實已經(jīng)應(yīng)用于Arm等架構(gòu),不少數(shù)據(jù)中心、超算卻依然在嘗試用RISC-V作為加速器。
RISC-V憑借其開放性、擴(kuò)展性和自主性,并沒有像Arm那樣由低至高地發(fā)展市場,而是低端和高端兩頭抓,一旦消費市場也開始普及RISC-V生態(tài),那時的RISC-V就有與Arm全市場爭霸的希望了。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
AI
+關(guān)注
關(guān)注
88文章
34378瀏覽量
275613 -
RISC-V
+關(guān)注
關(guān)注
46文章
2505瀏覽量
48334
發(fā)布評論請先 登錄
相關(guān)推薦
熱點推薦
HPM5E31IGN單核 32 位 RISC-V 處理器
HPM5E31IGN單核 32 位 RISC-V 處理器在當(dāng)今嵌入式系統(tǒng)領(lǐng)域,RISC-V架構(gòu)正以開源、靈活和高性價比的優(yōu)勢快速崛起。HPM5E31IGN作為先楫半導(dǎo)體的一款單核32位RISC
發(fā)表于 05-29 09:23
RISC-V賽道的“硬核”突圍之路
。 Omdia發(fā)文稱,最近三年,越來越多的RISC廠商進(jìn)入RISC-V,含RISC-V技術(shù)的處理器加速器以驚人的速度增長,2020年至202

端側(cè)AI、數(shù)據(jù)中心,RISC-V已“上桌”
應(yīng)用。 ? 最近超睿科技發(fā)布了UR-DP1000高性能桌面級RISC-V CPU,這款CPU擁有8個高性能自研RISC-V處理器核UR-CP100,12nm工藝下工作頻率2.0~2.3
首款RISC-V架構(gòu)服務(wù)器,助力行業(yè)精準(zhǔn)適配AI場景
RISC-V融合服務(wù)器RS-SRM120為2U雙路異構(gòu)服務(wù)器產(chǎn)品,搭載雙RISC-V指令集64核處理器

Imagination放棄RISC-V處理器內(nèi)核開發(fā)
電子發(fā)燒友網(wǎng)報道(文/吳子鵬)根據(jù)外媒的最新報道,半導(dǎo)體IP大廠Imagination Technology已經(jīng)停止了RISC-V處理器內(nèi)核的開發(fā),轉(zhuǎn)而更加專注于其核心的GPU和AI產(chǎn)品
Andes晶心科技推出D45-SE RISC-V處理器
Andes晶心科技(TWSE:6533; SIN US03420C2089; ISIN:US03420C1099)是全球高效能、低功耗 32/64 位 RISC-V 處理器的領(lǐng)導(dǎo)廠商,也是
Rivos全新產(chǎn)品采用Andes晶心科技NX45 RISC-V處理器
專注于加速數(shù)據(jù)分析和生成式AI工作負(fù)載的RISC-V主要會員公司Rivos與32/64位RISC-V處理器內(nèi)核的領(lǐng)先供貨商、RISC-V創(chuàng)始
《RISC-V能否復(fù)制Linux 的成功?》
,創(chuàng)建實現(xiàn)自有加速器算法的自定義異構(gòu)集群。RISC-V作為一種ISA,我們一開始是在處理器內(nèi)核中采用吸引人的通用構(gòu)建塊,然后在此基礎(chǔ)上進(jìn)行構(gòu)建,同時還利用最好的商業(yè)工具增強(qiáng)使用者的信心。所以,IP
發(fā)表于 11-26 20:20
RISC-V,即將進(jìn)入應(yīng)用的爆發(fā)期
計算機(jī)由控制整體的CPU(中央處理器)和加速器兩部分構(gòu)成。在AI計算中,功耗和效率是兩個關(guān)鍵因素。RISC-V架構(gòu)通過其簡潔的設(shè)計和定制化的擴(kuò)展,可以實現(xiàn)高效的能量使用。該架構(gòu)能夠通過
發(fā)表于 10-31 16:06
MicroBlaze V軟核處理器的功能特性
本指南提供了有關(guān) AMD Vivado Design Suite 中包含的 32 位和 64 位 MicroBlaze V 軟核處理器的信息。該文檔旨在用作為處理器硬件架構(gòu)的指南,隨附

RISC-V擁有巨大市場潛力的原因
旬發(fā)布了第三代“香山”開源高性能RISC-V處理器核,其性能水平已進(jìn)入全球第一梯隊,可廣泛應(yīng)用于服務(wù)器芯片、AI芯片、GPU、DPU等高端芯
發(fā)表于 09-30 14:20
淺談國產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的優(yōu)勢和應(yīng)用場景
關(guān)于國產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的具體優(yōu)勢和應(yīng)用場景淺談如下:
優(yōu)勢
異構(gòu)計算能力 :
異構(gòu)雙核設(shè)計結(jié)合了RISC-V
發(fā)表于 08-31 08:32
萬物智聯(lián)時代,RISC-V與AI的融合之路該如何走?
人工智能與機(jī)器學(xué)習(xí)專委會主席謝濤發(fā)表了《萬物智聯(lián)時代RISC-V+AI之路》演講,分析了RISC-V與AI技術(shù)的結(jié)合及其發(fā)展路徑探索。他在發(fā)言中,盡管國產(chǎn)

RISC-V適合什么樣的應(yīng)用場景
設(shè)計使得開發(fā)者可以靈活選擇所需的指令集和模塊,以滿足嵌入式系統(tǒng)的各種性能要求。
3. 人工智能(AI)和機(jī)器學(xué)習(xí)(ML)
高性能計算:RISC-V結(jié)合AI加速器或協(xié)
發(fā)表于 07-29 17:16
RISC-V在中國的發(fā)展機(jī)遇有哪些場景?
。RISC-V結(jié)合AI加速器,可以在AI領(lǐng)域提供高效的計算解決方案。
定制化需求:RISC-V允許添加專門的加速
發(fā)表于 07-29 17:14
評論