電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))在 CRN 發(fā)布的 2023 年十大半導(dǎo)體初創(chuàng)公司的名單上,我們看到了不少AI 芯片廠商的名字,比如Cerebras Systems、SiMa.ai和Tenstorrent。其中Tenstorrent 最惹人關(guān)注,這家位于多倫多的初創(chuàng)企業(yè)如今由知名半導(dǎo)體業(yè)界大神 Jim Keller擔(dān)任CEO。
Tenstorrent 在 2021 年收獲了富達(dá)集團(tuán)領(lǐng)投的 2 億美元融資后,又在2023 年獲得了來自現(xiàn)代汽車集團(tuán)和三星催化劑基金會(huì)領(lǐng)投的 1 億美元融資。但對于這家廠商的硬件產(chǎn)品,我們卻很少得見真容,直到最近其開發(fā)套件開放訂購和出貨。
開發(fā)套件出貨,新的 AI 硬件開發(fā)平臺(tái)
從 Tenstorrent 的官網(wǎng)來看,目前已經(jīng)開放訂購的是其第一代 PCIe 4.0 AI 推理加速卡,e75 和 e150,兩者的定價(jià)分別為 599 美元和 799 美元。e75 開發(fā)套件可用于基礎(chǔ)的推理任務(wù),采用了 1/2 PCIe長度的設(shè)計(jì)搭配了 Tenstorrent 的第一代 AI 芯片 Grayskull,集成了96 個(gè) Tensix 核心、96MB 的 SRAM、8GB LPDDR4 內(nèi)存,核心頻率達(dá)到 1GHz,整個(gè)板卡的功耗約為75W。
e150 則是 3/4 長度的 PCIe 加速卡,同樣搭載了一個(gè) Grayskull 芯片,但核心數(shù)卻達(dá)到了 120個(gè),同時(shí)配備了120MB 的 SRAM,核心頻率也提升至 1.2GHz,單卡功耗約為 200W.
e75 雖然只是入門級的推理硬件套件,卻已經(jīng)給到了完整的開發(fā)流程,開發(fā)者可以使用兩種不同的軟件實(shí)現(xiàn)方式,一套是從上至下的 TT-Buda,另一套是從下至上的TT-Metalium。TT-Buda適用于想要開箱即用,直接將任何模型投入量產(chǎn)的客戶。而TT-Metalium則適用于想要充分了解 Tenstorrent軟硬件,并借此定制開發(fā)模型的客戶。
需要注意的是,e75 和 e150僅僅是 AI 加速卡而已,仍需要搭配一套通用計(jì)算系統(tǒng)才能精心開展 AI 開發(fā)。目前其僅支持 x86_64 架構(gòu)和 Ubuntu 20.04 以上版本的系統(tǒng),且需要 64GB 的內(nèi)存和至少 100GB 的存儲(chǔ)。
Tenstorrent 下一代 AI 芯片
除了第一代芯片 Grayskull 以外,Tenstorrent也公開了基于第二代芯片 Wormhole 的 PCIe AI 加速卡 n150 和 n300,n150 搭載了一個(gè) Wormhole 芯片,而 n300 搭載了兩個(gè) Wormhole 芯片,因此兩者的 Tensix 核心數(shù)存在較大差異,分別是 72 個(gè)和 128 個(gè),單板功耗分別為 160W和 300W。
從內(nèi)存配置上看,Wormhole也確實(shí)是面向更高性能的 AI 解決方案,將 Grayskull 的 LPDDR4 內(nèi)存換成了帶寬更高的 GDDR6 內(nèi)存。根據(jù)Tenstorrent 提供的說明,GraySkull 和 Wormhole 已經(jīng)支持了市面上主流的模型,比如 BERT、GPT-2、MobileNetV3、ResNet和YOLOv5等等,而性能更強(qiáng)的 Wormhole還提供了對 Falcon 和 Stable Diffusion 的支持。
不過,與可以單獨(dú)購買單個(gè)開發(fā)套件的 e75 和 e150 相比,目前 n150 和 n300 只開放了批量購買,且并沒有公布定價(jià)。要知道,無論是 Grayskull還是 Wormhole,都只是 Tenstorrent對 AI 芯片的早期設(shè)計(jì)與嘗試,兩者均基于 12nm 工藝開發(fā),且實(shí)際算力差距并不大,都在 300TFLOPS@INT8左右,只是其他硬件資源配置上有些許不同。而后續(xù)即將推出的 Black Hole將基于 6nm 工藝打造,將算力提升至1000TFLOPS@INT8 左右。
在其產(chǎn)品路線圖上,預(yù)計(jì)在今年公開發(fā)布的 Grendel才是其針對高端 AI 計(jì)算的殺手锏。Grendel采用了全新的 Chiplet 設(shè)計(jì),且用到了自研的 RISC-V CPU 核心,結(jié)合 3nm 工藝的 AI&CPU Chiplet,以及 7nm 工藝的內(nèi)存與 I/O Chiplet,將提供一個(gè)完整可擴(kuò)展的 AI 硬件平臺(tái)。
寫在最后
對于任何一個(gè)新的 AI 開發(fā)平臺(tái)而言,硬件開發(fā)套件和配套軟件都是至關(guān)重要的,甚至決定了愿意嘗試的開發(fā)者基數(shù)。Tenstorrent 在開放了 e75 和e150的購買后,無疑給不少還在觀望其硬件架構(gòu)的開發(fā)一個(gè)嘗鮮的機(jī)會(huì)。而開箱即用的體驗(yàn),想必也會(huì)吸引不少廠商對后續(xù)的高性能產(chǎn)品產(chǎn)生興趣。
-
AI
+關(guān)注
關(guān)注
87文章
34274瀏覽量
275454 -
加速卡
+關(guān)注
關(guān)注
1文章
63瀏覽量
11141 -
AI芯片
+關(guān)注
關(guān)注
17文章
1968瀏覽量
35696 -
Tenstorrent
+關(guān)注
關(guān)注
0文章
13瀏覽量
201
發(fā)布評論請先 登錄
智算加速卡是什么東西?它真能在AI戰(zhàn)場上干掉GPU和TPU!

邊緣AI運(yùn)算革新 DeepX DX-M1 AI加速卡結(jié)合Rockchip RK3588多路物體檢測解決方案

寒武紀(jì)基于思元370芯片的MLU370-X8 智能加速卡產(chǎn)品手冊詳解

邊緣AI新突破:MemryX AI加速卡與RK3588打造高效多路物體檢測方案

Tenstorrent擬在日本開展業(yè)務(wù),專注尖端半導(dǎo)體設(shè)計(jì)
Tenstorrent獲7億美元融資,貝索斯參投挑戰(zhàn)英偉達(dá)
S7t-VG6 VectorPath加速卡的特性和功能
Tenstorrent與日本合作:五年內(nèi)培訓(xùn)200名日本芯片工程師
AMD推出新款纖薄尺寸電子交易加速卡
博世攜手Tenstorrent共研汽車芯片標(biāo)準(zhǔn)化方案
大模型向邊端側(cè)部署,AI加速卡朝高算力、小體積發(fā)展
EPSON差分晶振SG3225VEN頻點(diǎn)312.5mhz應(yīng)用于AI加速卡
YXC高頻差分晶振,頻點(diǎn)312.5mhz,高精度.高穩(wěn)定性,應(yīng)用于AI加速卡

評論