S7t-VG6 VectorPath加速卡是Achronix公司聯合BittWare公司(Molex旗下的領先企業級FPGA加速器產品供應商)推出的一類全新的、面向高性能計算和數據加速應用的FPGA加速卡。該加速卡搭載了Achronix采用7納米工藝打造的Speedster 7tAC7t1500獨立FPGA芯片,在同類PCIe FPGA加速卡中,可提供目前業界最高性能的接口。這些高性能接口包括1個400G以太網接口和2個100G以太網接口,以及總帶寬為3.5 Tbps的8組GDDR6板上存儲器,從而使該加速卡成為人工智能/機器學習(AI / ML)、網絡和高帶寬數據加速應用的理想選擇。 本文詳細介紹了S7t-VG6 VectorPath加速卡的特性和功能,歡迎您閱讀,以進一步了解該產品。您也可以在Achronix微信公眾號的“產品介紹”欄目中隨時閱讀本文。
VectorPath加速卡——基于最新的7納米FPGA技術構建您的應用
S7t-VG6 FPGA加速卡簡介
提升FPGA的加速性能不僅僅在于增加門數,還需要更好的高速數據傳輸通道、更加精心定制的可編程單元、具有更高帶寬的大容量存儲以及新一代網絡功能的支持。Achronix和BittWare聯合打造的S7t VectorPath加速卡,可以為您的應用在計算和數據傳輸方面提供下一代加速功能。
S7t FPGA加速卡的核心是Achronix的7納米Speedster7t FPGA。該 FPGA充分發揮了臺積電(TSMC)7納米FinFET工藝的潛力,專門針對人工智能/機器學習和高帶寬數據加速應用進行了高度優化。
S7t FPGA加速卡為用戶提供了一系列先進的輸入輸出(I/O)接口,包括400G以太網接口、多個PCIe接口和高帶寬GDDR6存儲器接口。
客戶可以通過BittWare的BittWorks II工具包快速開啟此加速卡的使用,該工具包包含示例工程,同時支持Linux和Windows操作系統。
(a)Achronix的7納米Speedster7t FPGA
(b)S7t FPGA加速卡
Achronix的革命性芯片設計+BittWare的企業級設計
S7t-VG6 FPGA加速卡功能
★ 片上網絡(NoC)——高速數據通道令FPGA內部暢通無阻
NoC是Speedster7t FPGA的高速數據通道,可以沿著行/列在FPGA結構中或向著邊緣接口高速移動數據,從而釋放更多的邏輯單元用于計算任務。
NoC的總帶寬達 >27 Tbps。外圍的NoC(外圈)可以將存儲器和PCIe邊緣接口連接至NoC的行/列。外圍的NoC還可以在獨立于FPGA結構之外的接口間移動數據——例如,主機可以在不使用任何FPGA內部資源的情況下通過PCIe將數據傳輸至GDDR6。
★ FPGA結構——運算能力高達86 TOPS,最高運行頻率為750MHz
可重新配置的邏輯模塊(RLB)
RLB是Speedster7t的一項特色功能:它是一種全新的可重新配置的邏輯架構,帶有6輸入查找表和8位算術邏輯單元,每個查找表有2個觸發器,它還具有一種基于改進型Booth算法重新構造的乘法器查找表(MLUT)模式,該算法可使基于查找表的乘法運算性能提高一倍。
Speedster7t FPGA擁有692K的查找表。
機器學習處理器(MLP)
MLP模塊是支持定點和浮點計算的大規模矩陣向量和矩陣乘法引擎。MLP提供的功能包括帶有累加可選項的整數乘法(int4/int8/int16/int32)、bfloat16格式的浮點運算、16位浮點運算、塊浮點運算和24位浮點運算。MLP完全可拆分的整數乘法器/累加器的結構,可有效支持機器學習推理和更傳統的應用,例如復雜的自適應信號處理。
根據不同乘法器格式,每個MLP可以支持或是可等效成的乘法器數量也會有變化,例如每個MLP可以支持4個int16,或者16個int8,或者32個int4乘法器。Achronix的Speedster7t-1500器件支持有2560個MLP,因此支持Int8 MAC多達40,960個,運行在750MHz的時鐘頻率時,推算最大性能為每秒61.4萬億次操作。
MLP模塊包括兩個可以單獨使用或與乘法器一起使用的存儲器模塊。總體的嵌入式存儲器容量為189Mb。
★ 高帶寬GDDR6存儲器
速度快6倍的大容量存儲器——目前板卡支持的GDDR6帶寬為3.5Tbps,容量為16GB容量。而FPGA芯片支持的GDDR6帶寬可到4Tbps,容量可支持到32GB。
通過使用高帶寬GDDR6存儲器,S7t加速卡可以為您的應用提供16GB的大容量存儲器資源,但同時可提供高達6倍的帶寬。
此外,借助NoC,可以在不使用FPGA資源的情況下,從主機通過PCIe對GDDR6進行讀/寫。
★ 高達400G的網絡
S7t加速卡提供了一系列可連接至Speedster7t FPGA邏輯結構的網絡接口。憑借由硬IP實現的MAC(Hard IP MAC)和前向糾錯(FEC)技術的支持,該加速卡可支持56G PAM4。板載的抖動消除器可用于同步以太網(Synchronous Ethernet)。
QSFP 56G(PAM4)接口
第一個接口是一個帶有4個SerDes通道的QSFP56接口,可支持的以太網接口:200/100/50/25/10 GbE。
第二個接口是一個帶有8個SerDes通道的QSFP-DD接口,可支持的以太網接口:400/200/100/50/25/10 GbE。
如圖所示的分支連接線提供了一系列其他選項。
★ PCIe、擴展和定制
PCIe Gen5 x16接口
S7t加速卡支持一個PCIe Gen5 x16接口,已經通過PCI-SIG認證。BittWorks II工具包提供的示例項目中包括了用于PCIe交互的示例。
MCIO接口
支持MCIO接口,通過4個高速收發器連接到FPGA,支持PCIe Gen5的數據速率。
支持PCIe5.0的NVMe存儲應用
板對板互連
可以使用自定義選項連接至配件板
定制
得益于三十年來構建定制化解決方案的經驗,BittWare作為您的合作伙伴可以在各方面提供支持,從簡單的配件板到各種具有復雜機械要求的完全定制方案,一應俱全。我們的資源包括業務覆蓋全球的莫仕(Molex)集團,因此可以處理任何規模的項目。
★ 加速卡的其他功能
用于同步以太網的抖動消除器
可從前面板接入1 pps(每秒1個脈沖)的外部參考時鐘
具有健康監測功能的基板管理控制器(BMC)
用于Linux和Windows操作系統的驅動程序
應用領域
★ 計算
旨在滿足要求最嚴苛的計算密集型應用
8組GDDR6存儲器可提供3.5 Tbps左右的帶寬
針對人工智能/機器學習(AI/ML)功能進行了優化的機器學習處理器(MLP):
在Int8整數格式下,可提供多達41K的乘累加單元(MAC)
支持多種浮點格式和整數格式
★ 網絡
QSFP-DD和QSFP56端口可滿足多種高速網絡應用的需求
硬化的多速率MAC適用于10G - 400G以太網
片上網絡(NoC)的帶寬超過27 Tbps,支持數據流輸入器件、從器件輸出以及跨越整個器件移動。
★ 存儲
NVMe接入可支持數據記錄器和數據處理應用
通過MICO擴展端口連接NVMe閃存
數據流直接從網絡端口傳輸至閃存陣列
★ 傳感器處理
使用GPIO和SerDes擴展端口針對您的特定應用需求進行優化
直接與自定義數據和控制信號連接
可直接互補性傳感器和處理器技術
開發工具
★ ACE:FPGA開發軟件
Achronix的ACE軟件是Speedster7t的開發環境。ACE可以執行硬件設計流程,支持RTL輸入(VHDL和Verilog語言皆可)和行業標準仿真。ACE還支持使用NoC等高級芯片功能。ACE包括了為Achronix優化的Synopsys的Synplify-Pro工具。
★ BittWare的BittWorks II工具包:強大的開發工具
BittWorks II工具包提供了驅動程序、庫、實用程序和示例項目,可用于訪問、整合和開發S7t加速卡的應用。
TeraBox服務器
★ 將您的S7t加速卡置入TeraBox服務器中!
讓我們來完成服務器的集成并啟動您的應用的概念驗證,您無需再去準備額外的、寶貴的開發資源!
★ 通過TeraBox服務器延長您的保修期
對于大多數內置加速卡的TeraBox服務器,您在購買后可以將加速卡的保修期延長至3年。
S7t-VG6加速卡的規格
FPGA |
Speedster AC7t1500 基于 TSMC 7nm FinFET 工藝 692K的6輸入LUT(相當于1,522K的4輸入LUT) 二維NOC達到 >27 Tbps的帶寬 片上RAM的容量約為189Mb 高達86 TOPS 的 int8 性能 ResNet-50 基準測試:每秒 8,600 張圖像 該芯片支持GDDR6的總帶寬可到4Tbps,容量可到32GB 該芯片支持112Gbps SerDes |
板載存儲器 |
GDDR6 板載的8組GDDR6存儲器,總帶寬約為3.5Tbps,總存儲容量為16GB DDR4 具有錯誤檢查和糾正(ECC)功能的、運行頻率為2666MHz的DDR4存儲器,存儲容量為4GB(72位位寬) Flash 用于啟動FPGA的閃存 |
主機接口 | 可直接連接至FPGA的PCIe Gen5/4 x16接口 |
外部時鐘 | 可從前面板輸入1pps、10MHz的參考時鐘 |
Micro USB接口 | 通過USB接口訪問BMC,USB接口轉JTAG接口,USB接口轉UART接口 |
MCIO接口 |
MCIO接口位于加速卡正面,通過4個收發器連接至FPGA 由硬PCIe IP實現 |
GPIO接口 | 8個GPIO引腳,電壓為3.3V,單端型,每個GPIO引腳的方向(發送或接收)可由FPGA分別設置,緩沖器的額定速率為200Mbps |
QSFP接口 |
板上的QSFP-DD的接口: 56G PAM4收發器 支持:1x 400GbE,2x 200GbE,4x 100GbE或8x 10/25/40/50GbE 支持MAC硬核和前向糾錯(FEC)功能 板上的QSFP56接口: 56G PAM4收發器 支持:1x 200GbE,2x 100GbE,或4x 10/25/40/50GbE 支持MAC硬核和前向糾錯(FEC)功能 |
基板管理控制器 |
電壓、電流、溫度監測 上電順序和復位 現場升級 FPGA配置和控制 時鐘配置 I2C總線訪問 USB 2.0接口 電壓調節 |
冷卻 |
標準:雙倍寬度無源散熱器 可選項:雙倍寬度有源散熱器 可選項:雙倍寬度液體冷卻 |
用電 |
板上供電來自于兩個AUX連接器(8引腳) 功耗取決于應用 典型的最大功耗值有待確定 |
環境 | 工作溫度為5°C-35°C |
尺寸 | 標準高度、雙倍寬度的PCIe板 |
關于Achronix半導體公司
Achronix半導體公司是一家私有的、采用無晶圓廠模式的半導體公司,總部位于美國加利福尼亞州圣克拉拉市,同時提供高性能FPGA和嵌入式FPGA(eFPGA)解決方案。Achronix歷來都是高性能FPGA市場向前發展的推動者之一。Achronix提供的產品包括可編程的FPGA結構,具有硬連線系統級模塊的高性能、高密度獨立FPGA,數據中心和高性能計算(HPC)硬件加速器板,以及支持所有Achronix產品的一流EDA軟件。公司在美國、歐洲和中國都設有銷售辦公室和代表處,在印度班加羅爾設有一間研發和設計辦公室。
-
以太網
+關注
關注
40文章
5582瀏覽量
174745 -
接口
+關注
關注
33文章
8932瀏覽量
153187 -
加速卡
+關注
關注
1文章
62瀏覽量
11138 -
Achronix
+關注
關注
1文章
76瀏覽量
22707
原文標題:S7t-VG6 VectorPath加速卡產品介紹
文章出處:【微信號:Achronix,微信公眾號:Achronix】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
基于Xilinx XCKU115的半高PCIe x8 硬件加速卡解決方案
基于Xilinx XCKU115的半高PCIe x8硬件加速卡
求一種基于Xilinx XCKU115的半高PCIe x8 硬件加速卡
MLU220-M.2邊緣端智能加速卡支持相關資料介紹
LCD轉VGA/AV/S-Video視頻加速卡
LCD轉VGA視頻加速卡
Achronix聯合Molex推出VectorPath S7T-VG6加速卡
Achronix與BittWare共同研發FPGA芯片VectorPath加速卡
數據中心加速器也許會是FPGA最高的細分市場
BittWare和Achronix合作推出采用7納米的Speedster7t FPGA
Achronix聯合BittWare推出了VectorPath S7t-VG6 PCIe加速卡
AMD剛剛發布7nm CDNA架構的MI100加速卡

FPGA PCIe加速卡開源硬件及例程介紹
采用CEM插卡模式的VectorPath?加速卡在業內率先通過PCIe Gen5 x16 32 GT/s認證

評論