機器學習和大數據應用正在徹底改變處理數據的方式。整個行業需要找到在保持低功耗的同時,提高計算性能的途徑。對于當前的許多計算任務,連接處理器的專用硬件加速器完成該任務的速度和功耗都要比獨立工作的處理器出色。
PCI Express是當前在處理器和片外加速器之間移動數據最常用的協議。但在 15 年前推出 PCI Express 時,現在的片外加速應用還沒有出現,因此 PCI Express 并未針對大量這些計算工作負載進行優化。而對優化工業標準互聯的需求已日益凸顯。要想取得成功,新標準必須為非專有的,必須針對當前的加速器工作負載進行優化,必須盡量利用現有技術降低成本,加速產品上市進程。
考慮一下 CCIX 吧
CCIX (緩存一致互聯協議)是基于現有的 PCI Express 物理層及鏈路層的協議,可幫助各公司充分利用其在 PCI Express 上的現有投資。同時,CCIX 還可通過未來 PCI Express 鏈路速度及數據鏈路層更新獲得巨大優勢。此外,CCIX 還通過在 PHY 和 CCIX 上添加可選 20 和 25 GT/S 速度擴展了現有 PCIe 的速度,并針對當前加速工作負載優化了數據鏈路層和事務處理層。
CCIX 可通過不同的方式簡化和加速數據移動。第一種方式是使用高速緩存一致性來自動保持處理器和加速器存儲器的高速緩存一致性,從而實現易用性并降低時延。由于數據是通過CCIX 協議自動同步的,因此只需將數據指針傳遞至加速器,而無需依靠復雜的直接存儲器訪問 (DMA) 驅動程序移動數據。CCIX請求代理將首先訪問高速緩存,以查看所需數據是否可用,如果不可用,它就會自動從 CPU高速緩存或系統內存中獲取數據。
CCIX協議能夠減輕軟件開發者的負擔,使他們可以專注于自己的應用,而不是加速器和主處理器之間移動數據的底層機制。
CCIX可以提供幫助的第二種方式是啟用存儲器擴展。位于主CPU 旁邊的 DIMM 插槽需求量大嗎?但某些依靠新服務器類內存的應用,如持久性內存?即使在斷電時,內存也不會丟失數據。CCIX允許 CPU 上的本地代理管理遠程設備上的從屬代理,從屬代理可以控制存儲類內存,然后再接入 CPU 的標準 NUMA 內存映射,從而實現這個解決方案。這導致存儲類內存看起來就像常規系統內存,但具有啟用任何唯一內存的屬性。
最后,CCIX允許本地代理駐留在加速器上。該本地代理可管理直接連接到加速器上的存儲器。通過這種方式,如果發生高速緩存丟失,駐留在加速器上的請求代理會將時延損失降到最低,但數據直接連接到加速器進行存儲。
Xilinx CCIX 方案展示
賽靈思目前正在尋找有興趣使用 CCIX的客戶。現在,我們與從事 CCIX 工作的少數合作伙伴正進行合作。CCIX支持 Virtex UltraScale+ HBM 器件以及 Alveo U280 和 U50 電路板。如果您有興趣了解更多關于賽靈思 CCIX 產品的信息,請聯系您的賽靈思銷售代表。
CCIX 聯盟成員由各大行業技術龍頭企業代表組成,旨在協同制定統一的互聯技術規范,以確保采用不同指令集架構 (ISA) 的處理器能與加速器一致共享數據,并實現高效的異構計算,從而大幅提高運行數據中心工作負載和嵌入式應用 (如 5G 無線和移動邊緣計算) 的服務器的計算效率。
-
PCIe
+關注
關注
16文章
1328瀏覽量
84738 -
機器學習
+關注
關注
66文章
8493瀏覽量
134161 -
大數據
+關注
關注
64文章
8952瀏覽量
139569
發布評論請先 登錄
基于PCIe(XDMA/QDMA)的多路視頻采集與顯示IP 多路高速AD采集與DA回放IP
【高清視頻案例分享】CameraLink接口的PCIe采集卡 ,基于FPGA開發平臺
RZ T2H PCIe裸機程序開發和Linux下的配置介紹

評論