突破傳統基礎設施
從云到邊緣,Arm Neoverse 正憑借出色的性能、效率、設計靈活性和總體擁有成本 (TCO) 優勢,革新傳統基礎設施芯片領域。
云和超大規模服務運營商正不斷增大計算密度。隨著 Microsoft Cobalt、阿里巴巴的倚天 710、AmpereOne等配置 128 核或以上的 CPU 設計進入市場,單個封裝可實現的性能更強,且下一代的目標還將遠高于 128 核。
隨著 CPU 性能逐步提高,市場對人工智能 (AI)、網絡和加密加速器等專用計算的需求也隨之持續增長。這顯然需要將這些加速器集成在一起,才能更有效地提高性能和效率,與此同時,還需實現模塊化設計,以便將加速器與不同的通用計算引擎進行混合搭配。
基于 Neoverse N3 CPU 的Neoverse CSS N3
圖 1:Neoverse CSS N3 概覽
Arm Neoverse 計算子系統 (CSS) 支持在新的工藝節點上快速開發先進的系統級芯片 (SoC)。通過在設計中使用預配置、預驗證的 CSS,合作伙伴節省了 80 人/年的工程師時間,以及相應的機會成本,使其能夠專注于實現助其系統增值的“秘密法寶”。
Neoverse CSS N3 構建在 Neoverse CSS N2 經過市場驗證的優良表現之上,能通過新的架構功能提供更高的性能和效率,為數據中心市場帶來更優越的單芯片性能和單 TCO 性能表現。此外,Neoverse CSS N3 還為邊緣和網絡應用帶來了出色的效率。CSS N3 以 Neoverse S3 系統 IP 為基礎,Neoverse S3 系統 IP 包括了一致性網狀網絡 CMN S3、系統內存管理單元 MMU S3 和片上網絡 NOC S3。此外,CSS N3 還包含系統管理和本地控制處理器,以及 CPU 和系統 IP 協同設計與共同開發,以優化 PPA 和系統級功能的支持。
Neoverse CSS N3 支持 32 顆 Neoverse N3 核心,可在低至 40W 的功率范圍內實現優異性能。該產品具備高度可配置性,適用于電信、數據處理單元 (DPU) 、網絡和云等多個領域,可以在 8 核至 32 核之間進行擴展配置。
除了性能和效率的大幅提升之外,Neoverse CSS N3 還支持基于芯粒的設計。它支持 UCIe 晶粒間 (die-to-die) 連接標準,結合 Arm 新的 AMBA CHI C2C 協議,為構建異構加速計算奠定了基礎。可以預見的是,Arm Neoverse CSS N3 將在當今專用計算領域蓬勃發展。
基于 CSS N3 的芯粒可通過 AMBA CHI C2C 連接到 I/O 一致性加速器,從而將加速器封裝在一起,進一步提高性能和效率,這一方法可用來取代傳統的解決方案。在過往的解決方案中,其加速器是通過 PCIe 進行板級連接,這會導致更高的延遲、軟件復雜性和功耗。
Neoverse N3 CPU優異的效率表現
以每瓦性能來衡量的性能效率是 CPU 評估的一大關鍵指標。5G/6G 無線基礎設施要求現代計算解決方案表現出更高的性能,同時功耗預算須保持不變。新一代的 DPU 需要配備功能更強大的 CPU,以便在 PCIe 設備規范的限制內運行成熟的操作系統、虛擬機、容器及其他數據包處理功能。頭部云服務提供商正著手在機架的冷卻能力范圍內,部署核心數量更多、更密集的 CPU。“能效”幾乎是所有細分市場的主要設計決策要素。Neoverse N3 便是以能效作為其設計核心。
Neoverse N3 CPU 延續了 Neoverse N2 經過市場驗證的效率表現。經過 Arm CPU 設計團隊的不懈努力,他們強化了分支預測器、預取器的性能,并優化了微架構,進而實現了效率的提升。此外,他們還改進了電源管理表現,增加了精度更高的每核動態電壓頻率調整 (DVFS) 功能,以實現更出色的性能效率。這些工作成果使得 N3 在效率表現上比上一代產品提高了 20% 以上。
Neoverse N3 可以滿足多樣的 SoC 設計要求,包括 16 核網絡設計、32 核電信 RAN 或云 DPU 設計,以及 192 核超大規模和云 CPU 等等。Neoverse N3 還提供了多種電壓和頻率選擇,與 Neoverse N2 相比,其每核性能效率提高了 20% 至近 50%。
圖 1:Arm Neoverse N3 CPU
延續卓越效率表現
在面積和功耗配置與 Neoverse N2 大致相同,且采用一樣的工藝節點下,Neoverse N3 在機器學習 (ML) 和數據分析工作負載方面的性能約提升了三倍,在 SQL 數據庫、選定壓縮應用程序,以及整數運算性能等方面分別約提升了 1.3 倍、1.2 倍,以及 1.1 倍的性能。
靈活的緩存配置
Neoverse N3 提供多種緩存配置,可滿足不同計算場景的需求。許多橫向擴展的云數據分析和數據庫應用均能從更靠近核心的較大緩存中受益,因此我們為這一細分領域推出了 2MB L2 緩存選項。此外,1MB L2 緩存選項主要針對 5G/6G 無線基礎設施、企業網絡、DPU 和智能網卡 (SmartNIC) 以及超大規模服務器等各種任務中的通用計算,能夠實現性能和面積的良好平衡;而較小的 32KB L1 和 128KB 則適合那些對緩存不敏感,但仍希望能以較小占用空間提供良好算力的工作負載。
總結
Neoverse N3 CPU 的推出實現了 Neoverse N 系列持續提供出色的每瓦性能的目標。新的 CSS N3 結合了 Neoverse N3 優異的性能和效率與 Neoverse S3 系統 IP,成為一套定制性更強的計算子系統。與上一代的 CSS 相比,Neoverse CSS N3的每瓦性能可提高 20% 至近 50%。CSS N3 平臺適用于云到邊緣設計,可幫助我們的合作伙伴將 Arm 強大的處理器與加密、網絡或 AI 加速器等等多種專用組件結合在一起,打造更具差異性的新產品。
我們的合作伙伴將有望在 2024 年底推出基于 Neoverse N3 和 CSS N3 的創新芯片設計,讓我們共同翹首以待。
審核編輯:劉清
-
ARM
+關注
關注
134文章
9306瀏覽量
374989 -
加速器
+關注
關注
2文章
823瀏覽量
38913 -
SoC芯片
+關注
關注
1文章
636瀏覽量
35653 -
人工智能
+關注
關注
1804文章
48701瀏覽量
246448
原文標題:Arm Neoverse CSS N3 助力快速實現出色能效
文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
Arm 公司面向移動端市場的 ?Arm Lumex? 深度解讀
解讀基于Arm Neoverse V2平臺的Google Axion處理器
Arm Neoverse CMN S3 推動Compute Express Link (CXL) 存儲創新

如何在基于Arm Neoverse平臺的CPU上構建分布式Kubernetes集群

基于MediaTek MT9679芯片的堅果投影N3 Pro介紹
Arm Neoverse如何加速實現AI數據中心
烏鎮亮點 Arm終端計算子系統 (CSS) 榮膺世界互聯網大會領先科技獎

評論