人工智能 (AI) 正在改變消費電子設備,并且革新生產力、創造力和娛樂體驗,這將帶來更高程度的自動化、沉浸感和個性化,為開發者和最終用戶提供海量機會。隨著推動移動端系統級芯片 (SoC) 的設備端生成式 AI 的發展,AI 技術正持續演進。
依托于Arm 全面計算解決方案的成功,我們宣布推出面向消費電子設備的全新計算子系統,即 Arm 終端計算子系統 (CSS)。作為 AI 體驗的計算基礎,它能在最廣泛類別的消費電子設備中,實現性能、效率和可擴展性的跨越式提升。
Arm 終端 CSS 囊括最新的 Armv9.2 Cortex CPU 集群和 Arm Immortalis 與 Arm Mali GPU、CoreLink 互連系統 IP,以及知名代工廠采用三納米工藝生產就緒的 CPU 和 GPU 物理實現。該平臺為我們的合作伙伴提供了生產芯片的最快途徑。通過物理實現,Arm 的合作伙伴能夠利用前沿三納米工藝的各種優勢,同時實現高度靈活、可定制的芯片設計。
深入了解 Arm 終端 CSS
Arm 終端 CSS 采用最新 Armv9.2 CPU 集群,其中集成了 Arm 目前最高性能的 Arm Cortex-X925 CPU、最高效的 Cortex-A725 CPU 和更新后的 Cortex-A520 CPU。這為 AI 和其他實際用例計算工作負載提供出色的性能和效率。
圖:Arm 終端 CSS 涵蓋哪些要素?
最新的 CoreLink 互連實現了 Arm 終端 CSS 的系統集成和擴展。集成的系統級緩存 (SLC) 通過減少 DRAM 帶寬和訪問來實現更出色的系統能效。系統內存管理單元 (SMMU) 通過第二階段轉換加強安全性,以便支持如安卓虛擬化框架 (AVF) 等虛擬化安全框架。
憑借基于第五代 GPU 架構、面向旗艦智能手機所設計的 Arm Immortalis-G925,Arm 終端 CSS 實現了驚人的圖形和主機級別的游戲性能。通過增強的性能和能效,用戶可以在移動設備上享受更長時間、更沉浸式的游戲體驗。
Arm 終端 CSS 將成為第一代采用三納米工藝節點的安卓 SoC 的一部分,從而在芯片中實現出色的功耗、性能和面積 (PPA)。作為終端 CSS 的一部分,Arm 的物理實現能夠全面釋放三納米工藝技術的潛力,為高端平臺充分發揮 PPA 優勢,并為我們的合作伙伴打造芯片創建最快途徑。
我們攜手領先的代工廠合作伙伴,協同設計并交付 CPU 和 GPU 物理實現,其中包括流片就緒的 Cortex-X925 CPU 以及 Immortalis-G925 三納米工藝的物理實現。這將有助于我們的合作伙伴在三納米工藝上取得 PPA 優勢,同時通過生產就緒的芯片解決方案來縮短芯片的開發與部署時間。此外,我們的合作伙伴能夠靈活地使用 Arm 終端 CSS 來構建特定市場、具差異化特色的 CPU 集群和 GPU。
突破計算和 AI 性能的極限
終端 CSS 是 Arm 目前面向安卓系統速度最快的平臺,與 2023 Arm 全面計算解決方案 (TCS23) 平臺相比,在關鍵基準和一般計算用例方面取得了顯著改進。其中包括:
通過 Geekbench 6 單核分數測量可知,得益于新的 Cortex-X925,峰值性能提高 36%;
在前十大應用中,五款應用的平均啟動時間加快了 33%,不僅提高了生產力,也帶來了流暢的移動體驗;
通過 Speedometer 2.1 瀏覽器基準測量時,網頁瀏覽速度加快了 60%;
在包括光線追蹤和可變速率著色 (VRS) 基準等七項圖形基準中,峰值圖形性能平均提高 30%。
圖:Arm 終端 CSS 的部分性能優勢
Arm 終端 CSS 平臺提供由 AI 驅動的消費電子設備體驗。今年早些時候,我們展示了大語言模型 (LLM) 如何在移動設備上的 Arm CPU 進行本地運行。借助終端 CSS,LLM 將得以在 Arm CPU 上更好地運行,帶來更快的響應速度。當運行 Llama 3 LLM 和 Phi-3 LLM 時,該平臺可將詞元 (Token) 首次響應時間分別縮短 42% 以及 46%。
圖:通過 Arm 終端 CSS 在 Arm CPU 上運行 LLM
此外,得益于新 Arm CPU 和 GPU 所取得的技術進展,在廣泛的通用 AI 網絡上,Arm 終端 CSS 的 AI 推理性能獲得了顯著的提升。例如,采用 Cortex-X925 時,推理速度加快 59%;采用 Immortalis-G925 時,AI 推理速度加快 36%。此外,通過在終端 CSS 的 CPU 集群配置中利用一顆額外的 Cortex-X925 CPU,我們觀察到在 17 個主流網絡中,針對 int8 和 fp16 數據類型的 AI 推理性能提高了驚人的 2.7 倍。這些在 AI 推理方面的改進可在一系列 AI 用例中實現無縫順暢的用戶體驗。
圖:Arm 終端 CSS 提升 AI 推理
Arm 終端 CSS 在計算攝影和 AI 攝像頭等 AI 用例中的表現尤為優異。要想拍攝出美輪美奐且具有逼真焦外成像效果(讓背景模糊并聚焦所選主體)的照片和視頻,這并非易事。AI 攝像頭的焦外成像管線由深度估計、分割、摳圖和混合等多個階段組成,可生成高質量的影像結果。與 TCS23 相比,通過 CPU 上針對焦外成像工作負載的 AI 處理,終端 CSS 的焦外成像性能提升了 24%。這意味著用戶可以在不影響電池續航時間的前提下,在照片和視頻上獲得更快、更順暢的焦外成像效果。
圖:通過 Arm 終端 CSS 提升 AI 攝像頭性能
此外,通過軟件和工具的結合,Arm 終端 CSS 的性能與功耗得以獲得進一步優化。Arm 新推出的 Kleidi 包含了經高度優化的機器學習 (ML) 軟件內核集合 KleidiAI,能讓開發者在通過高度優化的生成式 AI 框架運行 AI 工作負載時,全面釋放 Arm CPU 的潛力。這意味著開發者能夠面向各類設備,基于盡可能高的性能,快速構建 AI 應用。
為了獲得更具沉浸感和更長時間的游戲體驗,Arm 終端 CSS 實現了兩位數的性能和能效提升,其中包括在一系列熱門的手游中,平均以每秒 120 幀的速度運行時,在相同功耗下可帶來 37% 的平均性能提升,同時 GPU 功耗降低 30%。
可擴展的性能覆蓋各類消費電子設備市場
Arm 致力于讓每個人都能享有 AI,并通過可應用在各類和各種不同外觀設計的消費電子設備的終端 CSS,不斷提升性能和效率。
Arm 終端 CSS 可擴展應用至市面上最高性能的消費電子設備,包括新一代 AI PC。其中的 Cortex-X925 與 Cortex-X4 CPU 相比,其 TOPS 提高 50%。終端 CSS 為 PC 市場提供專用的可擴展平臺。該平臺采用 Cortex-X925 以提供一流的單線程性能,并通過近期更新的 DSU-120(在單個 CPU 集群內提供多達 14 個 CPU 核心)提供最佳的性能可擴展性。除了 SVE2,更多的 Armv9 架構的功能,包括已在移動端生態系統驗證的安全性技術,如指針驗證 (PAC)、分支目標識別 (BTI)和內存標記擴展 (MTE) 等,也將引入 PC 市場。
通過終端 CSS,Arm 可為消費電子設備市場的各類性能和成本需求提供可獲取的 AI 技術。Cortex-A725 是實現高能效 AI 吞吐量的主要處理器,在對成本更敏感的大眾消費電子技術市場領域,它是 AI 處理的主力和主要開發者目標。例如,我們曾在一個虛擬助手演示中,展示了在搭載三核 Cortex-A700 系列 CPU 核心的現有安卓智能手機上,運行 Llama2-7B 和 Phi-3-mini (Phi-3 3.8B) LLM 的性能。與此同時,面積經優化的 Cortex-A725 可在廣泛的消費電子技術領域中,以高面積效率實現生成式 AI 工作負載的部署。
消費電子技術的 AI 根基
Arm 終端 CSS 是為各類消費電子設備打造新一代 AI 體驗的專用平臺。終端 CSS 是 Arm 針對安卓系統速度最快的計算平臺,這將使得用戶能夠在其移動設備上獲得前所未有的安卓體驗。該平臺的 PPA 優勢通過物理實現得以達成,助力我們的芯片合作伙伴縮短產品上市時間并順暢部署。終端 CSS 的可擴展性能有助于在各種類型、不同外觀設計的設備的所有成本點上釋放 AI 性能,使得人人都能享有 AI。
Arm 終端 CSS 使得我們的生態系統能夠實現更多突破,無論是釋放更多性能、實現更多 AI 功能和應用體驗,還是打造更先進的芯片,Arm 平臺是這一切的基礎。憑借終端 CSS,Arm 為當前和未來的 AI 體驗構建消費電子計算的未來。
-
攝像頭
+關注
關注
61文章
4952瀏覽量
97697 -
SoC芯片
+關注
關注
1文章
636瀏覽量
35667 -
人工智能
+關注
關注
1804文章
48737瀏覽量
246664 -
機器學習
+關注
關注
66文章
8492瀏覽量
134122
原文標題:Arm 終端 CSS 為 AI 用戶體驗提供計算平臺
文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
Arm 與微軟合作,為基于 Arm 架構的 PC 和移動設備應用提供超強 AI 體驗

Arm 公司面向 PC 市場的 ?Arm Niva? 深度解讀
Arm 公司面向移動端市場的 ?Arm Lumex? 深度解讀
Banana Pi 發布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發
玄武智算云平臺為智能計算保駕護航

Arm平臺引領AI云計算革新
詳解Arm計算平臺的優勢
Arm以CSS計算平臺+ KleidiAI +生態合作,宣告智能終端AI全面到來

烏鎮亮點 Arm終端計算子系統 (CSS) 榮膺世界互聯網大會領先科技獎

評論