CFMS | MemoryS 2025 于上周在深圳盛大召開,活動現場匯聚了包括 Arm 在內的全球存儲產業鏈的諸多領先企業。
在大會上,Arm 物聯網事業部業務拓展副總裁馬健通過主題演講與在場的行業參與者分享了,Arm 強調以開放生態為核心,通過計算平臺創新與標準化協作,賦能從云端到邊緣的智能化轉型,推動人工智能 (AI) 與存儲技術的深度融合。讓我們一起跟隨本文,深入了解本次演講的精彩內容!
釋放 AI 潛能,Arm 計算平臺構建計算與存儲的未來
當下,我們正處在激動人心的人工智能 (AI) 技術變革初期階段。隨著自然語言、多模態大模型以及生成式 AI 技術的加速演進,AI 正以前所未有的速度重塑各行各業。根據 IDC 的預測,全球數據量將從 2024 年的 159.2ZB 增長到 2028 年的超過 384.6ZB,年復合增長率達 24.4%。其中,到 2028 年,預計 37% 的數據將會在云端直接產生,而其余數據會從邊緣端和終端直接產生。
面對邊緣數據的激增,高效的數據處理、低延遲傳輸以及智能、安全的存儲正成為行業關注的重點。未來的計算架構不僅要提供更強的算力,還必須更緊密地與存儲系統結合,以確保 AI 模型能夠高效運行,同時優化數據管理和訪問方式。
從目前的 AI 技術發展方向來看,一方面,大模型正向通用人工智能 (AGI) 演進,探索多模態、物理 AI 等新方向,并持續挑戰算力的新極限。另一方面,為推進大模型全面部署的進程,行業開始邁向深度優化和垂直領域定制化,使大模型能走入千行百業,適應移動端、邊緣計算、云端部署等不同場景。
DeepSeek 的推出對全球 AI 市場產生了深遠影響:作為一種開放的創新技術,它不僅展示了 AI 在訓練與推理過程中的優化潛力,還極大提高了大規模部署的效率,充分證明了模型能夠在更低成本、更高效能的環境中穩定運行。這一成就對于推動 AI 在企業級應用和邊緣計算領域的大規模應用具有重要意義。
Arm 計算平臺:持續促進從云到端的 AI 優化部署
在 AI 發展的初期階段,數據中心作為模型訓練和初期推理的核心場所,正面臨著前所未有的挑戰。傳統的標準通用芯片在處理計算密集型的 AI 工作負載時顯得力不從心,無法滿足 AI 時代對于高性能、低功耗以及靈活擴展性的迫切需求。在此背景下,Arm 計算平臺憑借其先進的技術優勢,為新一代 AI 云基礎設施的發展開辟了新的范式。從 Arm Neoverse 計算子系統 (CSS)、Arm Total Design 生態項目到芯粒系統架構 (CSA),Arm 進行了從技術到生態的整體化布局,不僅為 AI 數據中心的工作負載提供了高效、靈活且可擴展的解決方案,還幫助合作伙伴專注于產品差異化,為產品上市進程提速。
AI 推理是 AI 釋放價值的關鍵,它正迅速從云端拓展至邊緣端,覆蓋世界的每一個角落。在邊緣 AI 領域,Arm 憑借其技術與生態的獨特優勢,不斷創新,確保智能物聯網與消費電子生態系統能在恰當的時機、于最適合的地點執行最優工作負載。
為了滿足邊緣 AI 日益攀升的 AI 工作負載需求,Arm 近期發布了以全新 Armv9 超高能效 Cortex-A320 CPU 以及對 Transformer 網絡具有原生支持的 Ethos-U85 AI 加速器為核心的邊緣 AI 計算平臺。該平臺實現了 CPU 與 AI 加速器的深度集成。相比去年以 Cortex-M85 搭配 Ethos-U85 的平臺提升了八倍的機器學習 (ML) 計算性能,帶來了顯著的 AI 計算能力突破,可賦能邊緣 AI 設備輕松運行超過 10 億參數的大模型。
其中,全新發布的超高能效 Cortex-A320 不僅可以為 Ethos-U85 提供更高的內存容量與帶寬,讓大模型在 Ethos-U85 上的執行如虎添翼,還支持更大的可尋址內存空間,并能夠更靈活地管理多層次內存訪問延遲。Cortex-A320 與 Ethos-U85 的組合,是運行大模型及應對邊緣 AI 任務所帶來的內存容量及帶寬挑戰的理想選擇。
此外,Cortex-A320 還充分利用了 Armv9 增強的 AI 計算特性以及包括 Secure EL2、指針驗證/分支目標識別 (PACBTI) 以及內存標記擴展 (MTE) 等在內的安全特性。此前,這些特性已經在其他市場得到廣泛應用,而 Arm 現在將其引入了物聯網與邊緣 AI 計算領域,在提供出色且靈活 AI 性能的同時,實現對軟件負載更好的隔離與軟件內存異常的防護,提高整體系統安全性。
AI 時代的存儲發展:存儲、計算和安全能力的全面升級
隨著 AI 計算需求的持續增長,云邊端在對計算能力提出更高要求的同時,也對存儲系統的性能、密度、實時性和功耗等方面提出了更嚴苛的要求。在傳統模式下,計算架構往往將存儲和計算相對分離,存儲設備僅僅承擔數據存放的角色,數據需要在存儲與計算節點之間頻繁搬移,導致“存儲-計算”之間的瓶頸。然而在 AI 時代,為滿足數據實時分析、智能管理及高效訪問等需求,將存儲置于離計算單元更近的地方,或讓存儲本身具備計算能力,變得尤為關鍵。這樣能夠確保 AI 任務在最合適的位置得到高效執行。
從云到端的 AI 計算,對存儲吞吐量、延遲、能耗、安全以及諸如 Open Channel 等提升主機可管理性 (host manageability) 的需求都不盡相同。存儲控制器以及運行在存儲控制器中 Arm CPU 上的固件在支持差異化 AI 存儲需求中起到了極其重要的作用。
事實上,作為數據存儲與網絡控制的基石,Arm 一直在為全球存儲控制器和設備提供高性能、低功耗、安全可靠的解決方案,其中包括:
Arm Cortex-R 系列實時處理器擁有最快的中斷延時和實時反應速度,被廣泛應用于諸多存儲設備;
Arm Cortex-M 系列嵌入式處理器是后端閃存和媒體控制的熱門選擇,并支持自定義指令,客戶可以針對獨特 NAND 介質的深度優化來創造差異;
Arm Cortex-A 系列應用處理器以高吞吐量流水線設計、支持最高處理性能,同時擁有 ML、數據處理軟件和豐富操作系統的堅實生態支持;
Arm Ethos-U AI 加速器支持每秒 2,048 MACs 的 Transformer 原生加速,可以助力存儲控制器本身變得更智能;
此外,還有為數據中心量身定制的 Neoverse。我們已開始看到 CXL (Compute Express Link) 方面的創新設計采用 Arm Coherent Mesh Network (CMN) 與 Neoverse 組合實現可“組成式”內存擴展,并融入近存儲計算的理念,減少數據搬運。
生態攜手,構建 AI 計算與存儲未來
在專注提供領先的技術和產品的同時,Arm 還致力于和生態系統合作伙伴攜手共進,共同推動存儲產業的發展。基于 Arm 架構的平臺正被行業領先的存儲企業廣泛采用,以優化其存儲解決方案。例如,Solidigm 公司最新發布的 122TB PCIe SSD Solidigm D5-P5336 顯著提升了 AI 數據中心的能效、存儲密度和性能,其存儲控制器采用 Arm Cortex-R CPU,有效提升了讀寫的實時性和延時確定性;慧榮科技 (Silicon Motion) 面向 AI PC 的 SM2508 主控芯片采用了 Arm Cortex-R8 與 Cortex-M0,在能效和數據吞吐上實現了突破,其 SM2264XT-AT 是業界首款車用 PCIe Gen4 主控芯片,通過增強的虛擬化來支持混合關鍵性工作負載對數據的訪問,并可節省 30% 的能耗;江波龍基于 Arm Cortex-R CPU 打造的 XP2300、ORCA 4836 以及 UNCIA 3836 固態硬盤,憑借其大容量與高性能的優勢,廣泛應用于 AI PC、服務器、云計算、分布式存儲及邊緣計算等多個應用場景,滿足 AI 技術的本地化部署需求。
此外,在本土存儲市場,大普微、聯蕓科技、憶芯科技、特納飛、得一微電子、英韌科技等領先的存儲企業,也都廣泛采用 Arm 技術打造 SSD 主控芯片與設備方案。
迄今為止,基于 Arm 架構和平臺所應用的存儲設備已近 200 億臺,其中包括云和企業級 SSD、車載 SSD、消費級 SSD、硬盤驅動器和嵌入式閃存設備。目前,由 Arm 技術賦能的存儲設備持續保持在每日大約 300 萬臺的出貨量。
憑借前沿的技術實力、豐富的生態布局、深厚的存儲行業積累,Arm 正繼續引領技術創新,賦能 AI 時代的計算與存儲發展。Arm 也將繼續與合作伙伴攜手,通過安全、高效的 Arm 計算平臺,構建 AI 時代計算與存儲的新未來。
-
ARM
+關注
關注
134文章
9305瀏覽量
374958 -
物聯網
+關注
關注
2927文章
45856瀏覽量
387875 -
AI
+關注
關注
87文章
34173瀏覽量
275333 -
計算平臺
+關注
關注
0文章
72瀏覽量
9790
原文標題:釋放 AI 潛能,Arm 計算平臺構建計算與存儲的未來
文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
評論