ARM Mali GPU 深度解讀
ARM Mali 是 Arm 公司面向移動設備、嵌入式系統(tǒng)和基礎設施市場設計的圖形處理器(GPU)IP 核,憑借其異構(gòu)計算架構(gòu)、能效優(yōu)化和生態(tài)協(xié)同,成為全球移動設備 GPU 市場的核心力量。以下從技術演進、架構(gòu)特性、產(chǎn)品布局及生態(tài)戰(zhàn)略等維度展開分析:
一、架構(gòu)演進:從 Utgard 到 Valhall
Mali GPU 的架構(gòu)迭代以 ?北歐神話元素命名,技術特性與性能提升同步推進:
?Utgard 架構(gòu)(2007-2012)??:
- 代表型號:Mali-200、Mali-400 MP
- 特性:基于 ?分離式頂點與片段著色器,僅支持 OpenGL ES 2.0 及以下標準,適用于早期智能手機和嵌入式設備。例如 Mali-400 MP 支持 4 核擴展,像素填充率達 275M/秒(65nm 工藝)。
- 局限:能效比低,多核擴展能力有限,無法滿足復雜 3D 渲染需求。
?Midgard 架構(gòu)(2013-2018)??:
- 代表型號:Mali-T760、Mali-T880
-
突破:
- ?統(tǒng)一著色器架構(gòu)?:支持 OpenGL ES 3.0/3.1 和 OpenCL 1.2,實現(xiàn) GPU 通用計算(GPGPU)。
- ?多核擴展?:單芯片最高支持 16 核(如 Mali-T760MP16),三角形輸出率提升至 30M/秒,并首次引入 ?DirectX 11 支持?(如 Mali-T760)。
- 應用:三星 Exynos 8890(T880)、聯(lián)發(fā)科 Helio P10(T860)等中高端芯片。
?Bifrost 架構(gòu)(2016-2020)??:
- 代表型號:Mali-G71、G72、G76
-
創(chuàng)新:
- ?標量執(zhí)行單元?:將向量拆解為標量處理,提升 16/8bit 低精度計算效率,支持 ?AI 推理加速?(如 int8 dot 指令優(yōu)化神經(jīng)網(wǎng)絡)。
- ?動態(tài)電源管理?:能效較 Midgard 提升 30%,如 Mali-G76 在三星 Exynos 9820 中實現(xiàn) 1.4 倍性能提升。
?Valhall 架構(gòu)(2019-至今)??:
- 代表型號:Mali-G77、G78、G710
- 技術飛躍:
- 旗艦應用:華為麒麟 960(G71)、聯(lián)發(fā)科天璣 2000(G710)。
二、核心特性:性能與能效的平衡
Mali GPU 的技術優(yōu)勢體現(xiàn)在 ?異構(gòu)計算? 與 ?標準化支持?:
?圖形渲染能力?:
- ?Tile-Based Rendering?:分塊渲染減少內(nèi)存帶寬消耗,支持 8K 實時渲染與光線追蹤(如 Mali-G710 集成 ASR 超分技術)。
- ?API 兼容性?:覆蓋 OpenGL ES 3.2、Vulkan 1.3、OpenCL 2.0 及 DirectX 12,適配多平臺開發(fā)需求。
?AI 與通用計算?:
- ?NPU 協(xié)同?:Ethos-U NPU 與 GPU 共享內(nèi)存,支持 Transformer 等大模型推理(如 Mali-G710 提供 8 TOPS 算力)。
- ?低精度優(yōu)化?:BF16/INT8 量化加速,單位功耗下 MLPerf 性能提升 8 倍。
?能效創(chuàng)新?:
- ?動態(tài)調(diào)頻(DVFS)??:每核獨立電源管理,功耗較 x86 GPU 降低 40%(如 Mali-G710 無風扇設計覆蓋 80% 輕薄本市場)。
- ?Chiplet 封裝?:基于 Arm CSA 標準支持多晶粒互連,提升擴展靈活性(如 Socionext 2nm 工藝芯粒方案)。
三、產(chǎn)品線布局:全場景覆蓋
Mali GPU 按性能劃分為四大系列,適配不同市場需求:
?高端旗艦(V/Valhall 系列)??:
- Mali-G710:16 核設計,支持 4K 120Hz 顯示與 AI 超分,應用于旗艦手機(如三星 Galaxy S25)和 AI PC。
- Mali-G78:24 核配置,3DMark Wild Life 跑分超 8500 分,媲美蘋果 M1 GPU。
?中端主流(Bifrost 系列)??:
- Mali-G57:8 核設計,主打千元機市場(如 Redmi Note 系列),支持 Vulkan 1.1 和 OpenCL 1.2。
- Mali-G68:6 核精簡版,適配平板和車載娛樂系統(tǒng)。
?入門級(Midgard 系列)??:
- Mali-T720:單核架構(gòu),用于智能電視和低端物聯(lián)網(wǎng)設備(如小米電視 6A)。
?定制化方案?:
- ?Mali Nano?:針對教育終端和工控設備推出子平臺,支持 300 美元以下設備本地化 AI 功能。
四、生態(tài)戰(zhàn)略:軟硬協(xié)同與開發(fā)者支持
ARM 通過 ?工具鏈優(yōu)化? 和 ?生態(tài)聯(lián)盟? 鞏固市場地位:
?開發(fā)工具鏈?:
- ?KleidiAI?:集成 TensorFlow Lite、PyTorch,模型部署時間縮短 50%(如阿里倚天 710 部署 Llama3 效率提升 1.9 倍)。
- ?Mali 調(diào)試套件?:支持 OpenGL ES 仿真器和 Vulkan 性能分析,覆蓋 2200 萬開發(fā)者。
?合作伙伴網(wǎng)絡?:
- ?芯片廠商?:聯(lián)發(fā)科(天璣系列)、三星(Exynos)、華為(麒麟)均采用 Mali 公版架構(gòu)。
- ?云服務商?:騰訊云、AWS 推出基于 Mali 的 GPU 實例(如 Graviton3 推理能效提升 60%)。
?標準化認證?:
五、挑戰(zhàn)與未來方向
盡管 Mali 占據(jù)安卓 GPU 市場 30% 份額,但仍面臨競爭與技術挑戰(zhàn):
?市場壓力?:
- ?x86 生態(tài)壁壘?:PC 領域 AMD/Intel 加速布局混合架構(gòu),2025 年 Arm PC 份額僅 13%。
- ?競品追趕?:高通 Adreno 740 光追性能反超,蘋果 M2 GPU 能效優(yōu)勢顯著。
?技術突破方向?:
- ?光線追蹤普及?:Valhall 架構(gòu)需進一步優(yōu)化實時光追效率,追趕 NVIDIA DLSS 3.0。
- ?端云協(xié)同計算?:通過 CoreLink CI-700 互連技術實現(xiàn)“端-邊-云”一體化(如騰訊云 Mali 邊緣節(jié)點)。
?長期愿景?:
- ARM 目標 2030 年賦能 ?50 億臺智能設備,成為 AIoT 與 6G 網(wǎng)絡的算力底座。
總結(jié)
ARM Mali 通過持續(xù)架構(gòu)迭代(Utgard → Valhall)和生態(tài)整合,已成為移動 GPU 領域的核心力量。其技術特性與 ?異構(gòu)計算、能效優(yōu)化? 的深度結(jié)合,使其在智能手機、AI PC 及邊緣計算場景中展現(xiàn)出強大競爭力。未來,隨著 Chiplet 技術和光線追蹤的進一步成熟,Mali 或?qū)⒃诟咝阅苡嬎闶袌鲩_辟新戰(zhàn)場,推動“端側(cè)智能普惠化”進程。
-
ARM
+關注
關注
134文章
9304瀏覽量
374808 -
gpu
+關注
關注
28文章
4908瀏覽量
130618
發(fā)布評論請先 登錄
GPU架構(gòu)深度解析

Arm 公司面向 PC 市場的 ?Arm Niva? 深度解讀
Arm 公司面向移動端市場的 ?Arm Lumex? 深度解讀
Arm 公司面向汽車市場的 ?Arm Zena? 深度解讀
瑞芯微米爾RK3562國產(chǎn)核心板,ARM中量級多面手
NVIDIA GPU助力科研人員探索外星世界
深度學習工作負載中GPU與LPU的主要差異

評論