作者:Arm 終端事業(yè)部產(chǎn)品管理高級(jí)總監(jiān) Stefan Rosinger
在之前有關(guān) Arm Cortex-X925 CPU 的文章中,Arm 技術(shù)專(zhuān)家曾探討了每時(shí)鐘周期指令數(shù) (IPC) 作為評(píng)估 CPU 性能的關(guān)鍵指標(biāo)的重要性。與主要將頻率作為性能指標(biāo)的做法不同,IPC 衡量的是 CPU 每個(gè)時(shí)鐘周期內(nèi)能處理的指令數(shù)。對(duì)于移動(dòng)設(shè)備而言,電池續(xù)航和散熱管理是影響實(shí)際應(yīng)用、用戶(hù)體驗(yàn)和設(shè)備處理復(fù)雜工作負(fù)載的關(guān)鍵所在。因而,IPC 對(duì)于評(píng)估移動(dòng)設(shè)備性能而言,至關(guān)重要。
更高的頻率 ≠ 最優(yōu)表現(xiàn)
IPC 越高,表示在一個(gè)時(shí)鐘周期內(nèi)執(zhí)行的指令越多;即便時(shí)鐘速度較慢,也能帶來(lái)更好的性能。這對(duì)于內(nèi)存受限的工作負(fù)載尤為重要,因?yàn)槠湫阅軙?huì)受到 CPU 外部因素的制約。更高的 IPC 使得 CPU 能以更低的頻率運(yùn)行,從而減少電量消耗和功耗,設(shè)備發(fā)熱也會(huì)緩解。這對(duì)于需要保持穩(wěn)定性能的移動(dòng)設(shè)備來(lái)說(shuō),尤為有利。
雖然高頻 CPU 乍聽(tīng)起來(lái)很有吸引力,但它并不能反映性能的全貌。頻率表示 CPU 每秒完成的時(shí)鐘周期數(shù)量,而 IPC 則表示每個(gè)周期所完成的工作量。事實(shí)上,最高頻率很少會(huì)用到。例如,對(duì)于游戲和其他算力要求較高的工作負(fù)載來(lái)說(shuō),并不會(huì)以最大頻率使用 CPU,大多數(shù)時(shí)間反而是以中檔頻率運(yùn)行。此時(shí)的能效更高,可以延長(zhǎng)電池續(xù)航時(shí)間并降低設(shè)備溫度,而這兩者是提升整體用戶(hù)體驗(yàn)的重要指標(biāo)。
在相同的時(shí)間周期內(nèi),具有更高 IPC 的 CPU 在處理實(shí)際應(yīng)用和復(fù)雜工作負(fù)載時(shí)會(huì)表現(xiàn)出更優(yōu)的性能。即便是當(dāng)今具有復(fù)雜計(jì)算需求的 AI 應(yīng)用(例如聊天機(jī)器人、實(shí)時(shí)語(yǔ)言翻譯和虛擬助手),在 IPC 更高的 CPU 上運(yùn)行時(shí)也會(huì)表現(xiàn)得更加出色。此外,就能效而言,在一個(gè)周期內(nèi)執(zhí)行更多的指令意味著可以更快地完成任務(wù),使得 CPU 處于高能耗狀態(tài)的時(shí)間減少,從而節(jié)省電池電量。
卓越的架構(gòu)設(shè)計(jì)
在基于 Armv9 架構(gòu)的 CPU 設(shè)計(jì)中,可伸縮向量擴(kuò)展 (SVE2) 是提高 IPC 的關(guān)鍵所在。這一架構(gòu)特性采用新的專(zhuān)用向量指令,是加速智能手機(jī)關(guān)鍵工作負(fù)載和應(yīng)用的理想之選。
SVE2 可將 HDR 視頻解碼速度提高約 10%,這樣用戶(hù)在主流應(yīng)用上觀看點(diǎn)播視頻時(shí),能獲得更長(zhǎng)的電池續(xù)航時(shí)間。此外,通過(guò)加速常用的圖像處理庫(kù),SVE2 還增強(qiáng)了視頻通話(huà)期間用戶(hù)體驗(yàn)的流暢度,同時(shí)提高了畫(huà)面質(zhì)量。其中包括更好的攝像頭旋轉(zhuǎn)體驗(yàn),以及圖像濾鏡的切換和使用體驗(yàn)。
不僅如此,SVE2 還不受向量長(zhǎng)度的影響,這意味著代碼開(kāi)發(fā)將支持更大的向量長(zhǎng)度,例如 256 位。由此可確保與移動(dòng)計(jì)算未來(lái)發(fā)展的兼容性,包括未來(lái)更注重邏輯擴(kuò)展,而非 RAM 的先進(jìn)工藝節(jié)點(diǎn)。移動(dòng)端市場(chǎng)將因此能夠適應(yīng)更大的向量長(zhǎng)度,有利于游戲和 AI 模型中 SVE 代碼的呈現(xiàn)。
通過(guò)深入研究設(shè)計(jì),IPC 性能可借助一系列特定的微架構(gòu)改進(jìn)得以提高。其中包括但不限于:
超標(biāo)量亂序執(zhí)行
分支預(yù)測(cè)和預(yù)取器
數(shù)據(jù)推測(cè)
適當(dāng)?shù)木彺孢x擇
Arm Cortex CPU 一直在逐年推進(jìn)各種類(lèi)似的微架構(gòu)改進(jìn),以實(shí)現(xiàn)更高的性能水平。
面向移動(dòng)端的最新 Armv9 CPU
上述的架構(gòu)特性和微架構(gòu)提升是 Arm 面向移動(dòng)端市場(chǎng)的最新 Armv9 CPU 的核心所在。作為 MediaTek 天璣 9400(已被搭載于 vivo X200 系列等旗艦智能手機(jī))的核心,Cortex-X925 對(duì)私有 L2 緩存進(jìn)行了升級(jí),從 2MB 增加到 3MB。再加上 Cortex-X925 能夠更加快速、高效地預(yù)取數(shù)據(jù)和復(fù)雜指令,從而顯著增強(qiáng)了 CPU 的整體性能和能效。得益于此,Arm 計(jì)算平臺(tái)在 2024 年實(shí)現(xiàn)了驚人的兩位數(shù) IPC 性能提升。
如此一來(lái),終端用戶(hù)能夠享受到一系列實(shí)際性能的提升,包括更快的應(yīng)用響應(yīng)速度、更好的游戲體驗(yàn)、更流暢的視頻流媒體傳輸、更快的網(wǎng)頁(yè)瀏覽和順暢的多任務(wù)處理。同時(shí),更高的 IPC 也帶來(lái)了能效的提升,延長(zhǎng)了用戶(hù)的沉浸式體驗(yàn)。
與此同時(shí),Cortex-A725 作為 CPU 工作負(fù)載的主力,也進(jìn)行了一系列針對(duì)性更新,著力于需要持續(xù)出色性能的關(guān)鍵 AI 和游戲用例。與 Cortex-A720 相比,Cortex-A725 的性能效率提升了 35%,能效提升了 25%。
在 Armv9.2 集群中,每個(gè) CPU 組件都能應(yīng)對(duì)廣泛的實(shí)際用例和復(fù)雜的工作負(fù)載。例如,Cortex-X925 可處理應(yīng)用啟動(dòng)和網(wǎng)頁(yè)瀏覽的“突發(fā)”工作負(fù)載,而 Cortex-A725 則可以在常見(jiàn)的移動(dòng)端用例(包括游戲、網(wǎng)頁(yè)瀏覽、基于攝像頭的應(yīng)用和視頻流媒體)中持續(xù)提供穩(wěn)定性能,以延長(zhǎng)設(shè)備的使用時(shí)間(即電量耗盡之前,用戶(hù)可在設(shè)備上使用某些用例的平均時(shí)間)。
打造無(wú)可比擬的移動(dòng)端體驗(yàn)
從根本上說(shuō),移動(dòng)設(shè)備需要兼具性能與能效,而 IPC 的提升恰好能同時(shí)滿(mǎn)足這個(gè)需求。用戶(hù)因而能更長(zhǎng)時(shí)間體驗(yàn)各種需要高算力的應(yīng)用。最新的 Armv9 CPU 將卓越的 IPC 水平與高時(shí)鐘頻率相結(jié)合,將性能和能效提升到一個(gè)更高的水平,從而為最終用戶(hù)帶來(lái)更加出色的用戶(hù)體驗(yàn)。這也正是為什么全球 99% 的智能手機(jī)都基于 Arm 計(jì)算平臺(tái)打造的原因之一。
-
ARM
+關(guān)注
關(guān)注
134文章
9306瀏覽量
374986 -
cpu
+關(guān)注
關(guān)注
68文章
11033瀏覽量
215984 -
IPC
+關(guān)注
關(guān)注
3文章
361瀏覽量
52860 -
移動(dòng)計(jì)算
+關(guān)注
關(guān)注
0文章
30瀏覽量
10365
原文標(biāo)題:內(nèi)有劇透!打造高性能、高能效移動(dòng)計(jì)算的關(guān)鍵是?
文章出處:【微信號(hào):Arm社區(qū),微信公眾號(hào):Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
ARM Mali GPU 深度解讀
Arm 公司面向 PC 市場(chǎng)的 ?Arm Niva? 深度解讀
Arm 公司面向移動(dòng)端市場(chǎng)的 ?Arm Lumex? 深度解讀
Arm 公司面向汽車(chē)市場(chǎng)的 ?Arm Zena? 深度解讀
MWC2025亮點(diǎn)放送 探索Arm如何塑造移動(dòng)端技術(shù)未來(lái)

Arm 推出 Armv9 邊緣 AI 計(jì)算平臺(tái),以超高能效與先進(jìn) AI 能力賦能物聯(lián)網(wǎng)革新

搶先試用此芯Armv9 AI PC開(kāi)發(fā)套件瑞莎“星睿O6”

Arm Cortex-A320 CPU助力嵌入式設(shè)備實(shí)現(xiàn)高能效AI計(jì)算

詳解Arm Cortex-A320 CPU的特性
Arm發(fā)布基于Armv9架構(gòu)的Cortex-A320處理器
Arm推出全球首個(gè)Armv9邊緣AI計(jì)算平臺(tái)
MediaTek天璣8350移動(dòng)芯片賦能榮耀平板V9
鴻蒙原生頁(yè)面高性能解決方案上線OpenHarmony社區(qū) 助力打造高性能原生應(yīng)用
基于Armv9架構(gòu)的MediaTek天璣8400移動(dòng)芯片問(wèn)世
Armv9 CPU中SVE2的實(shí)際用例

評(píng)論