電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)據(jù)預(yù)測(cè),到2026年底中國(guó)道路上將有超過100萬輛搭載L3級(jí)別ADAS(高級(jí)駕駛輔助系統(tǒng))的汽車。到今年年底,中國(guó)將有超過1.7 億臺(tái)支持AI的智能手機(jī),55% 的PC 將支持AI功能。同時(shí),AI 數(shù)據(jù)中心將增長(zhǎng)5倍。從這組數(shù)據(jù)中,我們已經(jīng)看到AI正在快速地推進(jìn)眾多行業(yè)的智能化進(jìn)程。當(dāng)前首要任務(wù)是夯實(shí)AI底座,構(gòu)建一個(gè)強(qiáng)大的生態(tài)系統(tǒng),為AI應(yīng)用打下堅(jiān)實(shí)的根基,從而助力其實(shí)現(xiàn)指數(shù)級(jí)增長(zhǎng)。
在最近舉辦的Arm Tech Symposia年度技術(shù)大會(huì)上,Arm終端事業(yè)部產(chǎn)品管理副總裁James McNiven表示,在過去的三十多年里,Arm一直致力于打造全球最大的計(jì)算平臺(tái),并以無與倫比的能源效率著稱。憑借Arm的行業(yè)洞察和數(shù)十年與生態(tài)伙伴的合作,Arm的計(jì)算平臺(tái)正持續(xù)推動(dòng)新一代生態(tài)系統(tǒng)合作伙伴關(guān)系的發(fā)展。正如 Arm 曾經(jīng)助力智能手機(jī)的崛起,Arm 也將成為AI計(jì)算平臺(tái)的驅(qū)動(dòng)者。
圖:Arm終端事業(yè)部產(chǎn)品管理副總裁James McNiven
大會(huì)期間,James說道:“我們正面臨全新的需求,無論是算力、性能、能效,還是上市時(shí)間的需求都在不斷提升。”在談及Arm如何以超越硬件的設(shè)計(jì)方法助力AI應(yīng)用時(shí),James分享:“要想充分釋放 AI 的潛力,我們需要從系統(tǒng)層面思考問題,將硬件、軟件和生態(tài)無縫集成到一個(gè)全面的解決方案,使其具備卓越的可擴(kuò)展性、性能和能效,并且能夠加速產(chǎn)品上市。”
以硬件為基石
Arm推出的計(jì)算子系統(tǒng) (CSS),正是為客戶提供優(yōu)化的解決方案,強(qiáng)大的軟件生態(tài)系統(tǒng),以及更快的上市時(shí)間。該解決方案主要聚焦于異構(gòu)計(jì)算并實(shí)現(xiàn)對(duì)系統(tǒng)多種計(jì)算要素的優(yōu)化協(xié)作,實(shí)現(xiàn)高效率的軟件編寫方式、易用且可擴(kuò)展的全球解決方案,讓開發(fā)者能夠針對(duì)硬件進(jìn)行開發(fā)。
James強(qiáng)調(diào),Arm多年來持續(xù)投資Armv9架構(gòu)。在過去幾年中,通過加入許多以 AI 為核心的功能,使該架構(gòu)適用于未來發(fā)展,而這一進(jìn)程還在持續(xù)。十多年前,Arm首次將 AI 功能引入 Arm 架構(gòu),隨后在 Armv8 架構(gòu)中引入了64位技術(shù),但真正開啟AI時(shí)代的,則是 Armv9。
這其中包括兩大關(guān)鍵技術(shù),可伸縮向量擴(kuò)展 (SVE)和可伸縮矩陣擴(kuò)展 (SME)。
SVE2 已應(yīng)用于一些領(lǐng)先的計(jì)算產(chǎn)品中,如全新的天璣 9400,可加速工作負(fù)載,惠及開發(fā)者和終端用戶。SVE2 提升了視頻和圖像處理,提供更好的照片質(zhì)量。
SME新一代架構(gòu)功能將為開發(fā)者提供通用指令集,使其能夠一次在多個(gè)硬件平臺(tái)上實(shí)現(xiàn) Arm 架構(gòu)中的加速效果。
James表示,未來十年的Arm計(jì)算平臺(tái)將持續(xù)為 AI 而優(yōu)化,所有功能將通過軟硬件能力的結(jié)合來實(shí)現(xiàn)。
以軟件為中心
在傳統(tǒng)的、AI 熱潮興起前的初創(chuàng)公司中,硬件和軟件工程師的比例大約是 50/50。但現(xiàn)在這一比例變成了 10/90,即10% 的硬件工程師和90%的軟件工程師。軟件的地位已經(jīng)壓倒性地提升,而圍繞軟件構(gòu)建的復(fù)雜性也在持續(xù)增長(zhǎng)。
針對(duì)這一趨勢(shì),James表示,Arm 聚焦于整體的技術(shù)棧,從底層硬件到整個(gè)技術(shù)棧中的軟件和應(yīng)用程序。Arm已投入 30 多年來編寫和優(yōu)化軟件,軟件始終是 Arm 計(jì)算平臺(tái)不可或缺的一部分。未來技術(shù)將變得更加復(fù)雜,并且需要大量的支持。軟件的開發(fā)成本高且耗時(shí),因此投資策略也必須不斷進(jìn)化。
Arm相信我們正處于以軟件為中心的未來。目前已有2000萬名開發(fā)者在Arm平臺(tái)上進(jìn)行軟件開發(fā)。受到如此多的開發(fā)者青睞,正是因?yàn)锳rm 擁有全球最大的計(jì)算平臺(tái),這形成了良性循環(huán),即更多的硬件吸引更多開發(fā)者開發(fā)軟件,進(jìn)而推動(dòng)對(duì)高能效硬件的需求,彼此互為循環(huán)。這一過程貫穿整個(gè)技術(shù)棧,從底層的操作系統(tǒng)到頂層的應(yīng)用程序和用戶與科技的互動(dòng)方式。一致的計(jì)算平臺(tái)為開發(fā)者提供了信心,使他們能夠編寫出可在當(dāng)前數(shù)十億臺(tái)Arm 硬件上良好運(yùn)行的軟件。
為了進(jìn)一步以技術(shù)賦能開發(fā)者,Arm正在抽象化許多硬件相關(guān)的技術(shù)細(xì)節(jié),真正實(shí)現(xiàn)對(duì)開發(fā)者友善的設(shè)計(jì),讓他們能專注于打造優(yōu)秀的軟件與簡(jiǎn)單的整合。
其今年中旬發(fā)布的KleidiAI,是一款致力于提升人工智能計(jì)算性能的軟件庫(kù),旨在通過與主流AI框架的深度集成,為開發(fā)者無縫獲取底層硬件架構(gòu)的高性能。目前KleidiAI已與PyTorch、TensorFlow和MediaPipe等熱門框架集成,能夠顯著優(yōu)化如Meta Llama 3和Phi-3等大型語言模型的性能。在本次年度大會(huì)上,Arm還宣布其與騰訊合作,通過 KleidiAI 集成提升混元大模型端側(cè) AI 性能,為騰訊眾多應(yīng)用場(chǎng)景提供卓越的 AI 體驗(yàn)。當(dāng)與Arm終端CSS結(jié)合使用時(shí),KleidiAI借助Neon、SVE2和SME2等技術(shù)實(shí)現(xiàn)了性能的顯著提升,特別是在生成式AI應(yīng)用中的效率得到了極大的優(yōu)化。
James解析,Kleidi 技術(shù)可以用于加速Armv9 和Armv8 架構(gòu)。最初的版本實(shí)際上是覆蓋 Neon 指令集,而Arm陸續(xù)新增了 SVE (可伸縮向量擴(kuò)展)、SVE2 和 SME (可伸縮矩陣擴(kuò)展)等新架構(gòu)功能。因此,它將適用于多個(gè)不同版本的架構(gòu),包括 Armv8、Armv9.0,乃至目前最新的Armv9.2。
Kleidi 技術(shù)以其卓越的性能給人留下深刻印象,通過集成 Kleidi,騰訊混元大模型的預(yù)填充部分加速了 100%,而解碼器的速度提高了 10%。這些性能改善有助于實(shí)現(xiàn)更快、更高效的 AI 操作。其應(yīng)用范圍從發(fā)布伊始的終端市場(chǎng),已經(jīng)擴(kuò)展到云端應(yīng)用,例如在基于Arm架構(gòu)的 AWS Graviton 處理器上運(yùn)行Llama 3 模型時(shí),詞元 (token) 首次響應(yīng)時(shí)間可提高2.5 倍。
在談及Kleidi未來的發(fā)展,James表示:“隨著 Kleidi 的逐步普及和更多開發(fā)者的參與,我們將看到更多的優(yōu)化。作為開源生態(tài)系統(tǒng)的一部分,我們期待開發(fā)者為其貢獻(xiàn)力量,從而在整個(gè) Arm 生態(tài)系統(tǒng)中實(shí)現(xiàn)更廣泛的協(xié)作。”
此外,在此次大會(huì)期間,Arm也展示了其對(duì)生態(tài)系統(tǒng)合作的重視。今年,Arm與vivo持續(xù)深化合作,宣布成立聯(lián)合實(shí)驗(yàn)室,分別發(fā)揮各自在技術(shù)賦能和用戶理解領(lǐng)域的優(yōu)勢(shì),為用戶帶來卓越的 AI 體驗(yàn),這成為Arm生態(tài)合作的一個(gè)優(yōu)秀范例。此外,Arm還與合作伙伴攜手,積極推進(jìn)產(chǎn)業(yè)標(biāo)準(zhǔn)化進(jìn)程,旨在構(gòu)建一個(gè)健康、可持續(xù)的Arm生態(tài)系統(tǒng)。James 表示,Arm正在思考如何打造一個(gè)軟件庫(kù),通過將其集成到合作伙伴的軟件中,讓這些應(yīng)用能夠在包括移動(dòng)終端在內(nèi)的端側(cè)領(lǐng)域,充分發(fā)揮 Arm CPU 的性能優(yōu)勢(shì)。同時(shí),Arm也將持續(xù)投入軟件,例如,在企業(yè)場(chǎng)景中提供支持,通過與 Linaro 的合作,持續(xù)強(qiáng)化對(duì) Linux 的支持,在固件標(biāo)準(zhǔn)(如 UEFI)上的貢獻(xiàn),以及對(duì)一些開源工具的支持等,盡可能減少產(chǎn)業(yè)的碎片化。
Arm加快AI PC進(jìn)程
Arm正在加緊建設(shè)AI PC的相關(guān)生態(tài)。目前Windows on Arm 平臺(tái)已成功運(yùn)行很多原生應(yīng)用程序,并配備了豐富的開發(fā)工具,而且越來越多的創(chuàng)新應(yīng)用正在涌現(xiàn),如愛奇藝、嗶哩嗶哩和搜狗等原生支持 Windows on Arm 的應(yīng)用,可以充分利用AI PC的全部AI功能。未來,用戶將會(huì)看到更多、更加卓越的使用體驗(yàn)。
Arm正與包括微軟在內(nèi)的多家合作伙伴攜手合作,繼續(xù)深化Arm的AI PC進(jìn)程。現(xiàn)在微軟已經(jīng)推出了專門針對(duì)Arm 架構(gòu)的 Windows 11 系統(tǒng)。談到業(yè)內(nèi)擔(dān)心的基于Arm 架構(gòu)運(yùn)行時(shí)面臨的軟件兼容和生態(tài)問題,James解釋道:“我們持續(xù)和微軟合作,通過微軟提供的仿真環(huán)境,我們也為應(yīng)用程序的開發(fā)者提供更多指引和建議。根據(jù)微軟的統(tǒng)計(jì),其 PC 用戶投入在筆記本電腦上的時(shí)間,大約 90% 是用在原生應(yīng)用上,表明了目前 WoA 原生應(yīng)用的用戶體驗(yàn)得到了顯著提升。”
小結(jié):
預(yù)計(jì)到2025年,將會(huì)有1,000億臺(tái)基于 Arm 架構(gòu)的設(shè)備可用于AI,這其中包括廣泛的面向邊緣 AI 的產(chǎn)品,從Arm Cortex-M到 Arm Cortex-A涵蓋了不同的性能水平和功耗需求。而Arm終端CSS、KleidiAI以及廣泛的生態(tài)合作,將助力開發(fā)者更方便快捷地釋放AI技術(shù)的潛力。
-
ARM
+關(guān)注
關(guān)注
134文章
9287瀏覽量
374663
發(fā)布評(píng)論請(qǐng)先 登錄
首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手
硅基覺醒已至前夜,聯(lián)發(fā)科攜手生態(tài)加速智能體化用戶體驗(yàn)時(shí)代到來
Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開發(fā)
Arm平臺(tái)引領(lǐng)AI云計(jì)算革新
Arm成功將Arm KleidiAI軟件庫(kù)集成到騰訊自研的Angel 機(jī)器學(xué)習(xí)框架
烏鎮(zhèn)亮點(diǎn) Arm終端計(jì)算子系統(tǒng) (CSS) 榮膺世界互聯(lián)網(wǎng)大會(huì)領(lǐng)先科技獎(jiǎng)

Arm全面設(shè)計(jì)助力Arm架構(gòu)生態(tài)發(fā)展
Arm全面設(shè)計(jì)生態(tài)迅速擴(kuò)張,推出AI CPU小芯片平臺(tái)
Arm終端CSS革新,加速端側(cè)人工智能時(shí)代
MediaTek加入Arm全面設(shè)計(jì)生態(tài),加速AI應(yīng)用領(lǐng)域創(chuàng)新
MediaTek加入Arm全面設(shè)計(jì)生態(tài)項(xiàng)目 塑造AI計(jì)算的未來

Arm發(fā)布全新終端計(jì)算子系統(tǒng),加速AI體驗(yàn)與產(chǎn)品上市
Arm宣布推出終端計(jì)算子系統(tǒng)(CSS),提供領(lǐng)先的人工智能體驗(yàn)

Arm終端CSS為AI用戶體驗(yàn)提供計(jì)算平臺(tái)

Arm推出AI優(yōu)化的Arm終端CSS以及新的Arm Kleidi軟件

評(píng)論