半導體產(chǎn)業(yè)正經(jīng)歷一場由人工智能 (AI) 崛起以及傳統(tǒng)摩爾定律放緩所驅(qū)動的關鍵轉(zhuǎn)型。在此背景下,Arm于近日發(fā)布了《芯片新思維:人工智能時代的新根基》行業(yè)報告。在報告中,來自 Arm 與業(yè)界的專家提供了多元化的視點,深度解讀了 AI 時代啟幕之際的行業(yè)現(xiàn)狀與趨勢,探討了行業(yè)應如何在滿足 AI 帶來的算力需求同時,解決能效、安全性與可靠性等挑戰(zhàn)。
報告指出,為應對AI的爆發(fā)式增長所帶來的空前計算需求,芯片行業(yè)正持續(xù)發(fā)展演進。產(chǎn)業(yè)正在積極采用定制芯片、計算子系統(tǒng) (CSS) 和芯粒等創(chuàng)新技術與方法,而這些技術與方法將定義未來十年的技術創(chuàng)新方向。
定制芯片在全行業(yè)的廣泛采用
如今,幾乎所有的半導體行業(yè)從業(yè)者都在探索和投資定制芯片,特別是全球四大超大規(guī)模云服務提供商,他們在2024年全球云服務器采購支出中占了近半數(shù)的份額。
Arm 解決方案工程部執(zhí)行副總裁Kevork Kechichian表示,傳統(tǒng)的 SoC 通常是通用芯片組,而定制芯片則是針對特定市場、應用或客戶的需求而量身打造的芯片解決方案。
例如,AWS Graviton4 是基于 Arm 技術打造的定制芯片解決方案,專為加速數(shù)據(jù)中心和 AI 工作負載而設計,該解決方案實現(xiàn)了性能與能效的顯著提升。
此外,微軟在2023年發(fā)布了首款面向云端定制的芯片 Microsoft Azure Cobalt,該芯片選用了 Arm Neoverse 計算子系統(tǒng) (CSS) 進行打造,旨在應對復雜的計算基礎設施挑戰(zhàn)。去年,Google Cloud 也發(fā)布了基于 Arm Neoverse 平臺的 Axion 定制芯片,專為應對數(shù)據(jù)中心復雜的服務器工作負載而設計。
Kevork 指出,并非僅限于超大型云服務提供商,許多中小企業(yè)也在積極研發(fā)專屬的定制芯片解決方案,以應對日益復雜的計算需求。例如,在 Arm 技術和英特爾代工服務 (IFS) 的支持下,芯片設計技術提供商智原科技正在開發(fā)面向數(shù)據(jù)中心和先進 5G 網(wǎng)絡的 64 核定制 SoC。韓國的 AI 芯片公司 Rebellions 也宣布打造新的大規(guī)模 AI 芯片平臺,用以提升AI 工作負載的能效表現(xiàn)。
定制芯片被認為是實現(xiàn)更高效 AI 計算的重要趨勢,但定制芯片在成本、研發(fā)周期以及生態(tài)構建等方面存在的挑戰(zhàn)如何應對?
Kevork表示,定制芯片的開發(fā)成本非常高,所需的資源也非常大,這既體現(xiàn)在投入開發(fā)的人力上,也體現(xiàn)在為開發(fā)定制芯片所需的大量計算資源上。為此,Arm 已探索出多種能夠有效降低開發(fā)投入的方法。
從加快產(chǎn)品上市的角度出發(fā),Arm 的定制化解決方案能夠讓合作伙伴顯著縮短其產(chǎn)品上市周期。最基礎的方法是從平臺的角度出發(fā),識別可復用的模塊與資源,并確保定制工作是在已有基礎上進行,無需一切從零開始。同時還需要充分評估現(xiàn)有的資源,并在此基礎上構建定制化產(chǎn)品。正是基于這種方式,Arm 與 SoC 及各類 IP 提供商密切合作,將解決方案交付給合作伙伴。
計算子系統(tǒng)(CSS)與芯粒技術的崛起
Arm Neoverse CSS 經(jīng)過驗證的核心計算功能以及靈活的內(nèi)存與 I/O 接口配置,加快了產(chǎn)品上市進程,帶來顯著的優(yōu)勢。它在確保軟件一致性的同時,為 SoC 設計人員提供了靈活性,使其能夠基于 CSS 周圍新增定制子系統(tǒng),以打造差異化的解決方案。
先進的封裝技術和工藝是近期芯片演進的另一個重要方向,推動了芯粒的發(fā)展。這些技術允許多個半導體晶粒的堆疊和互連,在提升性能和能效的同時,開創(chuàng)了現(xiàn)代芯片設計的可能性,如晶粒間接口以及新的 2.5D 和 3D 封裝解決方案。
理想情況下,芯片廠商無需重新設計一款芯片,只需添加更多芯粒以增加算力和性能,甚至可以升級現(xiàn)有芯粒,從而更快地將新產(chǎn)品推向市場。與此同時,生產(chǎn)更小的芯片還有助于提高良率,并減少制造過程中的浪費。
作為致力于推動芯粒發(fā)展的領先企業(yè),Arm 已在整個技術生態(tài)系統(tǒng)內(nèi)展開合作,借助通用框架和行業(yè)標準來加速芯粒市場的發(fā)展。
在談及芯粒技術發(fā)展面臨的挑戰(zhàn)時,Kevork 表示,在我們當前所處的技術范式中,最關鍵的是如何對芯粒 (chiplet) 的設計與接口方式進行標準化。這涉及從封裝廠如何集成這些芯粒,一直到在系統(tǒng)中不同芯粒之間進行通信的全過程。因此,與合作伙伴就標準化問題達成共識至關重要。
在此背景下,Arm 推出了芯粒系統(tǒng)架構 (Chiplet System Architecture, CSA),致力于對各個芯粒之間及在整個系統(tǒng)內(nèi)的通信方式等多個方面實現(xiàn)標準化。此外,Arm 還攜手合作伙伴共同推動 AMBA CHI 芯片到芯片互連協(xié)議等倡議的落地實施,確保來自不同供應商的不同芯粒通過一個統(tǒng)一的接口協(xié)議來確保芯粒之間的互操作性。
過去,標準化常被視為放棄自身的 IP 或競爭優(yōu)勢。但如今,鑒于系統(tǒng)的高度復雜性以及合作模式的演變,標準化變得尤為重要——所有參與方都將從中獲得多重益處。
應對 AI時代的安全威脅
隨著 AI 驅(qū)動的網(wǎng)絡攻擊手段不斷演變,構建更具彈性和適應性的安全機制,確保芯片在復雜多變的網(wǎng)絡環(huán)境中的安全性成為必選項。
Kevork 認為,當前行業(yè)正在加速演進,針對 SoC 平臺 IP 的攻擊手段日趨復雜。Arm 正在通過構建多層級的軟硬件防護體系,提升防御能力。比如,Arm 在芯片中直接集成加密技術,并結合經(jīng) AI 強化的安全監(jiān)測系統(tǒng),使現(xiàn)代 SoC 架構能夠抵御傳統(tǒng)攻擊與新興的威脅。
此外,AI 本身也正日益成為抵御安全攻擊的有力助手。通過基于網(wǎng)絡的監(jiān)測與先進的代碼分析,AI 驅(qū)動的技術能夠以人類難以企及的速度和規(guī)模識別可疑行為,并發(fā)現(xiàn)潛在漏洞。Arm 正在最大限度地發(fā)揮這一優(yōu)勢。
隨著 AI 模型在日常計算中日益普及,保護其完整性變得尤為重要。這推動了機密計算架構 (CCA)的崛起——即使處于潛在不可信的環(huán)境中,此類架構也能為敏感的 AI 計算創(chuàng)建“安全飛地”。而針對長期以來被攻擊者頻繁利用的內(nèi)存漏洞,行業(yè)也正在通過一系列創(chuàng)新手段加以解決,例如 Armv9 架構中的內(nèi)存標記擴展 (MTE) 技術,能使惡意攻擊者更難針對內(nèi)存發(fā)起攻擊。
AI與芯片面臨的挑戰(zhàn)與機遇
AI 工作負載的計算需求極大,需要大量電力與能源資源來支持其運行,且這種需求在未來將會持續(xù)增長。Kevork 表示,從芯片設計的角度來看,最主要的能耗來源是計算和數(shù)據(jù)傳輸。此外,還需要對過程中所產(chǎn)生的熱量進行冷卻處理。
首先,AI 依賴于大量的乘積累加運算,這就要求芯片中集成高能效的計算結構。與此同時,這些計算并非總在同一位置完成。多數(shù)情況下,某些 AI 的輸出必須在其他運算或計算組件中進一步處理,這就會產(chǎn)生數(shù)據(jù)傳輸,從而帶來額外的能源和電力的開銷。因此,要實現(xiàn)高能效的 AI 計算,優(yōu)化計算組件之間的通信至關重要,這些組件可能位于同一芯片內(nèi),也可能位于另一個模塊或機架中。
此外,將計算單元和內(nèi)存單元緊密封裝,可以最小化延遲和電力損耗,但卻也帶來了散熱方面的挑戰(zhàn)。因此,高效的冷卻解決方案對于管理能源密度和確保硬件可靠性至關重要。
因此,為降低能源成本,芯片設計正在集成優(yōu)化的內(nèi)存層次結構與協(xié)同設計的通信機制。這些解決方案既減少了數(shù)據(jù)的傳輸,還借助芯片堆疊、高帶寬內(nèi)存以及先進的互連等技術,最大程度地降低剩余數(shù)據(jù)傳輸過程中的能耗。與此同時,AI 框架和算法也正日益針對每瓦性能和單位成本性能等指標進行微調(diào),實現(xiàn)算力與經(jīng)濟可持續(xù)性之間的平衡。
隨著 AI 技術的不斷發(fā)展,更具能效的芯片設計與更小型、更高效的 AI 模型的研發(fā)正不斷取得進展。這類模型尤其適合在小型設備上運行生成式 AI 工作負載,具備資源占用更低、準確性更高以及可移植性更強等優(yōu)勢。
此外,行業(yè)在數(shù)據(jù)類型優(yōu)化方面也在不斷進步。例如,全行業(yè)推動采用 FP4(4 位浮點數(shù))靈活架構并推出新指令集和功能,帶來了增量收益,并有助于實現(xiàn)更高效的 AI 計算。而芯片堆疊技術和 3D 封裝技術的發(fā)展,也催生了諸如芯粒等更高能效的芯片設計方案。
報告還指出,底層架構的創(chuàng)新也至關重要,如新的指令集和功能的引入,能夠為 AI 帶來重大的創(chuàng)新機遇。例如,Arm 定期推出的新功能,如可伸縮矢量擴展 (SVE2) 和可伸縮矩陣擴展 (SME),這些功能都集成于 Arm 架構中,為生態(tài)系統(tǒng)增加了新的 AI 能力。值得注意的是,如今的硬件已經(jīng)具備訓練 Transformer 模型的強大能力,而這類模型正是生成式 AI 的基礎。
在 Arm 看來,理想的情況是,AI 和芯片技術能夠?qū)崿F(xiàn)一種整體協(xié)同設計的方法,即硬件和算法同步開發(fā),以實現(xiàn)最佳性能和效率。
小結
在 AI 時代,芯片設計方式將持續(xù)演進,并重新聚焦于高能效計算,以應對日益復雜的計算工作負載。這一趨勢體現(xiàn)在通過定制芯片、CSS 以及芯粒等創(chuàng)新方式打造的專用芯片組,從而優(yōu)化芯片設計中的功耗、性能與面積。
報告指出,芯片設計的成功將越來越依賴于以下幾點:IP 提供商、晶圓代工廠與系統(tǒng)集成商之間的緊密合作;計算、內(nèi)存與電源傳輸之間的系統(tǒng)級優(yōu)化;接口的標準化,以支持模塊化設計;針對特定工作負載的專用架構以及能靈活應對新興威脅的強大安全框架。
“若想取得成功,我們既要直面復雜性,又要找到高效管理復雜性的方法——這將依賴于全新的工具、方法論,以及生態(tài)系統(tǒng)內(nèi)前所未有的協(xié)作,”Kevork 總結道,“唯有通過整個生態(tài)系統(tǒng)的協(xié)作,我們方能構建起必要的技術基石——既能釋放 AI 的變革潛力,又能有效管控其計算成本與復雜度。”
通過與半導體生態(tài)系統(tǒng)中的合作伙伴持續(xù)協(xié)作,Arm將持續(xù)致力于應對能效、安全性和性能等根本性挑戰(zhàn),定義計算的未來。
-
ARM
+關注
關注
134文章
9304瀏覽量
374902
發(fā)布評論請先 登錄
Turkcell受邀出席華為IP GALA技術峰會
砥礪創(chuàng)新 芯耀未來——武漢芯源半導體榮膺21ic電子網(wǎng)2024年度“創(chuàng)新驅(qū)動獎”
面向未來 三星構建移動安全防護體系
Arm帶你了解2025年及未來在不同技術市場的關鍵技術方向
Arm預測2025年芯片設計發(fā)展趨勢
Arm 技術預測:2025 年及未來的技術趨勢

鯨啟智能機器人入選多項金融銀行機器人行業(yè)報告

Molex莫仕發(fā)布2024年機器人技術報告
面向未來的智能視覺參考設計與汽車架構,思爾芯提供基于Arm技術的創(chuàng)新方案

從特斯拉看智能駕駛未來發(fā)展

2024激光顯示技術與產(chǎn)業(yè)發(fā)展大會:共繪未來十年藍圖
哪種嵌入式處理器架構將引領未來十年的發(fā)展?

邏輯芯片:現(xiàn)代電子技術的基石
ARM 主板:計算的未來

評論