4月15日,慕尼黑上海電子展拉開帷幕。此次展覽將持續(xù)三天,不僅吸引了半導(dǎo)體、傳感器、海內(nèi)外展商參展;同期舉辦的“創(chuàng)新論壇”更是眾多行業(yè)人士關(guān)注的重點(diǎn)。4月15日下午,Imagination中國(guó)高級(jí)業(yè)務(wù)經(jīng)理黃音出席“2025AI技術(shù)創(chuàng)新論壇”,她結(jié)合公司產(chǎn)品情況,從AI算力、圖形渲染,以及基于兩者的嵌入式設(shè)備性能平衡等方面進(jìn)行了主題分享。
AI模型持續(xù)優(yōu)化驅(qū)動(dòng)硬件構(gòu)架的革新
首先,黃音回顧了自2012年以來(lái)AI模型的發(fā)展歷程。她介紹說(shuō),2012年AlexNet開啟了卷積神經(jīng)網(wǎng)絡(luò)時(shí)代;Perception AI開始進(jìn)入語(yǔ)音識(shí)別、計(jì)算機(jī)視覺(jué);Generative AI實(shí)現(xiàn)了從文本生成圖像、視頻等內(nèi)容生成;Agentic AI不僅能學(xué)習(xí),還能使用工具,進(jìn)行判斷,并且采取行動(dòng);還有最近流行的Physical AI,能感知物理世界的人工智能,在真實(shí)環(huán)境中完成任務(wù),如智能機(jī)器人等。
“我們現(xiàn)在常說(shuō)‘大模型’,其實(shí)也有不少公司在做‘小模型’”。大模型(LLM)通常基于大規(guī)模數(shù)據(jù)進(jìn)行訓(xùn)練,如谷歌的Transformer,也有可在端側(cè)進(jìn)行推理的大模型,例如Deepseek R1。小模型(SLM)通常參數(shù)量比LLM少,設(shè)計(jì)上更側(cè)重于針對(duì)特定任務(wù)進(jìn)行微調(diào),如LLaMini。而AI推理的應(yīng)用中,特別是在端側(cè)設(shè)備上運(yùn)行時(shí),小模型與physical AI的結(jié)合,會(huì)給端側(cè)應(yīng)用帶來(lái)爆發(fā)式增長(zhǎng)。
與此同時(shí),模型不斷優(yōu)化也帶來(lái)了硬件設(shè)計(jì)的變革,從單一算力需求轉(zhuǎn)變?yōu)閷?duì)算力、存儲(chǔ)、中間通訊三者的平衡,新的硬件架構(gòu)是發(fā)展的必然趨勢(shì)。根據(jù)不同的處理器架構(gòu),黃音分別介紹了不同之處。CPU更適合處理串行數(shù)據(jù),NPU適合固定模型算法的并行加速,GPU適合通用的并行計(jì)算,隨著基礎(chǔ)模型的不斷優(yōu)化,邊緣側(cè)的AI應(yīng)用會(huì)有更多架構(gòu)組合的可能性。
而對(duì)于人工智能的端側(cè)應(yīng)用,推理只是其中的一個(gè)核心模塊,還有很多邊緣需求,比如通用計(jì)算和調(diào)度,云邊混合帶來(lái)的加密和隱私需求,圖形渲染圖像畫質(zhì)增強(qiáng)需求,功能安全和信息安全需求,設(shè)備自學(xué)習(xí)需求等。我們除了要追求每瓦算力,峰值算力和帶寬極致外,還應(yīng)該看到端側(cè)應(yīng)用是一個(gè)融合能力的應(yīng)用。真正的破局點(diǎn),是構(gòu)建一個(gè)可以持續(xù)適配算法演進(jìn)的架構(gòu)平臺(tái)。
Imagination GPU擅長(zhǎng)應(yīng)對(duì)邊緣和端側(cè)AI帶來(lái)的挑戰(zhàn)
Imagination作為全球領(lǐng)先的GPU IP供應(yīng)商,深耕圖形和AI,特別是針對(duì)邊緣和端側(cè)AI,Imagination的GPU技術(shù)具有高能效、可編程性、可擴(kuò)展性和靈活性等特點(diǎn)。現(xiàn)場(chǎng),黃音重點(diǎn)介紹了ImaginationD系列DXTP GPU和DXS GPU兩款產(chǎn)品及其在AI phone和AIPC上的應(yīng)用前景。
DXTP GPU可保證在智能手機(jī)和其他功耗受限設(shè)備上加速圖形和AI工作負(fù)載時(shí),保證全天候的電池續(xù)航。通過(guò)微架構(gòu)的優(yōu)化,相比前一代產(chǎn)品DXT,DXTP提供了更高的持續(xù)性能、更快的計(jì)算調(diào)度,并在幾何處理吞吐量方面提高了50%。目前,DXTP已經(jīng)被全球知名科技公司使用,在AI多數(shù)據(jù)類型處理、計(jì)算任務(wù)加速,以及本地內(nèi)存的支持上有突出表現(xiàn)。此外,它還支持LiteRT(前身是tensorflow Lite)主流AI框架,并在Imagination體系內(nèi)做了優(yōu)化,開發(fā)者可運(yùn)用它在Android設(shè)備上實(shí)現(xiàn)高性能AI應(yīng)用的部署。
DXS GPU則是專為處理駕駛艙、信息娛樂(lè)和高級(jí)駕駛輔助系統(tǒng)中的圖形和計(jì)算工作負(fù)載而打造的一款產(chǎn)品。相比于上一代GPU,IMG DXS為車輛中越來(lái)越常見的計(jì)算工作負(fù)載(如駕駛員監(jiān)控和防撞)提供了高達(dá)10倍的性能提升。與硬件配套的計(jì)算庫(kù)(imgBLAS、imgNN、imgFFT)可幫助軟件開發(fā)人員實(shí)現(xiàn)高達(dá)80%的GPU利用率。這也將加速常見計(jì)算工作負(fù)載的處理,如計(jì)算機(jī)視覺(jué)和ADAS系統(tǒng)感知數(shù)據(jù)的預(yù)處理和后處理。
在演講最后,對(duì)于什么將是符合“Physical AI”的終極硬件?黃音指出了三點(diǎn):一是效率,在圖形與AI計(jì)算上實(shí)現(xiàn)更優(yōu)的能效比與計(jì)算密度;二是深度嵌入式集成,最小化數(shù)據(jù)傳輸,匹配現(xiàn)代API擴(kuò)展;三是開發(fā)者與系統(tǒng)靈活性,是一款高度多用途的邊緣處理器,既可用于圖形,也可用于AI。她也透露到,Imagination今年也將有重磅產(chǎn)品推出,值得期待。
此外,在圓桌討論環(huán)節(jié),黃音與產(chǎn)業(yè)鏈伙伴圍繞AI對(duì)行業(yè)帶來(lái)的影響、生態(tài)合作、RISC-V等話題進(jìn)行了討論。黃音認(rèn)為AI快速發(fā)展驅(qū)動(dòng)了新的算力需求、硬件架構(gòu)的革新,而作為IP供應(yīng)商更需要與產(chǎn)業(yè)上下游伙伴合作,例如Imagination與多家RISC-V公司合作,優(yōu)化GPU適配主流AI框架和標(biāo)準(zhǔn)API接口等,希望幫助客戶打造差異化產(chǎn)品,實(shí)現(xiàn)快速上市。
-
慕尼黑
+關(guān)注
關(guān)注
0文章
150瀏覽量
18216 -
嵌入式設(shè)備
+關(guān)注
關(guān)注
0文章
116瀏覽量
17420 -
imagination
+關(guān)注
關(guān)注
1文章
600瀏覽量
62222
發(fā)布評(píng)論請(qǐng)先 登錄
龍芯2K3000 | 重塑工控嵌入式處理器性能邊界

聚徽智控——從嵌入式到邊緣計(jì)算:平板工控電腦的技術(shù)進(jìn)化論
算力網(wǎng)絡(luò)的“神經(jīng)突觸”:AI互聯(lián)技術(shù)如何重構(gòu)分布式訓(xùn)練范式

新品 | 26+6TOPS強(qiáng)悍算力!飛凌嵌入式FCU3501嵌入式控制單元發(fā)布

Imagination?宣布推出?E-Series GPU:開啟Edge AI?與圖形處理新時(shí)代

大算力芯片的生態(tài)突圍與算力革命
嵌入式主板開發(fā)詳細(xì)指南

DeepSeek推動(dòng)AI算力需求:800G光模塊的關(guān)鍵作用
從圖形處理到AI加速,一文看懂Imagination D系列GPU

信而泰CCL仿真:解鎖AI算力極限,智算中心網(wǎng)絡(luò)性能躍升之道

評(píng)論