從ChatGPT引發的廣泛關注,再到大量的云端AI服務上線,利用人工智能提升效率、優化流程正在變得唾手可得。但在大多數人印象中,AI應用意味著背后龐大的服務器集群夜以繼日的運算,需要將自己的信息共享至云端,這與人們關心的隱私與信息安全背道而馳。
就在COMPUTEX 2023期間,英特爾提出了一種全新的可能性,它可以讓未來每一臺筆記本、臺式機或者其他終端設備,在低功耗的前提下也能擁有不錯的AI算力,而這個算力模塊稱為英特爾VPU。
與CPU、GPU不同,英特爾VPU將更專注于AI加速,特別是稀疏化處理的運算,并且具有低功耗、低延遲的諸多特點,不僅可以輕松處理視頻背景虛化、智能語音降噪等判定式AI,加速StableDiffusion這樣生成式AI也沒有問題。
重點是,英特爾已經確認下一代處理器MeteorLake將集成VPU,這意味著未來的輕薄本也同樣具備一定的AI算力,實現不曾想象的AI操作。那么究竟是什么樣動力,讓英特爾如此積極的駛向終端AI的新賽道?
AI的質變
盡管英特爾以CPU和IDM模式而聞名,但在AI硬件領域英特爾也同樣進行了長時間的積累,例如在CPU中添加AI加速的相關指令集,并在架構上針對AI不斷進行優化,已經發展到第四代的英特爾至強可擴展處理器就是其中很好的例子,從2017年開始,至強可擴展處理器就不斷增加了深度學習加速、矩陣計算擴展AMX等功能。
而今,英特爾在AI領域即擁有負責高端深度學習加速器Gaudi系列的Habana Labs,也擁有可以制造低功耗視覺處理單元的Movidius。在大量的AI經驗積累下,英特爾開始嘗試讓消費產品涉及AI加速功能。也正是從IceLake架構第10代酷睿開始,CPU開始搭載AI加速單元GNA,用于處理神經噪聲抑制、背景模糊等功能判定式AI加速,讓筆記本開始走向智能化。
同時AI需求在近2年內變化非常明顯。以降噪功能為例,2年前降噪計算復雜度與現在相比,相差將近50倍。類似StableDiffusion這樣的生成式AI加入,對PC性能需求提升了一個唯獨。如何在不插電的筆記本中流暢運行更高負荷的AI應用成了新問題,VPU正是為了填補這個空白而誕生。
即將實裝MeteorLake的英特爾VPU其實已經進階到了第三代,這款源自于英特爾全資子公司Movidius的處理模塊最早計劃應用于無人機、相機、VR設備等基于視覺深度學習和AI加速。在2017年,VPU的前身Myriad X就能實現1TOPS的吞吐量,這無疑讓人們對全新的VPU性能表現抱有更多期待。
同時,VPU不是旗艦處理器的獨占功能,它將出現在Meteor Lake的所有SKU中。這意味著VPU帶來的AI加速功能將是處理器一項基礎功能,與集顯、Thunderbolt4等一樣,成為CPU中不可缺少的一部分。
但VPU的加入不代表著之前集成在CPU上的AI技術會劃上句號。恰恰相反,由于AI應用場景的復雜性,英特爾將AI使用場景分成了三個部分,其中CPU負責處理諸如語音降噪、變聲這樣的輕負載、低延遲、高響應的AI加速,GPU負責重負載且對響應需求不高的AI模型加速。VPU正好介于CPU和GPU之間,即擁有低功耗、快速響應的特點,也可以負責基礎的視覺處理,比如流媒體中的手勢識別,背景虛化等等。
在Meteor Lake中,VPU和CPU、GPU將相輔相成,不同的AI應用場景會指派不同的處理單元應對,確保AI加速效率最大化。同時從功耗上來看,VPU則是要求最低的,次之是CPU,再次之是GPU。VPU的加入能給注重續航的筆記本在獲得新功能的同時,保證筆記本的續航和體驗順暢。
為此英特爾也特意準備了一個DEMO演示。一款只有集顯的MeteorLake開發筆記本,在StableDiffusion的文字生成圖片模型內,僅使用了20秒就完成了工作。這個過程中,MeteorLake的VPU主要承載了VNET模塊的運行,GPU則負責Encoder模塊運行,CPU則負責軟件運行的其他部分,整個系統被得到充分利用,實現了在當下只有依靠高性能獨立顯卡PC才能完成的工作。
軟硬件相輔相成
生成式AI的快速成長自然也會帶來不少問題,比如的AI開發界面,AI庫以及AI模型標準化或者統一化上需要時間,不同軟件、模型、開源項目之間各自為戰,雖然百花齊放,但很難形成統一管理,會影響資源調用的效率。比如時下熱門的Stable Diffusion也僅誕生于2022年,作為一個開源項目,還有大量的工作需要適配。
在行業內擁有龐大影響力的英特爾深刻了解軟硬件結合的重要性,在宣布VPU進駐MeteorLake的同時,英特爾也已經緊鑼密鼓的在軟件層面、軟件合作伙伴方面展開行動。
從軟件層面來看,VPU身后已經具備了整套軟件基礎,英特爾OpenVINO工具可以幫助VPU在應對不同領域的AI網絡模型時,進需要通過統一的軟件接口實現。OpenVINO相當于一個包裹,可以幫助應用把底層不同架構之間的異構計算的差異統一封裝,以實現更廣泛的應用適配。
同時英特爾也提供了對目前主流標準的支持,比如通用的網絡視頻格式ONNX,W3C允許通過瀏覽器進行神經網絡推理硬件加速的WebNN API,微軟基于DirectX12的機器學習底層推理接口DirectML等等。
同時英特爾也已經與軟件開發商展開緊密合作,包括Adobe、微軟、字節跳動、騰訊在內的100多家軟件開發商已經開始進行AI相關方面的合作。
得益于VPU非常省電的特性,使得許多終端可以在僅使用電池續航的狀態下,也能擁有高效的表現,原本需要CPU、GPU高功耗合力進行的AI任務,現在僅使用VPU即可完成。比如在執行GPU渲染的過程中接通會議電話,通過VPU介入流暢的實現降噪、背景替換等工作。
再比如Adobe上的自動摳圖、濾鏡、文字生成圖片等最新功能,通過VPU運行也已經可以獲得很好的效果。另外,Blender、虛幻引擎等軟件也已經對VPU展開了適配。
在龐大的安裝量推動下,英特爾在產品投向市場之前已經做足了軟件層面適配的鋪墊。筆記本VPU與CPU、GPU以及其他功能模塊一起,成為下一代PC的標準配置,也進而推動了整個AI生態的普及與標準化,從而推動AI應用的持續發展,最終實現了良性循環的局面。
開創AI體驗新局面
在過去兩年中,英特爾進步非常顯著,通過12、13代酷睿的兩代高性能混合架構設計,英特爾已經與OEM合作完成了超過700個系統設計,交付了1.2億個高性能混合架構處理芯片,使之在短時間內快速普及。
但對于英特爾而言這還遠遠不夠,按照英特爾CEO帕特·基辛格提出的IDM2.0戰略,英特爾還會在四年里跨越5個制程工藝節點,從現在的Intel7邁進MeteorLake開始使用的Intel4,緊接著Intel20A和Intel18A也會相繼到來。
不僅如此,英特爾也將使用第三方代工的制造工藝來完善處理器產品,從MeteorLake開始使用的分離式模塊架構,讓處理器設計不再一體化,而是不同單元會成為不同的獨立設計模塊、不同的制造工藝和升級策略,實現效率的最大化,英特爾VPU的加入就很好的印證了這一點。
在即將到來的MeteorLake上,英特爾將從另一個維度提升處理器的每瓦性能表現,讓處理器獲得表現更好的CPU、GPU,并加入獨立的VPU單元提升PC整體對AI性能優化,從而帶動PC體驗的又一輪升級。
在過去幾年中,我們經歷了Wi-Fi6、處理器混合架構、Thunderbolt4接口的快速普及,均得益于英特爾將新技術無保留的放入主流的處理器設計中。英特爾VPU則成為下一個增長點,憑借著新一輪處理器升級帶來的龐大體量,不插電、低功耗環境下使用流暢的AI加速體驗,無疑會給現有的AI軟件生態、AI標準制定帶來全新的變化。英特爾也將再次成為整個PC軟硬件生態升級的重要推手。
審核編輯黃宇
-
英特爾
+關注
關注
61文章
10164瀏覽量
173866 -
cpu
+關注
關注
68文章
11030瀏覽量
215893 -
AI
+關注
關注
87文章
34114瀏覽量
275217 -
vpu
+關注
關注
0文章
15瀏覽量
11902
發布評論請先 登錄
能在Meteor Lake平臺上使用SDK 3.5嗎?
中興通訊加速算力普惠和AI應用普及
【「零基礎開發AI Agent」閱讀體驗】+ 入門篇學習
Intel-Altera FPGA:通信行業的加速引擎,開啟高速互聯新時代
在英特爾酷睿Ultra AI PC上部署多種圖像生成模型

FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......
當我問DeepSeek AI爆發時代的FPGA是否重要?答案是......
Gupshup加速企業AI應用進程
NVIDIA AI正加速推進藥物研發
英特爾計劃明年AI PC出貨一億臺
AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感
NVIDIA與思科合作打造企業級生成式AI基礎設施
Lunar Lake:NPU性能全面提升,能耗也大幅降低,綜合AI算力提升至120TOPS

在英特爾酷睿Ultra處理器上優化和部署YOLOv8模型

評論