電子發燒友網報道(文/李彎彎)NPU是一種專門為人工智能(AI)計算設計的處理器,主要用于高效執行神經網絡相關的運算(如矩陣乘法、卷積、激活函數等)。相較于傳統CPU/GPU,NPU在能效比和計算速度上更具優勢,尤其適合移動設備、邊緣計算和嵌入式AI場景。
NPU有幾大核心特點:其一是專用架構,針對神經網絡計算優化,支持并行處理大量矩陣運算(如INT8/FP16低精度計算),典型操作包括卷積、池化、注意力機制(Transformer)等;其二是高能效比,相比GPU,NPU的功耗更低,適合手機、IoT設備等對續航要求高的場景;其三是低延遲,專為AI推理(Inference)和訓練(Training)優化,減少數據搬運開銷;其四是異構計算,常與CPU、GPU、DSP等協同工作(如手機SoC中的“AI引擎”)。
NPU廣泛應用于各類AI驅動的設備與系統,典型場景包括:智能手機,實現實時圖像增強(如華為麒麟芯片的AI拍照)、語音助手、AR/VR交互等;可穿戴設備,支持低功耗的本地化AI計算(如智能手表的健康監測)。
自動駕駛,處理傳感器數據,實現實時物體檢測、路徑規劃和決策(如特斯拉FSD芯片)。典算力需求方面,L4級自動駕駛車輛NPU算力超1000 TOPS。
邊緣計算,如智能攝像頭,人臉識別、異常行為檢測。物聯網設備,本地化語音助手(如智能音箱的喚醒詞識別)。
數據中心,加速AI模型訓練和推理,典型應用如谷歌TPU(張量處理單元)。工業質檢,推理時延壓縮至20ms內,部署量年增120%。
典型NPU芯片有,如在移動端有華為麒麟芯片(達芬奇NPU),用于手機AI拍照、語音識別等;高通Hexagon DSP+NPU(驍龍平臺),支持AI降噪、影像增強;蘋果神經網絡引擎(A/M系列芯片),Face ID、Siri等功能的底層支持。
在邊緣計算和自動駕駛側有特斯拉FSD芯片,內置NPU處理自動駕駛視覺模型;地平線征程芯片(BPU架構),用于智能駕駛感知計算。
在云端,有寒武紀MLU系列,云端AI訓練/推理加速;英偉達Grace Hopper(集成NPU模塊),大模型推理。
NPU的關鍵技術包括量化壓縮,支持INT4/INT8低精度計算,提升能效;稀疏計算,跳過零值計算,加速稀疏模型(如Pruning后的網絡);編譯器優化,專用工具鏈(如華為Ascend CANN、高通AI Engine)將框架(TensorFlow/PyTorch)模型轉換為NPU指令。
從趨勢上來看,NPU有幾個明顯的發展方向:光電融合計算,結合光子學技術,進一步提升算力和能效;神經形態芯片,模仿生物神經元結構,實現更低功耗的AI計算;Chiplet技術,通過多NPU互聯提升算力(如Cerebras的Wafer級芯片)。
總的來看,NPU作為AI計算的核心硬件,正深刻改變著人工智能技術的落地方式。其高并行性、低功耗和硬件加速能力,使其成為移動設備、自動駕駛、邊緣計算等領域的首選解決方案。隨著技術演進和市場需求的爆發,NPU將在未來AI生態中扮演更加重要的角色。
-
gpu
+關注
關注
28文章
4909瀏覽量
130632 -
AI
+關注
關注
87文章
34146瀏覽量
275283 -
NPU
+關注
關注
2文章
319瀏覽量
19487
發布評論請先 登錄
CPU\GPU引領,國產AI PC進階

iTOP-3588S開發板四核心架構GPU內置GPU可以完全兼容0penGLES1.1、2.0和3.2。
【新品發布】國產實力破局!算力 “卷王” HZHY-AI210G,體積小巧,讓智能無人設備輕裝上陣

2024年GPU出貨量增長顯著,超越CPU
聞泰科技新戰略、新發展:輕裝上陣,聚焦半導體賽道
NPU的工作原理解析
NPU技術如何提升AI性能
什么是NPU芯片及其功能
NPU與GPU的性能對比
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽
什么是NPU?什么場景需要配置NPU?


名單公布!【書籍評測活動NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構分析
輕裝上陣 小而不凡,道通智能發布EVO Lite行業系列無人機

評論