女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

能效比達(dá)2TOPS/W!解密邊緣AI芯片低功耗設(shè)計(jì)之法

Carol Li ? 來源:電子發(fā)燒友 ? 作者:李彎彎 ? 2025-05-17 00:07 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)邊緣AI芯片低功耗設(shè)計(jì)是其在移動設(shè)備、物聯(lián)網(wǎng)終端等資源受限場景中落地的關(guān)鍵。在物聯(lián)網(wǎng)、可穿戴設(shè)備、智能家居等對功耗敏感的應(yīng)用場景中,低功耗設(shè)計(jì)直接決定了設(shè)備的續(xù)航能力、部署成本及用戶體驗(yàn)。

為什么邊緣AI芯片需要低功耗設(shè)計(jì)?

從應(yīng)用場景層面來看,首先是設(shè)備供電受限,如智能手表、無線傳感器、可穿戴設(shè)備等依賴電池供電,低功耗設(shè)計(jì)直接決定續(xù)航時(shí)間。在太陽能、射頻能量收集等自供電系統(tǒng)中,芯片功耗需低于能量收集速率,否則設(shè)備無法持續(xù)運(yùn)行。

其二是部署環(huán)境苛刻,在工業(yè)監(jiān)測、農(nóng)業(yè)物聯(lián)網(wǎng)等場景中,設(shè)備可能部署在難以更換電池或無法接線的區(qū)域。例如,橋梁結(jié)構(gòu)監(jiān)測傳感器需連續(xù)工作數(shù)年,功耗需低于1mW。功耗過高會導(dǎo)致芯片發(fā)熱,影響穩(wěn)定性與壽命。例如,在汽車電子中,芯片需滿足AEC-Q100標(biāo)準(zhǔn),低功耗設(shè)計(jì)可減少熱應(yīng)力導(dǎo)致的失效風(fēng)險(xiǎn)。

從技術(shù)發(fā)展層面來看,首先,能效比(TOPS/W)是核心指標(biāo),邊緣AI芯片需在有限功耗下提供高算力。例如,特斯拉FSD芯片以72W功耗實(shí)現(xiàn)144TOPS算力,能效比達(dá)2TOPS/W,滿足自動駕駛實(shí)時(shí)性需求。低功耗設(shè)計(jì)可突破“功耗墻”限制。例如,傳統(tǒng)GPU在移動端因功耗過高(>20W)難以應(yīng)用,而專用邊緣AI芯片可將功耗壓縮至數(shù)百mW級。

其次,散熱與封裝成本約束,高功耗芯片需配備散熱片或風(fēng)扇,增加體積與成本。例如,桌面GPU功耗可達(dá)300W,需主動散熱;而邊緣設(shè)備芯片功耗需控制在5W以內(nèi),可采用被動散熱。低功耗設(shè)計(jì)可簡化封裝要求。例如,采用Chiplet技術(shù)的邊緣AI芯片通過2.5D封裝降低互連功耗,同時(shí)減少對散熱材料的需求。

邊緣AI芯片低功耗設(shè)計(jì)方法

從硬件架構(gòu)優(yōu)化角度來看,如專用加速器NPU、DPU等,設(shè)計(jì)針對AI運(yùn)算(如矩陣乘加)的專用電路,提升能效比。例如,Google TPU通過脈動陣列減少通用計(jì)算單元的冗余操作。如異構(gòu)計(jì)算架構(gòu),結(jié)合CPU(控制)、GPU(并行計(jì)算)、NPU(AI推理)等模塊,按任務(wù)類型動態(tài)分配計(jì)算負(fù)載。輕量級任務(wù)由CPU處理,復(fù)雜模型交由NPU,避免資源浪費(fèi)。

還有一些創(chuàng)新架構(gòu)設(shè)計(jì)方向,如存算一體化,減少數(shù)據(jù)搬運(yùn),在存儲單元附近直接完成計(jì)算,降低I/O功耗。技術(shù)路徑實(shí)現(xiàn)方面有存內(nèi)計(jì)算、近內(nèi)存計(jì)算。再如事件驅(qū)動架構(gòu),采用脈沖神經(jīng)網(wǎng)絡(luò)(SNN)或事件相機(jī)傳感器,僅在數(shù)據(jù)變化時(shí)觸發(fā)計(jì)算,減少靜態(tài)功耗。

算法與模型優(yōu)化角度來看,如模型壓縮技術(shù),剪枝,移除冗余神經(jīng)元或權(quán)重(稀疏化),降低計(jì)算量;量化,將32位浮點(diǎn)模型轉(zhuǎn)為8位整數(shù),減少乘法器和內(nèi)存訪問能耗;知識蒸餾,用大模型訓(xùn)練輕量級學(xué)生模型,保持精度同時(shí)降低計(jì)算需求。
??
如輕量級網(wǎng)絡(luò)設(shè)計(jì),使用MobileNet(深度可分離卷積)、EfficientNet(復(fù)合縮放)等結(jié)構(gòu),平衡精度與計(jì)算量。再如動態(tài)推理,在推理過程中設(shè)置檢查點(diǎn),若低層已足夠準(zhǔn)確,則提前終止計(jì)算。近似計(jì)算,允許非關(guān)鍵計(jì)算結(jié)果存在誤差,簡化運(yùn)算(如低精度浮點(diǎn)、舍入策略)。

從動態(tài)電源管理角度,DVFS(動態(tài)電壓頻率調(diào)節(jié)),根據(jù)負(fù)載實(shí)時(shí)調(diào)整電壓和頻率,例如在空閑時(shí)進(jìn)入低功耗模式(如C6睡眠狀態(tài))。多電源域劃分,將芯片劃分為多個(gè)電源域,按需開啟或關(guān)閉(如攝像頭模塊僅在檢測到運(yùn)動時(shí)供電)。自適應(yīng)功耗策略,結(jié)合負(fù)載預(yù)測(如LSTM預(yù)測任務(wù)周期),動態(tài)調(diào)整電源狀態(tài)。

還有軟件與系統(tǒng)協(xié)同方面,編譯器優(yōu)化,通過指令級并行(ILP)優(yōu)化、內(nèi)存訪問合并,減少計(jì)算周期和能耗。操作系統(tǒng)調(diào)度,任務(wù)級功耗管理,優(yōu)先調(diào)度低功耗核心處理簡單任務(wù),高負(fù)載時(shí)喚醒高性能核心。應(yīng)用層策略,喚醒詞檢測(如Alexa的Always-On模式),僅運(yùn)行輕量級模型,待檢測到關(guān)鍵詞后喚醒主模型。

小結(jié):邊緣AI芯片低功耗設(shè)計(jì)是其在真實(shí)場景中落地的必要條件,直接決定了設(shè)備的可用性、經(jīng)濟(jì)性和可持續(xù)性。通過硬件架構(gòu)、算法優(yōu)化、制程工藝等多維度協(xié)同,邊緣AI芯片得以在毫瓦級甚至微瓦級功耗下運(yùn)行,滿足電池供電、實(shí)時(shí)響應(yīng)、低成本部署等核心需求。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 邊緣AI
    +關(guān)注

    關(guān)注

    0

    文章

    146

    瀏覽量

    5334
收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    輕松上手邊緣AI:MemryX MX3+結(jié)合Orange Pi 5 Plus的C/C++實(shí)戰(zhàn)指南

    AI邊緣計(jì)算快速發(fā)展的時(shí)代,MemryX MX3+ 加速卡憑借其 20 TOPS 的強(qiáng)大性能和低功耗(5 TFLOPS/W),成為
    的頭像 發(fā)表于 05-28 08:01 ?273次閱讀
    輕松上手<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>:MemryX MX3+結(jié)合Orange Pi 5 Plus的C/C++實(shí)戰(zhàn)指南

    和算力提升的衡量方法

    一、的衡量方法 定義與計(jì)算公式? (EER)定義為制冷量與輸入功率的比值,計(jì)算公式為
    的頭像 發(fā)表于 04-28 07:47 ?261次閱讀
    <b class='flag-5'>能</b><b class='flag-5'>效</b><b class='flag-5'>比</b>和算力提升的衡量方法

    6TOPS算力NPU加持!RK3588如何重塑8K顯示的邊緣計(jì)算新邊界

    框架,如TensorFlow、PyTorch等。這種架構(gòu)設(shè)計(jì)使得芯片在處理AI任務(wù)時(shí)能夠?qū)崿F(xiàn)高效的并行計(jì)算,極大地提升了運(yùn)算效率。在邊緣計(jì)算場景中,無論是智慧城市的交通大屏,還是工業(yè)產(chǎn)線的實(shí)時(shí)監(jiān)控
    發(fā)表于 04-18 15:32

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開發(fā)

    低功耗特性。搭載 Renesas 獨(dú)有的 DRP-AI 加速器,支持 15 Sparse TOPSAI 計(jì)算能力,使其在計(jì)算機(jī)視覺、邊緣
    發(fā)表于 03-19 17:54

    炬芯科技ATS362X 低功耗大算力AI音頻芯片

    的 ATS362X端側(cè)AI芯片 現(xiàn)正式發(fā)布。該芯片憑借 三核異構(gòu)架構(gòu)、24bit無損音質(zhì)和6.4 TOPS/W的超高能
    的頭像 發(fā)表于 03-10 15:05 ?765次閱讀
    炬芯科技ATS362X <b class='flag-5'>低功耗</b>大算力<b class='flag-5'>AI</b>音頻<b class='flag-5'>芯片</b>

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測......

    的國產(chǎn)化。 5.未來發(fā)展趨勢? 高性能與低功耗并重:未來,F(xiàn)PGA將朝著更高性能、更低功耗的方向發(fā)展,以滿足AI應(yīng)用對算力和的雙重需求。
    發(fā)表于 03-03 11:21

    AI邊緣網(wǎng)關(guān):開啟智能時(shí)代的新藍(lán)海

    ,可完成電力負(fù)荷精準(zhǔn)預(yù)測、故障快速定位。據(jù)市場研究機(jī)構(gòu)預(yù)測,到2025年,AI邊緣網(wǎng)關(guān)市場規(guī)模將突破千億美元,年復(fù)合增長率超過60%。 產(chǎn)業(yè)新機(jī)遇已經(jīng)顯現(xiàn)。對于硬件制造商,需要開發(fā)更高性能、更低功耗
    發(fā)表于 02-15 11:41

    進(jìn)迭時(shí)空 K1 系列 8 核 64 位 RISC - V AI CPU 芯片介紹

    在不同 AI 平臺上應(yīng)用。(四)領(lǐng)先的算力能架構(gòu)設(shè)計(jì) :RISC - V 架構(gòu)的精簡和卓越的微架構(gòu)設(shè)計(jì)。同負(fù)載場景功耗只有 ARM 芯片的 80%。
    發(fā)表于 01-06 17:37

    低功耗SOC芯片的優(yōu)勢

    在現(xiàn)代電子設(shè)備中,低功耗SOC芯片扮演著越來越重要的角色。它們不僅提高了設(shè)備的,還為小型化、高性能和成本效益提供了可能。 1.
    的頭像 發(fā)表于 10-31 14:52 ?1218次閱讀

    Orin芯片功耗分析

    隨著自動駕駛技術(shù)的飛速發(fā)展,對計(jì)算平臺的性能和功耗要求也越來越高。NVIDIA的Orin芯片作為自動駕駛領(lǐng)域的重要參與者,其功耗表現(xiàn)對于整個(gè)系統(tǒng)的
    的頭像 發(fā)表于 10-27 15:45 ?1824次閱讀

    聯(lián)發(fā)科天璣9400發(fā)布:與端側(cè)AI引領(lǐng)移動芯片行業(yè)革新

    AI大模型的推動下,智能手機(jī)市場的高端化進(jìn)程進(jìn)一步加速,旗艦機(jī)型的競爭已不再單純依賴于“大力飛磚”式的極限性能比拼,而是更加注重綜合素質(zhì)的提升。特別是在手機(jī)芯片領(lǐng)域,高性能與低功耗、高能
    的頭像 發(fā)表于 10-12 15:56 ?1033次閱讀

    科技新突破:首款支持多模態(tài)存算一體AI芯片成功問世

    存算一體介質(zhì),通過存儲單元和計(jì)算單元的深度融合,采用22nm成熟工藝制程,有效把控制造成本。與傳統(tǒng)架構(gòu)下的AI芯片相比,該款芯片在算力、
    發(fā)表于 09-26 13:51 ?623次閱讀
    科技新突破:首款支持多模態(tài)存算一體<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>成功問世

    柵極驅(qū)動芯片選型低功耗原因

    ,減少能源浪費(fèi),并降低設(shè)備的運(yùn)行成本。 2. 提升 柵極驅(qū)動芯片作為功率轉(zhuǎn)換和驅(qū)動控制的關(guān)鍵元件,其功耗直接影響整個(gè)系統(tǒng)的
    的頭像 發(fā)表于 09-18 09:20 ?788次閱讀

    基于瑞薩RZ/V2H AI微處理器的解決方案:高性能視覺AI系統(tǒng)

    RZ/V2H嵌入式AI微處理器,采用瑞薩最新的DRP-AI3技術(shù),可提供高達(dá)8TOPS(Dense模型)/80TOPS(sparse模型)的
    發(fā)表于 07-02 18:36 ?831次閱讀
    基于瑞薩RZ/V<b class='flag-5'>2</b>H <b class='flag-5'>AI</b>微處理器的解決方案:高性能視覺<b class='flag-5'>AI</b>系統(tǒng)

    推出最新的邊緣AI服務(wù)器及內(nèi)置耐AI芯片的PC設(shè)備

    - 耐邊緣 AI 服務(wù)器 KNEO 330 為中小企業(yè)帶來 30-40% 的成本節(jié)省,同兼顧隱私和安全性。- 耐邊緣 GPT
    的頭像 發(fā)表于 06-05 10:21 ?1037次閱讀