女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

揭秘AI推理芯片的未來

穎脈Imgtec ? 2024-01-26 08:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:內容由半導體行業(yè)觀察(ID:icbank)編譯自design-reuse,謝謝。


人工智能行業(yè)包含一個受技術進步、社會需求和監(jiān)管考慮影響的動態(tài)環(huán)境。機器學習、自然語言處理和計算機視覺方面的技術進步加速了人工智能的發(fā)展和采用。社會對醫(yī)療保健、金融和制造等各個領域的自動化、個性化和效率的需求進一步推動了人工智能技術的融合。此外,不斷變化的監(jiān)管環(huán)境強調了人工智能部署道德、數據隱私和算法透明度的重要性,指導人工智能系統(tǒng)負責任的開發(fā)和應用。

人工智能行業(yè)將訓練和推理過程結合起來,以有效地創(chuàng)建和部署人工智能解決方案。人工智能推理和人工智能訓練都是整個人工智能生命周期不可或缺的組成部分,其重要性取決于具體的環(huán)境和應用。雖然人工智能訓練對于通過學習模式和從數據中提取見解來開發(fā)和微調模型至關重要,但人工智能推理在利用這些經過訓練的模型進行實時預測和決策方面發(fā)揮著至關重要的作用。人工智能推理的重要性日益增長(目前超過 80% 的人工智能任務)在于其在推動數據驅動的決策、個性化用戶體驗和跨行業(yè)運營效率方面發(fā)揮著關鍵作用。

高效的人工智能推理實施面臨著數據可用性、計算資源、算法復雜性、可解釋性和監(jiān)管合規(guī)性方面的挑戰(zhàn)。適應動態(tài)環(huán)境和管理可擴展性,同時控制成本會帶來額外的障礙。克服這些挑戰(zhàn)需要全面的策略,包括強大的數據管理實踐、硬件功能的進步和算法的改進。開發(fā)可解釋的人工智能模型并遵守道德和監(jiān)管準則對于建立用戶信任和確保合規(guī)性至關重要。此外,通過高效的運營實踐和技術創(chuàng)新來平衡資源分配和成本管理對于在不同行業(yè)領域實現(xiàn)可持續(xù)和有效的人工智能推理解決方案至關重要。通過自動化任務、增強預測性維護和實現(xiàn)高級分析,人工智能推理可以優(yōu)化流程、減少錯誤并改善資源分配。人工智能推理為自然語言處理提供動力,改善人與機器之間的溝通和理解。

它對制造業(yè)的影響包括預測性維護、質量控制和供應鏈管理、提高效率、減少浪費和提高產品質量,凸顯了其對行業(yè)運營的變革性影響。人工智能推理面臨高能耗、密集計算需求和實時處理限制等挑戰(zhàn),導致運營成本增加和環(huán)境影響。AI總功耗超過60%來自推理,推理需求的增加導致數據中心容量在兩年內增長了2.5倍(GAFA數據)。對于服務器來說,密集計算過程中產生的熱量需要復雜的冷卻系統(tǒng),這進一步增加了人工智能流程的整體能耗。此外,平衡高效實時處理與低延遲要求(服務器、高級駕駛輔助系統(tǒng) (ADAS) 或制造應用程序的強制要求)構成了重大挑戰(zhàn),需要先進的硬件設計和優(yōu)化的計算策略。在不影響準確性的情況下,優(yōu)先考慮可再生能源和環(huán)保舉措的節(jié)能解決方案對于減輕人工智能推理過程對環(huán)境的影響至關重要。

傳統(tǒng)的人工智能推理硬件設計,使用CPUGPU,由于人工智能算法的復雜性和特殊性,在實現(xiàn)能源效率方面面臨限制,導致高功耗(服務器每個多核單元數百瓦)。處理單元和內存之間低效的數據移動進一步影響能源效率和吞吐量;例如,訪問外部 DRAM 比訪問本地寄存器消耗的能量多 200 倍。最后,由于更高的計算需求,到 2025 年,使用 CPU 和 GPU 的下一代服務器的功耗可能高達 1,000 W。在資源有限的電池供電設備上部署 AI 推理更具挑戰(zhàn)性,因為最高效的設備基于 CPU 和 GPU 的設計功耗為 10 mW 到幾瓦,受到強大的吞吐量限制,限制了 AI 復雜性和最終用戶體驗。在能源效率與性能和精度要求之間取得平衡需要在設計過程中進行仔細權衡,從而需要全面的優(yōu)化策略。對復雜人工智能工作負載的硬件支持不足可能會影響能源效率和性能。可持續(xù)發(fā)展目標、降低成本目標和新用途推動了行業(yè)對節(jié)能人工智能推理解決方案不斷增長的需求。企業(yè)尋求可擴展的高性能解決方案來管理復雜的人工智能工作負載,而不會產生過多的能源成本。

另一方面,節(jié)能的人工智能推理將使移動和資源受限的設備能夠執(zhí)行復雜的任務,而不會快速耗盡電池,同時減少對基于云的處理的依賴,最大限度地減少數據傳輸和延遲問題。它將通過實時語言翻譯、個性化推薦和準確圖像識別等高級功能的新用途來增強用戶體驗,從而提高參與度和滿意度。為了克服 CPU 和 GPU 的限制,創(chuàng)新的硬件加速器專為 AI 推理工作負載而設計,可實現(xiàn)高效和優(yōu)化的處理,同時最大限度地減少能耗。此類加速器通過人工智能應用程序中使用的專用運算符(池化、激活函數、標準化等)實現(xiàn)優(yōu)化的數據流。數據流引擎是矩陣乘法單元,是一個大型處理元件陣列,能夠有效處理大型矩陣向量乘法、卷積和許多更復雜的運算,因為大多數神經網絡都基于矩陣乘法運算。為了進一步優(yōu)化能源效率,人工智能加速器采用了新技術,例如近內存計算。近內存計算將處理元件集成在內存子系統(tǒng)內,從而能夠在內存附近實現(xiàn)更快的數據處理,從而減少與數據傳輸相關的能耗。最近,使用“非標準”技術的新方法,例如內存計算或尖峰神經網絡(SNN),是實現(xiàn)高能效人工智能推理的最積極的解決方案。內存計算直接在內存內進行電路級計算,無需數據傳輸并提高處理速度。

處理可以以模擬或數字方式執(zhí)行,并實現(xiàn)不同的存儲技術,例如 SRAM、閃存或新的 NVM(RRAM、MRAM、PCRAM、FeFET 等)。這種方法對于涉及大型數據集的復雜人工智能任務特別有益。SNN 還代表了一種創(chuàng)新的人工智能推理方法:它們通常由通過尖峰進行通信的互連節(jié)點組成,能夠模擬復雜的時間過程和基于事件的計算,這對于處理時間敏感數據或模擬大腦等任務非常有用。利用近內存/內存計算或 SNN 的 AI 加速器為 AI 行業(yè)帶來重大影響,包括提高能源效率、提高處理速度和先進的模式識別功能。這些加速器推動硬件設計的優(yōu)化,從而創(chuàng)建針對特定人工智能工作負載量身定制的專用架構。此外,它們還促進了邊緣計算的進步,促進直接在邊緣設備上進行高效的人工智能處理并減少延遲。這些技術的變革潛力凸顯了它們在醫(yī)療保健和制造、汽車和消費電子產品等不同行業(yè)變革中的關鍵作用。高能效人工智能推理在醫(yī)療保健和汽車領域的集成產生了變革性的影響。在醫(yī)療保健領域,它通過快速數據分析促進更快的診斷和個性化患者護理,從而改善治療結果和量身定制的醫(yī)療干預措施。此外,它還可以開發(fā)遠程患者監(jiān)測系統(tǒng),確保對慢性病患者進行持續(xù)的健康跟蹤和主動干預。

此外,在藥物發(fā)現(xiàn)領域,節(jié)能的人工智能推理可以加快潛在候選藥物的識別,加速藥物研發(fā)進程,促進醫(yī)療和療法的創(chuàng)新。在汽車行業(yè),節(jié)能的人工智能推理在提升安全功能和自動駕駛能力方面發(fā)揮著至關重要的作用。它為車輛提供 ADAS 和實時碰撞檢測功能,從而增強整體道路安全。此外,它還有助于自動駕駛技術的發(fā)展,使車輛能夠根據實時數據分析做出明智的決策,從而改進導航系統(tǒng)和自動駕駛功能。此外,實施基于節(jié)能人工智能推理的預測性維護解決方案可以及早發(fā)現(xiàn)潛在的車輛問題,優(yōu)化性能,減少停機時間并延長車輛使用壽命。

促進可持續(xù)運營、優(yōu)化資源利用率和延長設備電池壽命的需求推動了行業(yè)對節(jié)能人工智能推理解決方案的關鍵需求。這些解決方案在促進環(huán)保實踐、降低運營成本和增強競爭優(yōu)勢方面發(fā)揮著至關重要的作用。通過促進邊緣計算應用并最大限度地減少能源消耗,節(jié)能的人工智能推理解決方案使企業(yè)能夠提高盈利能力、簡化流程并確保移動和物聯(lián)網設備的功能不間斷。滿足這一需求需要開發(fā)節(jié)能算法和優(yōu)化的硬件架構,這在很大程度上基于智能近內存/內存計算技術。許多新玩家?guī)е鴦?chuàng)新的計算解決方案進入市場,并承諾在從傳感器到數據中心的任何地方運行人工智能,并雄心勃勃地提供全新的用戶體驗。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    460

    文章

    52513

    瀏覽量

    440867
  • AI
    AI
    +關注

    關注

    88

    文章

    35152

    瀏覽量

    279841
  • 人工智能
    +關注

    關注

    1806

    文章

    49020

    瀏覽量

    249484
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AI推理的存儲,看好SRAM?

    看到了其前景并提前布局。AI推理也使得存儲HBM不再是唯一熱門,更多存儲芯片AI推理芯片結合,
    的頭像 發(fā)表于 03-03 08:51 ?1683次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>的存儲,看好SRAM?

    信而泰×DeepSeek:AI推理引擎驅動網絡智能診斷邁向 “自愈”時代

    DeepSeek-R1:強大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎技術研究有限公司開發(fā)的新一代AI大模型。其核心優(yōu)勢在于強大的推理引擎能力,融合了自然語言處理(
    發(fā)表于 07-16 15:29

    Nordic收購 Neuton.AI 關于產品技術的分析

    與 Nordic 的 nRF54 系列超低功耗無線 SoC 結合,使得即使是資源極為有限的設備也能高效運行邊緣 AI。Nordic 目前正在將 Neuton 深度集成到自身開發(fā)生態(tài)中,未來會提供更多工具、固件
    發(fā)表于 06-28 14:18

    谷歌第七代TPU Ironwood深度解讀:AI推理時代的硬件革命

    、架構設計的顛覆性創(chuàng)新 ? 首款推理專用TPU ? Ironwood是谷歌TPU系列中首款完全針對AI推理優(yōu)化的芯片,標志著AI
    的頭像 發(fā)表于 04-12 11:10 ?1833次閱讀
    谷歌第七代TPU Ironwood深度解讀:<b class='flag-5'>AI</b><b class='flag-5'>推理</b>時代的硬件革命

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理AI 模型新引擎?

    Cloud 客戶開放,將提供 256 芯片集群以及 9,216 芯片集群兩種配置選項。 ? 在核心亮點層面,Ironwood 堪稱谷歌首款專門為 AI 推理精心設計的 TPU
    的頭像 發(fā)表于 04-12 00:57 ?2435次閱讀

    聯(lián)發(fā)科、瑞芯微推陳出新,芯片新品助力邊緣AI能力強勢進階

    電子發(fā)燒友原創(chuàng) 章鷹 2025年2月以來,DeepSeek橫空出世,開源模型爆發(fā)(如DeepSeek、Mistral),降低企業(yè)在AI終端推理的成本,加速迭代。愛芯元智董事長仇肖莘表示,邊緣AI
    的頭像 發(fā)表于 04-10 00:13 ?2003次閱讀
    聯(lián)發(fā)科、瑞芯微推陳出新,<b class='flag-5'>芯片</b>新品助力邊緣<b class='flag-5'>AI</b>能力強勢進階

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......

    、關于FPGA的未來——“無限可能的未來世界” AI時代的FPGA未來前景如何?FPGA+AI如何重塑
    發(fā)表于 03-03 11:21

    黑芝麻智能芯片加速DeepSeek模型推理

    近日,黑芝麻智能宣布,其武當C1200家族芯片已成功完成DeepSeek模型推理的部署,而A2000芯片也將全面支持基于DeepSeek的多模態(tài)大模型推理。這一消息標志著黑芝麻智能在推
    的頭像 發(fā)表于 02-14 15:04 ?582次閱讀

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業(yè)節(jié)省了數百萬美元。
    的頭像 發(fā)表于 02-08 09:59 ?718次閱讀
    使用NVIDIA<b class='flag-5'>推理</b>平臺提高<b class='flag-5'>AI</b><b class='flag-5'>推理</b>性能

    生成式AI推理技術、市場與未來

    (reasoning)能力,這一轉變將極大推動上層應用的發(fā)展。 紅杉資本近期指出,在可預見的未來,邏輯推理推理時計算將是一個重要主題,并開啟生成式AI的下一階段。新一輪競賽已然開始。
    的頭像 發(fā)表于 01-20 11:16 ?845次閱讀
    生成式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>技術、市場與<b class='flag-5'>未來</b>

    AI推理CPU當道,Arm驅動高效引擎

    AI的訓練和推理共同鑄就了其無與倫比的處理能力。在AI訓練方面,GPU因其出色的并行計算能力贏得了業(yè)界的青睞,成為了當前AI大模型最熱門的芯片
    的頭像 發(fā)表于 11-13 14:34 ?3391次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>CPU當道,Arm驅動高效引擎

    AI for Science:人工智能驅動科學創(chuàng)新》第二章AI for Science的技術支撐學習心得

    的訓練和推理提供了強大的算力支持,使得AI在科學研究中的應用更加廣泛和深入。 3. 數據驅動的研究范式 第二章還強調了數據在AI for Science中的核心地位。數據是AI模型的輸
    發(fā)表于 10-14 09:16

    黃仁勛:AI未來關鍵在于推理,芯片成本驟降成核心要素

     英偉達CEO黃仁勛近期強調,人工智能(AI)的未來趨勢將聚焦于具備“推理”能力的服務,但這一愿景的實現(xiàn)需以降低計算成本為前提。這一觀點是在他與Arm首席執(zhí)行官Rene Haas的對話中提出的,該對話由Arm在其官方網站上發(fā)布。
    的頭像 發(fā)表于 10-10 14:35 ?713次閱讀

    AMD助力HyperAccel開發(fā)全新AI推理服務器

    提高成本效率。HyperAccel 針對新興的生成式 AI 應用提供超級加速的芯片 IP/解決方案。HyperAccel 已經打造出一個快速、高效且低成本的推理系統(tǒng),加速了基于轉換器的大型語言模型
    的頭像 發(fā)表于 09-18 09:37 ?882次閱讀
    AMD助力HyperAccel開發(fā)全新<b class='flag-5'>AI</b><b class='flag-5'>推理</b>服務器

    揭秘中國汽車芯片市場:主要企業(yè)有哪些?

    揭秘中國汽車芯片市場:主要企業(yè)有哪些?
    的頭像 發(fā)表于 07-19 10:12 ?895次閱讀
    <b class='flag-5'>揭秘</b>中國汽車<b class='flag-5'>芯片</b>市場:主要企業(yè)有哪些?