女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

人工智能芯片趨向于軟硬件協同設計的模式

工程師鄧生 ? 來源:Semi Connect ? 作者:Belle ? 2022-08-25 10:23 ? 次閱讀

目前,人工智能領域已成為最受關注的熱點之一。人工智能領域是通過對計算機的研究與開發,使得其具備類似于人類智能的,對環境的輸入做出有意義的判斷反應的研究應用領域。決定人工智能質量的因素往往是計算能力以及數據量的大小,而實現人工智能的方式則是機器學習,讓機器通過訓練和學習逐漸逼近我們希望其實現的效果。隨著處理器能力以及數據量的飛速增長,機器學習的方式也在發生革命性的變化,深度學習的概念被引入。深度學習由于其多層次形態,從而增強了其非線性程度,可以帶來更強的擬合能力。此外,其類似于仿生學的逐層自動提取特征的過程,保證了所提取特征的質量與豐富性,使得其性能相較于傳統的機器學習算法有了質的提升。

隨著模型算法的發展,模型所能實現的性能逐步提升, 而模型本身的深度和復雜度也大大增加。以大規模圖像識別競賽(ILSVRC)為例,2012年多倫多大學的Alex Krizhecsky 隨同其倒是Geoffrey Hinton 發布的 AlexNet 以83.0%的Top5分類準確率奪得冠軍,相較于之前傳統模型的最佳性能提升了百分之十幾。AlexNet 本身是一個具有5層卷積層和3層全連接層的卷積神經網絡,包含有6100萬個權重參數和7.24億次乘加運算。2017年為止,最復雜的網絡模型層數已超過1000層,權重參數及乘加運算次數都比AlexNet提升了幾個數量級,而所能實現的識別準確率也已經超越人眼。

對于最近打敗眾多人類圍棋高手的阿爾法圍棋(AlphaGo),在其打敗李在石的第一版分布式實現版本中,其復雜的決策算法模型需要1300多個CPU和280個GPU來提供算力的支撐。由此可見,面對日益復雜的人工智能算法,要滿足嚴格的功耗與實時性需求,需要有強大的處理器作為支持;因此對處理器芯片的精細化設計,成為提升芯片計算功能,滿足應用需求的必要條件。

通常來講,無論是對于人工智能的模型訓練還是前向推斷應用過程,處理器芯片的計算速度都是需要首先考慮的指標;而在某些諸如嵌入式移動端的低功耗場景中,對于硬件計算的功耗也需要加以嚴格的控制。傳統的CPU由于其串行執行的方式,在應對數據與計算密集型的人工智能算法時顯得捉襟見肘。因此,增加處理器計算的并行度成為性能提升的一個主要方向。英偉達提出了通用計算GPU(GPGPU)的概念,將具有大量可并行計算流處理器的GPU運用到人工智能算法的研發過程中, 并提供了成熟而穩定的諸如CUDA和cuDNN的軟件環境支持。由于GPU強大的計算能力,在關注模型準確度和以數據中心及服務器環境為主的模型訓練場景中,GPU得到了廣泛的應用。但同時我們也注意到,常見的GPU板卡功耗高達200-300W,這使得其在需要低功耗場景中的應用受到局限。因此,針對應用場景和算法類型,對芯片內部結構進行定制化的設計,從而提升芯片整體的能效比,成為人工智能芯片發展的另一主流方向。

通常而言,對于某一類型的人工智能算法,其往往具備可劃分的特性,并且劃分的子算法塊具有一定的相似性。以圖像應用中常見的卷積神經網絡為例,運算最密集的卷積層就可以抽象為滑窗類型的乘加操作,而滑窗的大小及步幅,計算通道數的大小等均可以被抽象為可配置的參數。在硬件結構的設計過程中,往往會針對算法劃分及抽象的方式,在計算通路和存儲結構上進行定制化,可配置的設計。大部分研究者會采用FPGA芯片實現的方式,快速地迭代開發出加速硬件結構。多家研究機構已紛紛在頂級學術會議上發布了基于FPGA的加速結構設計,而業界企業也都開始將常見的算法模型通過FPGA加速器實現的形式部署到應用端,并且實現了較好的性能和較低的功耗。下一步,我們也可以將計算及存儲核心部分進行電路固化,以專用集成電路ASIC)的方式實現,以達到更高的能效比。目前已知的優秀ASIC芯片設計,已能在實現數百GOPS(每秒十億次運算數)級別計算能力的情況下將功耗控制在毫瓦級別。ASIC在具備廣泛應用市場的前提下,具有高能效比,量產成本低的諸多優勢,但其一次性的工程費用及較大的開發成本,在快速的算法演進過程中往往會具有一定風險。因此,針對不同的研發及市場需求,應該選取不同的平臺予以實現。

近年來,針對硬件實現的算法優化也在不斷發展,包括數據量化,模型稀疏化等多項技術都取得了進展;而這些技術都有助于降低人工智能芯片的片上計算資源及存儲帶寬限制,以更低的硬件代價實現更高的吞吐速率。而數據位寬變化以及模型稀疏帶來的不規則性,則對硬件結構的實現提出了挑戰。未來的人工智能芯片設計,將更趨向于軟硬件協同設計的模式,從軟硬件兩個方向分別進行限制條件的考量以及優化路徑的選取,從而實現更優化,更通用的解決方案。



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴

原文標題:人工智能芯片設計

文章出處:【微信號:Semi Connect,微信公眾號:Semi Connect】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    24位同步采樣ADC軟硬件替換ADS1274動態應變器應用方案

    24位同步采樣ADC軟硬件替換ADS1274動態應變器應用方案
    的頭像 發表于 04-28 09:52 ?157次閱讀
    24位同步采樣ADC<b class='flag-5'>軟硬件</b>替換ADS1274動態應變器應用方案

    繪王亮相第85屆中國教育裝備展:軟硬件協同引領未來教育新趨勢

    次的專業觀眾參觀,為教育行業呈現一場科技與教育深度融合的盛會。在智能化與教育裝備深度融合的背景下,繪王以“軟硬件協同”為核心,攜覆蓋互動課堂數智空間、遠程教育、職
    的頭像 發表于 04-25 18:06 ?260次閱讀
    繪王亮相第85屆中國教育裝備展:<b class='flag-5'>軟硬件</b><b class='flag-5'>協同</b>引領未來教育新趨勢

    國產24位模擬前端芯片軟硬件替換ADS1291應用于醫療儀器(ECG/EMG/EEG)的高精度數據采集

    國產24位模擬前端芯片軟硬件替換ADS1291應用于醫療儀器(ECG/EMG/EEG)的高精度數據采集
    的頭像 發表于 04-18 09:58 ?226次閱讀
    國產24位模擬前端<b class='flag-5'>芯片</b><b class='flag-5'>軟硬件</b>替換ADS1291應用于醫療儀器(ECG/EMG/EEG)的高精度數據采集

    兆芯CPU近期軟硬件適配動態

    系統、應急廣播系統、網絡信息安全、低代碼流程管理、數字孿生、實驗室管理、協同辦公、礦山管控、電力調度、生產風險管理等軟硬件產品的適配認證,為關鍵基礎行業的創新發展和數字化轉型提供了更多有利條件。
    的頭像 發表于 01-15 15:33 ?479次閱讀

    嵌入式和人工智能究竟是什么關系?

    人工智能的結合,無疑是科技發展中的一場革命。在人工智能硬件加速中,嵌入式系統以其獨特的優勢和重要性,發揮著不可或缺的作用。通過深度學習和神經網絡等算法,嵌入式系統能夠高效地處理大量數據,從而實現
    發表于 11-14 16:39

    Untether發布人工智能(AI)芯片

    初創企業Untether發布了一款專為汽車、農業裝備及極端環境AI應用設計的人工智能(AI)芯片。   相較英偉達和AMD的旗艦AI芯片,它們主要服務
    的頭像 發表于 10-29 13:59 ?709次閱讀

    《AI for Science:人工智能驅動科學創新》第6章人AI與能源科學讀后感

    幸得一好書,特此來分享。感謝平臺,感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅動科學創新》的第6章后,我深刻感受到人工智能在能源科學領域中的巨大潛力和廣泛應用。這一章詳細
    發表于 10-14 09:27

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    很幸運社區給我一個閱讀此書的機會,感謝平臺。 《AI for Science:人工智能驅動科學創新》第4章關于AI與生命科學的部分,為我們揭示了人工智能技術在生命科學領域中的廣泛應用和深遠影響。在
    發表于 10-14 09:21

    《AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得

    人工智能:科學研究的加速器 第一章清晰地闡述了人工智能作為科學研究工具的強大功能。通過機器學習、深度學習等先進技術,AI能夠處理和分析海量數據,發現傳統方法難以捕捉的模式和規律。這不僅極大地提高了數據處理
    發表于 10-14 09:12

    risc-v在人工智能圖像處理應用前景分析

    RISC-V在人工智能圖像處理領域的應用前景十分廣闊,這主要得益其開源性、靈活性和低功耗等特點。以下是對RISC-V在人工智能圖像處理應用前景的詳細分析: 一、RISC-V的基本特點 RISC-V
    發表于 09-28 11:00

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領域應用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進行描訴,有利于總結經驗,擬按照要求準備相關體會材料??茨芊裼兄谌腴T和提高ss
    發表于 09-09 15:36

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅動科學創新

    活的世界? 編輯推薦 《AI for Science:人工智能驅動科學創新》聚焦人工智能與材料科學、生命科學、電子科學、能源科學、環境科學五大領域的交叉融合,通過深入淺出的語言和諸多實際應用案例,介紹了
    發表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會暨深圳(國際)通用人工智能產業博覽會將在深圳國際會展中心(寶安)舉辦。大會以“魅力AI·無限未來”為主題,致力打造全球通用人工智能
    發表于 08-22 15:00

    國產精密信號鏈產品完整解決方案,軟硬件兼容TI和ADI

    國產精密信號鏈產品完整解決方案,軟硬件兼容TI和ADI
    的頭像 發表于 08-19 09:58 ?913次閱讀
    國產精密信號鏈產品完整解決方案,<b class='flag-5'>軟硬件</b>兼容TI和ADI

    FPGA在人工智能中的應用有哪些?

    定制化的硬件設計,提高了硬件的靈活性和適應性。 綜上所述,FPGA在人工智能領域的應用前景廣闊,不僅可以用于深度學習的加速和云計算的加速,還可以針對特定應用場景進行定制化計算,為人工智能
    發表于 07-29 17:05