今天我們周圍的一切都在變得更加智能。人工智能(AI)不僅僅是一種數據中心應用,在我們日常與之交互的各種嵌入式系統中也能夠發現AI。我們希望與這些系統進行對話和手勢交流,期待它們能夠識別和理解我們,這種智能不僅使這些系統的功能更加完善、使用更為便捷,同時更加安全和可靠。
?
所有這些智能都來源于深度神經網絡的進步。神經網絡的關鍵挑戰之一是計算復雜度。小型神經網絡可能需要數百萬次的乘積累加運算(MAC)才能產生結果,而大型神經網絡則可能需要數十億次,像大語言模型等復雜網絡可能需要達到萬億級的計算量。這種級別的計算需求超出了嵌入式處理器的承載能力。
?
在某些情況下,這些推理計算可以通過網絡被轉移到數據中心。越來越多的設備擁有快速且可靠的網絡連接,使得這種方式成為許多系統的可行之選。然而,也有很多系統具有嚴格的實時要求,即使是最快最可靠的網絡也無法滿足。例如,任何有自動化能力的系統(如自動駕駛汽車或無人機)都需要比離線數據中心更快地做出決策。還有一些系統處理了不應該通過網絡傳輸的敏感數據,而且傳輸內容會增加黑客攻擊的風險。由于性能、隱私和安全等原因,某些推理操作需要在嵌入式系統上完成。
?
對于簡單的網絡來說,嵌入式 CPU 就可以處理這些任務,例如,一個樹莓派就能部署一個簡單的物體識別算法。而對于更復雜的任務,嵌入式 GPU 以及針對嵌入式系統的神經處理單元(NPU)可以提供更強的計算能力。但是,要想獲得更高水平的性能和效率,需要構建一個定制化的 AI 加速器。
?
無論是針對 ASIC 還是 FPGA,設計新的硬件都是一項艱巨的任務,但它能使開發者能夠取得現成組件無法達到的性能和效率水平。和有著多代產品設計經驗的設計師相比,普通開發團隊如何才能構建一個更好的AI加速器呢?其中一個方法是通過針對正在執行的特定推理來定制實施方案,這樣的效果會比通用解決方案更勝一籌。
?
在開發者通用 AI 加速器構建 NPU 時,其目標是支持任何可能的神經網絡。他們希望獲得盡可能多的設計輸入,因此必須使設計盡可能通用,不僅如此,他們還希望在設計中內置一定程度的“future proofing”,以支持幾年后可能出現的任何網絡。而在技術快速發展的背景下,這并非易事。
?
一個定制化加速器只需支持一個或幾個特定的網絡。這種自由度允許將在加速器實施過程中的可編程元素固定在硬件中,使得硬件比通用硬件更小且更快。在圖像和濾波器尺寸固定的情況下,一個專用卷積加速器的速度可比設計良好的通用 TPU 快上 10 倍。
通用加速器通常使用浮點數。這是因為幾乎所有神經網絡都是在使用浮點數的通用計算機上用 Python 開發的。為了正確支持這些神經網絡,加速器必須支持浮點數。然而,大多數神經網絡使用接近 0 的數值,并且需要較高的精度,而浮點乘法器體積龐大,如果不需要它們,從設計中去除可以節省大量面積和功耗。
?
一些 NPU 支持整數表示法,有時還支持多種大小。然而,支持多種數值表示格式會增加電路復雜性,進而消耗電力并加大傳播延遲。選擇一種表示格式并專門使用,可以實現更小、更快的實現。
?
在構建定制化加速器時,并不局限于 8 位或 16 位,任何尺寸都可以使用。選擇正確的數字表示,或對神經網絡進行 “量化”,可以優化數據和運算器的大小。量化可以顯著減少需要存儲、傳輸和操作的數據量。減少權重數據庫的內存占用和縮小乘法器的尺寸可以顯著改善設計的面積和功耗。例如,一個 10 位定點乘法器比一個 32 位的浮點乘法器小約 20 倍,功耗約為后者的 1/20。這意味著設計可以更小巧、更節能。使用更小的乘法器,設計人員也可以選擇使用該區域,部署 20 個可以并行運行的乘法器,從而在使用相同資源的情況下產生更高的性能。
?
在構建定制化機器學習加速器時,有一個挑戰是創建神經網絡的數據科學家通常不了解硬件設計,而硬件設計師也不了解數據科學。在傳統設計流程中,他們會通過“會議”和“規范”來傳遞知識和分享想法,但顯然,這些方法也并不會通過信息交流得到有效傳遞。
?
通過高階綜合(High-Level Synthesis, HLS),數據科學家生成的實施方案不僅可以作為可執行參考,還可以作為硬件設計流程的機器可讀輸入。這就避免了在設計流程中手動重新解釋算法,從而避免既緩慢又易出錯的手動過程。HLS 從算法描述中合成 RTL 實現。一般來說,算法用 C++ 或 SystemC 描述,但像 HLS4ML 這樣的設計流程能使 HLS 工具能夠直接從機器學習框架中獲取神經網絡描述。
?
HLS 能夠以一種在機器學習框架中尚不普及的方式對量化進行實際探索。為了充分理解量化的影響,需要對算法進行微精確的實現,包括溢出、飽和和舍入等影響的特征描述。目前,這只適用于硬件描述語言(HDL)或 HLS 微精確數據類型。隨著機器學習的普及,更多的嵌入式系統將需要部署推理加速器。HLS 是一種實用且行之有效的構建定制加速器的方法,加速器針對特定應用進行了優化,提供比通用 NPU 更高的性能和效率。
?
了解更多信息:高階綜合推動下一代邊緣 AI 加速器的發展
?
?
?
高階綜合(HLS)推動下一代 AI 加速器的發展
- 加速器(37095)
相關推薦
Freescale:半導體技術的進步推動下一代醫療設備的發展
半導體技術推動下一代醫療設備變得更智能、更精確、連通性更好。什么半導體技術正為未來的醫療設備創造條件呢?飛思卡爾半導體公司的 David Niewolny 討論了對醫療設備設計影響最大的半導體技術演進。
2013-05-09 11:46:11
1316


改變加速器格局,下一代千核RISC-V芯片
。近日,Esperanto公開了他們在AI軟件生態上所做的進一步努力,也透露了下一代千核RISC-V芯片的部分細節。
2023-08-07 07:00:00
958

家居智能化,推動AI加速器的發展
電子發燒友網報道(文/黃山明)AI加速芯片,也稱為人工智能加速器(AI Accelerator),是一種專為執行機器學習和深度學習任務而設計的ASIC或定制化處理器。在智能家居中,AI加速芯片不僅
2024-02-23 00:18:00
4368

2016CES:Atmel下一代觸摸傳感技術亮相
2016年1月7日——全球微控制器(MCU)及觸控技術解決方案領域的領導者Atmel公司今日宣布,將把下一代壓力傳感技術應用于最新面向智能手機應用的maXTouchU系列。Atmel的壓力傳感技術
2016-01-13 15:39:49
HLS高階綜合的定義與解決辦法
(pointtools),他們解決的是某個具體問題。軟件工程師還沒有一個生態系統來識別加速至硬件的代碼是否需要加速。對于那個工程師而言,這時的高階綜合可能是一個敵人,而不是朋友。如果沒有對底層多核平臺的全面
2021-07-10 08:00:00
下一代廣電綜合業務網上營業廳的特點與功能
【作者】:王書慶;沙威;【來源】:《廣播電視信息》2010年03期【摘要】:面對廣電運營商業務發展加快和服務理念轉變的趨勢,下一代廣電綜合業務網上營業廳應運而生,本文介紹了下一代廣電綜合業務網上
2010-04-23 11:33:30
FPGA的高階應用與發展方向討論
FPGA可編程器件做高階應用如圖像處理、語音識別等需要具備哪些能力,需要怎樣更有效從入門到精通 ? FPGA與當下的AI發展結合的怎樣?大家可以交流討論
2024-03-30 18:09:28
Vivado HLS視頻庫加速Zynq-7000 All Programmable SoC OpenCV應用
OpenCV應用。如何重構一個使用I/O功能來封裝加速器的OpenCV應用。如何在加速器功能中, 通過替換為HLS綜合視頻庫功能的方迅速加速OpenCV功能調用。如何在Zynq ZC702參考設計中迅速
2013-12-30 16:09:34
vivado高層次綜合HLS定義及挑戰
(pointtools),他們解決的是某個具體問題。軟件工程師還沒有一個生態系統來識別加速至硬件的代碼是否需要加速。對于那個工程師而言,這時的高階綜合可能是一個敵人,而不是朋友。如果沒有對底層多核平臺的全面
2021-07-06 08:00:00
《 AI加速器架構設計與實現》+第2章的閱讀概括
首先感謝電子發燒友論壇提供的書籍和閱讀評測的機會。
拿到書,先看一下封面介紹。這本書的中文名是《AI加速器架構設計與實現》,英文名是Accelerator Based on CNN Design
2023-09-17 16:39:45
【MPS電源評估板試用申請】下一代接入網的芯片研究
項目名稱:下一代接入網的芯片研究試用計劃:下一代接入網的芯片研究:主要針對于高端FPGA的電路設計,其中重要的包括芯片設計,重要的是芯片外部電源設計,1.需要評估芯片各個模式下的功耗功耗,2.需要
2020-06-18 13:41:35
【書籍評測活動NO.18】 AI加速器架構設計與實現
加速器架構設計與實現》
主要內容本書是一本講解NPU硬件架構設計與技術實現的著作。作者將自己在CPU、GPU和NPU領域15年的軟硬件工作經驗融會貫通,將四代NPU架構設計經驗融為一體,將端側和云側
2023-07-28 10:50:51
【轉載】黑莓CEO:不會推下一代BB10平板電腦 專注智能手機
【轉載】黑莓CEO:不會推下一代BB10平板電腦 專注智能手機鳳凰科技訊 北京時間6月28日消息,據外國媒體CNET報道稱,黑莓CEO托斯滕?海恩斯(Thorsten Heins)表示對黑莓10
2013-07-01 17:23:10
為什么說射頻前端的一體化設計決定下一代移動設備?
隨著移動行業向下一代網絡邁進,整個行業將面臨射頻組件匹配,模塊架構和電路設計上的挑戰。射頻前端的一體化設計對下一代移動設備真的有影響嗎?
2019-08-01 07:23:17
使用AMD-Xilinx FPGA設計一個AI加速器通道
介紹使用 AMD-Xilinx FPGA設計一個全連接DNN核心現在比較容易(Vitis AI),但是利用這個核心在 DNN 計算中使用它是另一回事。本項目主要是設計AI加速器,利用Xilinx
2023-02-21 15:01:58
如何建設下一代蜂窩網絡?
全球網絡支持移動設備體系結構及其底層技術面臨很大的挑戰。在蜂窩電話自己巨大成功的推動下,移動客戶設備數量以及他們對帶寬的要求在不斷增長。但是分配給移動運營商的帶寬并沒有增長。網絡中某一通道的使用效率也保持平穩不變。下一代射頻接入網必須要解決這些難題,這似乎很難。
2019-08-19 07:49:08
實現下一代機器人至關重要的關鍵傳感器技術介紹
對實現下一代機器人至關重要的幾項關鍵傳感器技術包括磁性位置傳感器、存在傳感器、手勢傳感器、力矩傳感器、環境傳感器和電源管理傳感器。
2020-12-07 07:04:36
性能提升1倍,成本直降50%!基于龍蜥指令加速的下一代云原生網關
日益增長的速度,CPU 硬件加速成為業界一個通用的解決方案。CPU 新特性不久前發布的第三代英特爾 ^?^ 至強 ^?^ 可擴展處理器(代號 Ice Lake),單核性能提升 30%,整機算力提升 50
2022-08-31 10:46:10
支持更多功能的下一代汽車后座娛樂系統
的不斷發展,紅外線或藍牙無線耳機逐漸普及,光驅支持的編解碼標準也在不斷增加,如MP3或DviX解碼標準。但是,這些設備的數據源基本沒有發生變化,還是局限于DVD和CD兩種媒體。下一代后座娛樂系統必須涵蓋
2019-05-16 10:45:09
用Java開發下一代嵌入式產品
用Java開發下一代嵌入式產品在我10年的Java布道師生涯里,沒有哪次Java新版本發布能讓我如此興奮。Java 8的發布不僅在語言本身加入了些不錯的新特性,還在嵌入式開發上加入了很棒的功能
2021-11-05 09:12:34
請問Ultrascale FPGA中單片和下一代堆疊硅互連技術是什么意思?
大家好, 在Ultrascale FPGA中,使用單片和下一代堆疊硅互連(SSI)技術編寫。 “單片和下一代堆疊硅互連(SSI)技術”是什么意思?謝謝娜文G K.
2020-04-27 09:29:55
遠景研討會 紀要,面向下一代計算的開源芯片與敏捷開發方法
遠景研討會(SIGARCH Visioning Workshop)紀要面向下一代計算的開源芯片與敏捷開發方法作者:包云崗2019 年8 月轉自中國開放指令生態(RISC-V)聯盟概要近年來,開源硬件
2022-08-04 15:38:02
下一代網絡概述
了解下一代網絡的基本概念掌握以軟交換為核心的下一代網絡(NGN)的形態與結構掌握下一代網絡的網關技術,包括媒體網關、信令網關、接入網關掌握軟交換的概念、原理、
2009-06-22 14:26:17
34

下一代寬帶無線通信網絡信令體系結構
下一代寬帶無線通信網絡是當前多種無線通信網絡發展與融合的未來方向之一。在下一代寬帶無線通信網絡的形成過程中,不同的網絡研究領域專家們從各自的視角對下一代寬帶無線通
2011-05-24 18:27:39
39

節能省電,下一代功率半導體的發展趨勢
當前,材料的發展引領了產品性能的提升,碳化硅和氮化鎵的發展也就推動了在變頻器和轉換器設計上用到的功率半導體的發展,下面我們就下一代的功率半導體發展趨勢進行分析。
2012-12-03 09:09:05
2209

下一代網絡核心技術概覽
下一代網絡技術(NGN)的概念起源于美國克林頓政府1997年10月10日提出的下一代互聯網行動計劃(NGI)。其目的是研究下一代先進的組網技術、建立試驗床、開發革命性應用。NGN一直是業界普遍關注的熱點和焦點,一些行業組織和標準化機構也分別對各自領域的下一代網絡技術進行了研究。
2016-01-14 16:18:00
0

使用教程分享:在Zynq AP SoC設計中高效使用HLS IP(一)
高層次綜合設計最常見的的使用就是為CPU創建一個加速器,將在CPU中執行的代碼移動到FPGA可編程邏輯去提高性能。本文展示了如何在Zynq AP SoC設計中使用HLS IP。 在Zynq器件
2017-02-07 18:08:11
3495


Xilinx推出有關 Zynq SoC 加速器的最新培訓課程
為期 ?1? 天的加速器開發流程介紹主要講解如何測量系統性能、確定什么軟件功能應該移至硬件,如何使用 ?Vivado? HLS? 工具裝配一款定制加速器,如何將該定制加速器添加至 ?Zynq SoC? 設計,以及如何測量加速性能。 了解更多 ??
2017-02-09 06:23:11
339

利用硬件加速器提高處理器的性能
超過兩倍。本文以下一代音頻系統為例,說明硬件加速器在這方面的應用。 為什么使用硬件加速器 FIR濾波器、IIR濾波器和FFT操作在數字信號處理器中應用十分普遍,且具有規則的結構,因此可以用硬件直接實現,特別是用硬件加速器。硬件加速器是專用
2017-12-04 15:22:36
1205

全球下一代互聯網峰會召開 技術迭代帶來數字經濟發展新機遇
2018年5月21-22日,全球最具影響力的下一代互聯網產業盛會——“全球下一代互聯網峰會” (IPv6.conference.cn)在杭州開幕,全球超千位產業精英齊聚一堂,就全球下一代互聯網發展現狀、下一代互聯網技術體系及為中國帶來的新的發展機遇等方面展開探討。
2018-05-22 10:48:15
6754

“下一代AI聯絡中心“服務模式正式落地!
2019年6月24日,領先的人工智能技術公司小i機器人與大型服務外包企業誠伯信息在上海簽署戰略合作協議,雙方將作為聯合運營方提供“下一代AI客戶聯絡中心”服務。
2019-06-27 15:47:22
2738

下一代無線技術是VR下一代發展的缺失環節
虛擬現實頭顯在過去五年中取得了明顯的改進,并且在未來五年內,由于計算機圖形和顯示技術的進步,將向前邁出更大的一步。下一代無線技術是VR下一代發展的缺失環節,因為當代無線VR硬件無法滿足用戶期望的流暢沉浸。
2019-08-11 10:46:20
722

隨著科技的發展下一代光纖連接器或將無需插芯
下一代光連接器應該是什么樣子的?按照歐盟VECTOR項目的說法,至少是沒有插芯的。VECTOR項目的全名是通用易安裝的連接器新技術,用來加速歐洲的光接入網絡部署,其目標是開發低成本、現場組裝的光纖接入網用光纖連接器。
2019-11-04 11:43:46
1124

疫情已被證明是云應用和擴展的加速器,將繼續推動云計算發展
COVID-19大流行已經被證明是云應用和擴展的加速器,并將繼續推動向以云為中心的IT的更快轉換。
2020-10-20 15:05:33
1644

HLS高階綜合的定義及挑戰
HLS高階綜合(high level synthesis)在被廣泛使用之前,作為商業技術其實已經存在了20多年。設計團隊對于這項技術可以說呈現出兩極化的態度:要么堅信它是先進技術之翹楚,要么對其持謹慎懷疑態度。
2020-11-04 13:45:03
3234

什么是AI加速器 如何確需要AI加速器
AI加速器是一類專門的硬件加速器或計算機系統旨在加速人工智能的應用,主要應用于人工智能、人工神經網絡、機器視覺和機器學習。
2022-02-06 12:47:00
4270

加速邊緣設備中計算機視覺和語音的AI推理模型
SiFive 將 RISC-V 處理器 IP 引入其下一代 AI 推理加速器,為邊緣設備中的計算機視覺和語音提供更快、更高效的計算能力。
2022-05-31 10:47:55
884

邊緣設備中計算機視覺和語音的AI推理加速器應用
SiFive 將 RISC-V 處理器 IP 引入其下一代 AI 推理加速器,為邊緣設備中的計算機視覺和語音提供更快、更高效的計算能力。
2022-08-16 11:24:05
1015

先進的嵌入式系統推動下一代汽車應用
向具有先進功能的智能汽車的遷移正在迅速進行,但讓汽車在現實世界中自動駕駛并不是那么簡單。需要高度集成的處理器來支持下一代汽車必須提供的高級功能,提供片上專用加速器和功能安全特性等功能,以及運行它的統一軟件平臺。
2022-11-29 16:30:09
547

為下一代3D傳感器開發光控超構表面(LCM?)技術
Lumotive將利用新資金加速光學半導體器件的開發和客戶交付,以支持下一代激光雷達(LiDAR)傳感器。
2023-01-08 17:17:28
2164

硬件加速器提升下一代SHARC處理器的性能
SHARC ADSP-2146x處理器集成了硬件加速器,可實現三種廣泛使用的信號處理操作:FIR(有限脈沖響應)、IIR(無限脈沖響應)和FFT(快速傅里葉變換)。加速器卸載了核心處理器,并有可能使處理器的計算吞吐量增加一倍以上。本文以加速器在下一代音頻系統中的應用為例。?
2023-03-03 14:46:51
1063


PCIe在AI加速器中的作用
從線上購物時的“猜你喜歡”、到高等級自動駕駛汽車上的實時交通信息接收,再到在線視頻游戲,所有的這些都離不開人工智能(AI)加速器。AI加速器是一種高性能的并行計算設備,旨在高效處理神經網絡等AI工作負載并提供近乎實時的處理方案,從而實現一系列應用。
2023-11-18 10:36:30
1720


智物發布天璣900平臺無線AR智能眼鏡參考設計,推動下一代無線AR發展
智物發布天璣900平臺無線AR智能眼鏡參考設計,推動下一代無線AR發展。無線AR智能眼鏡的設計參考搭載了天璣900平臺,運行頻率為2.4GHz的八核處理器,性能更加出色。同時,它的外形縮小了30
2023-12-11 17:27:59
523


粒子加速器的加速原理是啥呢?
粒子加速器的加速原理是啥呢? 粒子加速器是一種重要的實驗設備,用于研究粒子物理學、核物理學等領域。其主要原理是通過電場和磁場的作用,對帶電粒子進行加速,在高速運動過程中使其獲得較大的動能,最終達到
2023-12-18 13:52:08
1615

TDK和固特異合作推動下一代輪胎解決方案
TDK 株式會社(TES:6762)和固特異輪胎橡膠公司(NASDAQ:GT)今日宣布將合作推動下一代輪胎解決方案,旨在加快輪胎和汽車生態系統中集成智能硬件和軟件的開發和采用。
2024-01-10 13:33:25
475

瑞薩發布下一代動態可重構人工智能處理器加速器
瑞薩最新發布的動態可重構人工智能處理器(DRP-AI)加速器,在業界引起了廣泛關注。這款加速器擁有卓越的10 TOPS/W高功率效率,相比傳統技術,效率提升了驚人的10倍。其獨特之處在于,它能在低功耗的傳統嵌入式處理器(MPU)上運行復雜的圖像AI模型,不再需要依賴高功耗的GPU。
2024-03-08 13:45:47
564

NVIDIA的專用AI平臺如何推動下一代醫療健康行業的發展
醫療科技創新企業在 GTC 上介紹了 NVIDIA 的專用 AI 平臺如何推動下一代醫療健康行業的發展。
2024-04-09 10:10:54
1122

Rebellions選擇 arteris作為其下一代神經處理單元,瞄準生成人工智能
來源:Yole Group 加速片上系統 (SoC) 創建的系統 IP 提供商 Arteris 宣布,領先的 AI 半導體初創公司 Rebellions 將為其下一代 AI 硬件加速器神經處理單元
2024-04-18 16:44:45
189

豐田、日產和本田將合作開發下一代汽車的AI和芯片
豐田、日產和本田等日本主要汽車制造商確實計劃聯手開發下一代汽車的軟件,包括在生成式人工智能(AI)和半導體(芯片)等領域進行合作。
2024-05-20 10:25:50
845

24芯M16插頭在下一代技術中的潛力
德索工程師說道隨著科技的飛速發展,下一代技術正逐漸展現出其獨特的魅力和潛力。在這一背景下,24芯M16插頭作為一種高性能、多功能的連接器,將在下一代技術中發揮至關重要的作用。以下是對24芯M16插頭在下一代技術中潛力的詳細分析:
2024-06-15 18:03:47
161


西門子推出Catapult AI NN軟件,賦能神經網絡加速器設計
西門子數字化工業軟件近日發布了Catapult AI NN軟件,這款軟件在神經網絡加速器設計領域邁出了重要一步。Catapult AI NN軟件專注于在專用集成電路(ASIC)和芯片級系統(SoC)上實現神經網絡的高層次綜合(HLS),為機器學習應用提供了硬件加速的新途徑。
2024-06-19 11:27:22
634

西門子推出Catapult AI NN:重塑神經網絡加速器設計的未來
的需求,西門子數字化工業軟件日前推出了一款名為Catapult AI NN的創新軟件,旨在幫助神經網絡加速器在專用集成電路(ASIC)和芯片級系統(SoC)上實現更高效的高層次綜合(HLS)。
2024-06-19 16:40:33
485

下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統高級AI中更快的嵌入處理
電子發燒友網站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統高級AI中更快的嵌入處理.pdf》資料免費下載
2024-08-15 11:06:41
0

評論