為什么用FPGA來加速YOLOV2

1.GPU加速：GPU是一種多核處理器，GPU起初是用來進(jìn)行圖形處理任務(wù)的，經(jīng)過長(zhǎng)時(shí)間的發(fā)展，GPU的發(fā)展是日趨復(fù)雜的，而且針對(duì)不同的領(lǐng)域也有不同。

當(dāng)GPU被用來進(jìn)行通用計(jì)算時(shí)，就產(chǎn)生了一些通用的計(jì)算框架，比如說Opencl和CUDA。比如說高端GPU TItan系列，其頻率可以達(dá)到1Ghz，擁有330GB的帶寬，提供每秒極高的算力，但是功耗也達(dá)到了驚人的250W。對(duì)于嵌入式的GPU，比如說TegraX1，擁有256個(gè)處理核，帶寬為25GB/s，同樣在1Ghz的頻率下，算力仍可以達(dá)到近Titan的十分之一，但是功耗只有10W。

2.ASIC加速：這些芯片分為兩類：第一類，用來做訓(xùn)練和推理，這些芯片可以用來做DNN的訓(xùn)練，也可以做DNN的推理。第二類，用來做推理，這些ASICs用來運(yùn)行在GPU或者其他硬件上已經(jīng)訓(xùn)練好的模型，然后對(duì)訓(xùn)練過的網(wǎng)絡(luò)進(jìn)行修改，使得網(wǎng)絡(luò)可以運(yùn)行在不同的ASIC上。

3.FPGA加速：FPGA是一種可以重復(fù)配置的電路。在延遲方面，F(xiàn)PGA要比GPU更好。FPGA可以提供很高的帶寬同時(shí)也可以降低延遲。

1.2 FPGA實(shí)現(xiàn)

要實(shí)現(xiàn)某種運(yùn)算，其中一種方法就是將這種運(yùn)算以電路的方式實(shí)現(xiàn)，而使用FPGA就是其中一個(gè)相對(duì)簡(jiǎn)單的方法，使用者可以將FPGA配置為所需要的電路。基于指令的硬件是通過軟件來實(shí)現(xiàn)的，而FPGA是通過專用硬件實(shí)現(xiàn)的。對(duì)于一些需要低延遲的算法，比如說智能駕駛，F(xiàn)PGA的延遲要比GPU更低。當(dāng)時(shí)用FPGA時(shí)，可以將延遲控制在1微秒或者1微秒之外，但是對(duì)于CPU來說，延遲低于50微秒，性能就已經(jīng)很強(qiáng)了。除此之外，F(xiàn)PGA的定制化更強(qiáng)，延遲能夠人為的控制，F(xiàn)PGA不需要操作系統(tǒng)，內(nèi)部也不需要想CPU一樣通過總線進(jìn)行通行。

在FPGA中，可以連接任何的數(shù)據(jù)源，比如說網(wǎng)口或者傳感器，可以直接通過芯片的引腳就可以連接，這就和GPU與CPU形成了鮮明的對(duì)比（GPU和CPU與外界數(shù)據(jù)交互需要標(biāo)準(zhǔn)總線進(jìn)行連接）。

FPGA的直連技術(shù)可以為數(shù)據(jù)提供很高的帶寬，同時(shí)也降低了時(shí)延。

2、為什么用FPGA來加速YOLOV2

對(duì)于卷積核和池化的運(yùn)算來說，因?yàn)槭蔷仃囘\(yùn)算，這就需要相當(dāng)高的算力。而由于卷積和池化運(yùn)算都是流式運(yùn)算，所以將他們放在FPGA中實(shí)現(xiàn)從而進(jìn)行加速是一個(gè)很好的選擇。對(duì)于YOLOV2中的部分運(yùn)算，比如說計(jì)算坐標(biāo)圖像的預(yù)處理等，都是一些非流式運(yùn)算，或者是標(biāo)準(zhǔn)運(yùn)算，這些運(yùn)算適合放在ARM中進(jìn)行，于是將YOLOV2中的運(yùn)算做一下劃分，充分利用軟硬件協(xié)同的優(yōu)勢(shì)，從而對(duì)整個(gè)算法進(jìn)行加速。

FPGA：卷積層和池化層

ARM：Softmax

3、FPGA簡(jiǎn)介

3.1 FPGA的基本結(jié)構(gòu)基本構(gòu)成：CLB（可配置邏輯塊），IOS（輸入輸出模塊），IR（互聯(lián)資源）

FPGA的功能是由SRAM中的數(shù)據(jù)類配置的，所以大部分FPGA芯片中都是采用查找表結(jié)構(gòu)的。FPGA中組合邏輯使用小型LUT實(shí)現(xiàn)的，這些LUT輸出端連接到D觸發(fā)器的輸入端，D在連接到其他邏輯電路或者是驅(qū)動(dòng)IO來對(duì)其進(jìn)行驅(qū)動(dòng)。

FPGA中的邏輯是通過加載編程數(shù)據(jù)來實(shí)現(xiàn)的，這些編程數(shù)據(jù)通過內(nèi)部靜態(tài)存儲(chǔ)單元來進(jìn)行加載。存儲(chǔ)單元的值可以配置邏輯單元各個(gè)模塊的連接通路，以及邏輯單元所實(shí)現(xiàn)的功能，也可以配置IO的功能以及電氣鼠性等，這些最終構(gòu)成了一個(gè)可以實(shí)現(xiàn)目標(biāo)功能的FPGA系統(tǒng)。

3.2 FPGA的相對(duì)優(yōu)勢(shì)：

與DSP和MCU相比，F(xiàn)PGA的運(yùn)算速度較快，實(shí)現(xiàn)控制功能更加靈活，與傳統(tǒng)的CPLD相比，F(xiàn)PGA更適合做一些規(guī)模更大邏輯更復(fù)雜的設(shè)計(jì)。

（1）.FPGA有六部分構(gòu)成：可編程CLB，可編程IO，布線資源，嵌入式RAM，專用迎合以及內(nèi)嵌功能模塊。CLPD功能更加簡(jiǎn)單，構(gòu)成：可編程IO，基本邏輯單元，布線pool。2）.FPGA更容易實(shí)現(xiàn)時(shí)序邏輯，CPLD更適合大規(guī)模組合邏輯。

（3）.FPGA連線資源非常豐富，且CLB的利用率很高。

（4）。同專用集成電路比，F(xiàn)PGA更加靈活，開發(fā)周期更短，可以降低成本，同時(shí)也可以保證保密性和可靠性。

4、PYNQ開發(fā)框架與HLS加速理論

4.1 PYNQ

傳統(tǒng)的FPGA的框架有兩種，一種是FPGA與CPU互聯(lián)的，另一種是FPGA與RAM互聯(lián)的。但是這兩種開發(fā)對(duì)于然間人員來說很不友好，而PYNQ就很好的解決了這個(gè)問題，。PYNQ可以在ZYNQ上面運(yùn)行，ZYNQ包含PL和PS部分，PS部分是ARM的處理器，上面可以運(yùn)行LINUX系統(tǒng)，操作系統(tǒng)上運(yùn)行ptyhon。PL部分是可編程邏輯資源，在開發(fā)過程中，首先在PL端設(shè)計(jì)IP核，將IP核配置成為AXI總線形式，然后在PS中對(duì)驅(qū)動(dòng)函數(shù)進(jìn)行調(diào)用。

PYQN是一種全新的開發(fā)框架，能夠用PYTHON對(duì)其進(jìn)行快速的FPGA部署，在部署過程中不用研究硬件的實(shí)現(xiàn)細(xì)節(jié)。

4.2 HLS

開發(fā)流程是基于C語言，能夠節(jié)約用戶大量的時(shí)間。其重要流程包括：C開發(fā)，C仿真，C綜合以及RTL綜合等。

4.2.1 用HLS加速IP

內(nèi)層并行現(xiàn)實(shí)化：在FPGA實(shí)現(xiàn)深度學(xué)習(xí)算法中的一層，在計(jì)算時(shí)候?qū)@一層進(jìn)行復(fù)用，計(jì)算完一層以后將數(shù)據(jù)緩存到片外的DDR中，當(dāng)進(jìn)行下一層計(jì)算式，再將數(shù)據(jù)讀入運(yùn)算單元中，在這個(gè)過程中需要FPGA的ARM來對(duì)IP核進(jìn)行配置，包括輸入輸出通道的數(shù)量，卷積核的尺寸等。配置完成后，IP和就可以進(jìn)行相應(yīng)層的運(yùn)算。

實(shí)現(xiàn)卷積IP核的經(jīng)典架構(gòu)

這個(gè)系統(tǒng)包含了片外DDR，ARM處理器，控制器，運(yùn)算單元以及各種緩沖器。緩存器：輸入輸出，權(quán)重緩沖等。輸入的圖像首先要加載帶輸入的寄存器中，然后通過運(yùn)算單元執(zhí)行卷積操作，卷積操作是通過多個(gè)運(yùn)算單元來運(yùn)算的，以保證運(yùn)算的速度。在進(jìn)行卷積運(yùn)算時(shí)，第一季輸出緩存中的數(shù)據(jù)會(huì)被輸出到第二級(jí)輸出緩存，在當(dāng)前層運(yùn)算完之后，運(yùn)算結(jié)構(gòu)就會(huì)成為下一級(jí)的運(yùn)算輸出，用這樣的方式實(shí)現(xiàn)網(wǎng)絡(luò)每一層的加速。

如上圖所展示的流程圖，可以實(shí)現(xiàn)網(wǎng)絡(luò)在單層內(nèi)部運(yùn)算的并行優(yōu)化，不必將整個(gè)網(wǎng)絡(luò)全部展開，可以獎(jiǎng)勵(lì)網(wǎng)絡(luò)的資源占用率，進(jìn)而降低功耗，實(shí)現(xiàn)了新跟你乖面積以及功耗的平衡。如果想藥實(shí)現(xiàn)單層網(wǎng)絡(luò)的加速效果，就需要在層的內(nèi)部實(shí)現(xiàn)流水。所以就需要一種數(shù)據(jù)拆分機(jī)制，將數(shù)據(jù)分為多個(gè)小塊，然后并行去處理這些數(shù)據(jù)。

將圖像分割為多個(gè)小塊，每個(gè)小塊的尺寸為Tr X Tc X Tn，而這一塊經(jīng)過計(jì)算之后得到的結(jié)果應(yīng)該是卷積計(jì)算的部分和，尺寸為Th X Tl X Tm，在這個(gè)運(yùn)算過程中，所欲要的權(quán)重尺寸是K X K X Tn X Tm。在處理完這一塊數(shù)據(jù)后，再處理這個(gè)特征圖的下一塊數(shù)據(jù)。這樣按快處理，直到本層的數(shù)據(jù)處理完成。

4.2.2 循環(huán)優(yōu)化HLS針對(duì)循環(huán)的優(yōu)化指令很多，這里只使用Loop Pipeline和Loop Unrolling。

Loop Pipeline的作用是對(duì)循環(huán)的進(jìn)行流水線化的并行處理，這種方式可以讓兩輪循環(huán)執(zhí)行時(shí)間重疊，使得在本輪循環(huán)過程中下一輪循環(huán)也可以同時(shí)執(zhí)行。

上述圖片是未經(jīng)過流水化處理和經(jīng)過處理的運(yùn)算步驟，可以清楚地看出，如果以兩次迭代為例，未經(jīng)過處理的運(yùn)算需要經(jīng)過5個(gè)時(shí)鐘周期才能完成運(yùn)算，而經(jīng)過流誰化處理的運(yùn)算僅僅需要三個(gè)時(shí)鐘周期。

Loop Unorlling在沒有進(jìn)行循環(huán)優(yōu)化之前，循環(huán)的運(yùn)行按照默認(rèn)設(shè)置來操作的。而當(dāng)進(jìn)行循環(huán)展開后，循環(huán)的電路會(huì)被設(shè)置為N份，N一般有HLS中的指令factor來指定。比如說factor為2時(shí)，此時(shí)的迭代次數(shù)為8的話，那么迭代會(huì)被分為4次進(jìn)行，內(nèi)次是2個(gè)循環(huán)一次實(shí)現(xiàn)的。

4.3 硬件系統(tǒng)的構(gòu)建

4.3.1 PL部分PL部分使用HLS來實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)。

硬件配置如下：

最后將PL端生成的bitfile加載到FPGA中，最后在PC上觀察吃力后的圖像，進(jìn)行結(jié)果分析與統(tǒng)計(jì)。

5、實(shí)驗(yàn)結(jié)果

加速前后的時(shí)間對(duì)比。

? ? ? 審核編輯：彭靜

閱讀全文

FPGA(591969) FPGA(591969)
數(shù)據(jù)(87428) 數(shù)據(jù)(87428)
gpu(126255) gpu(126255)

評(píng)論

相關(guān)推薦

【YOLOv5】LabVIEW+YOLOv5快速實(shí)現(xiàn)實(shí)時(shí)物體識(shí)別（Object Detection）含源碼

前面我們給大家介紹了基于LabVIEW+YOLOv3/YOLOv4的物體識(shí)別（對(duì)象檢測(cè)），今天接著上次的內(nèi)容再來看看YOLOv5。本次主要是和大家分享使用LabVIEW快速實(shí)現(xiàn)yolov5的物體識(shí)別

2023-03-13 16:01:07

1564

手把手教你使用LabVIEW ONNX Runtime部署 TensorRT加速，實(shí)現(xiàn)YOLOv5實(shí)時(shí)物體識(shí)別

今天我們就一起來看一下如何使用LabVIEW開放神經(jīng)網(wǎng)絡(luò)交互工具包實(shí)現(xiàn)TensorRT加速YOLOv5

2023-03-20 16:36:12

2101

Yolov5算法解讀

yolov5于2020年由glenn-jocher首次提出，直至今日yolov5仍然在不斷進(jìn)行升級(jí)迭代。 Yolov5有YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x四個(gè)版本。文件

2023-05-17 16:38:53

3585

YOLOV7網(wǎng)絡(luò)架構(gòu)解讀

繼美團(tuán)發(fā)布YOLOV6之后，YOLO系列原作者也發(fā)布了YOLOV7。

2023-11-29 10:00:33

659

YOLOv5s算法在RK3399ProD上的部署推理流程是怎樣的

YOLOv5s算法在RK3399ProD上的部署推理流程是怎樣的？基于RK33RK3399Pro怎樣使用NPU進(jìn)行加速推理呢？

2022-02-11 08:15:55

yolov3 GPU加速 AI 目標(biāo)檢測(cè)

回復(fù)后獲取yolov4測(cè)試demo程序：鏈接：https://pan.baidu.com/s/1XavCXSIOYaukCzER7eZQ3g提取碼：[hide] 3icg [/hide]

2021-05-10 22:49:23

yolov5模型onnx轉(zhuǎn)bmodel無法識(shí)別出結(jié)果如何解決？

問題描述： 1. yolov5模型pt轉(zhuǎn)bmodel可以識(shí)別出結(jié)果。（轉(zhuǎn)化成功，結(jié)果正確） 2. yolov5模型pt轉(zhuǎn)onnx轉(zhuǎn)bmodel可以無法識(shí)別出結(jié)果。（轉(zhuǎn)化成功，結(jié)果沒有）配置： 1.

2023-09-15 07:30:45

yolov7 onnx模型在NPU上太慢了怎么解決？

://github.com/WongKinYiu/yolov7/releases下載yolov7-tiny.pt ，并重命名yolov7tiny.pt2.將yolov7tiny.pt轉(zhuǎn)換

2023-04-04 06:13:12

加速FPGA的仿真方式之——腳本命令

PCIE，DMA的同學(xué)具有很大幫助。其中工程中使用到了大量xilinx IP,也是對(duì)《FPGA仿真篇-使用腳本命令來加速仿真一》的進(jìn)一步補(bǔ)充和講解。2.使用腳本語言命令加速仿真Xapp859這個(gè)

2020-05-14 08:35:40

加速傳感器有什么用

`　　誰來闡述一下加速傳感器有什么用？`

2019-12-04 17:11:39

用FPGA來實(shí)現(xiàn)濾波器的設(shè)計(jì)優(yōu)點(diǎn)有哪些?

用FPGA來實(shí)現(xiàn)濾波器的設(shè)計(jì)優(yōu)點(diǎn)有哪些?

2021-11-05 07:59:53

用FPGA去實(shí)現(xiàn)大型神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)

，讓硬件來執(zhí)行計(jì)算（加速的概念），今天就介紹兩個(gè)針對(duì)以上解決方案的開源項(xiàng)目，這兩個(gè)項(xiàng)目是用FPGA進(jìn)行硬件加速的必備項(xiàng)目。　　AI算法流程　　在進(jìn)行項(xiàng)目介紹前，我們先介紹一下軟件架構(gòu)和工具集。這個(gè)后面會(huì)影響理解。　　一個(gè)完整的深度學(xué)習(xí)框架中主要分為下面幾個(gè)流程：原作者：碎碎思·

2022-10-24 16:10:50

用matlab來實(shí)現(xiàn)fpga功能的設(shè)計(jì)

用matlab來實(shí)現(xiàn)fpga功能的設(shè)計(jì)

2012-08-19 22:30:13

AD9781或是AD9783芯片的DCOP/DCON信號(hào)有什么用？

1，AD9781或是AD9783芯片他的DCOP/DCON信號(hào)有什么用？能舉個(gè)例么，我看了下他們的PDF文檔，好像沒感覺出來他到底有什么用，用在哪些方面？ 2，如果AD9781或是AD9783芯片

2023-12-18 06:41:34

ADA4932-2輸出端的RL是做什么用的？

我現(xiàn)在用的是ADA4932-2，+5V供電，差分輸出為0.5Vp-p，共模電壓1.5V。我看到芯片資料上寫到我的運(yùn)放差分輸出端也并了一個(gè)RL，但是我很奇怪這個(gè)RL是做什么用的？我在電路中

2023-12-22 06:22:39

ADAU1451硬件加速器擺動(dòng)什么用？

Hi，HenryLj.mo請(qǐng)問下在Sigma 300里面使用硬件加速器slew，slew mode為RC type時(shí)，對(duì)應(yīng)的time constant 與數(shù)據(jù)從當(dāng)前值到目標(biāo)值得時(shí)間有什么關(guān)系,或者說不同的time constant的值有什么用？ Thanks,Jack

2019-01-29 06:55:13

DMA有什么用

DMA部分我用到的相對(duì)簡(jiǎn)單，當(dāng)然，可能這是新東西，我暫時(shí)還用不到它的復(fù)雜功能吧。下面用問答的形式表達(dá)我的思路。DMA有什么用？直接存儲(chǔ)器存取用來提供在外設(shè)和存儲(chǔ)器之間或者存儲(chǔ)器和存儲(chǔ)器之間的高速

2021-08-11 09:02:05

FTDI FPGA平臺(tái)加速基于FPGA的應(yīng)用與制作

USB 芯片和軟件廠商飛特蒂亞(FTDI)公司發(fā)布一款靈活而強(qiáng)大的開發(fā)平臺(tái) Morph-IC-II，可加速基于FPGA的應(yīng)用與制作，并簡(jiǎn)化先進(jìn)邏輯電路設(shè)計(jì)中整合高速480Mbit/s USB通訊作業(yè)

2019-07-03 08:29:05

LabVIEW調(diào)用YoloV4類庫(kù)Demo

、使用的是2018-64位，貌似無法生成32位的類庫(kù)；2、未使用GPU加速；3、調(diào)用的yolov4-tiny默認(rèn)訓(xùn)練文件，可以切換還存在的問題:直接調(diào)類庫(kù)識(shí)別不到人-_-，歡迎討論網(wǎng)上教程:https://zhuanlan.zhihu.com/p/45803677

2021-01-27 10:02:55

TI的wifi芯片CC3200引腳問題：是什么含義，有什么用，怎么用

TI的wifi芯片CC3200引腳問題：是什么含義，有什么用，怎么用1、ANTSEL1,Antenna Selection ControlANTSEL2,Antenna Selection

2014-11-06 11:25:31

TSN有什么用

以太網(wǎng)比現(xiàn)場(chǎng)總線快得多TSN有什么用

2021-01-28 06:15:23

UCOSii里面的文件CPU和BSP是干什么用的

我以前用的UCosii里面的文件上多了2個(gè)文件夾，里面的這些有什么用？

2020-05-22 14:48:14

labview調(diào)用yolo 目標(biāo)檢測(cè)速度太慢？yolov4：速度和精度的完美結(jié)合，性能和精度碾壓yolov3

即可完成yolov4模型的調(diào)用下面是labview調(diào)用yolov4-tiny的gpu加速版本不能放視頻，抱歉據(jù)稱能達(dá)到371fps，利用mx250，實(shí)測(cè)達(dá)到100fps，即耗時(shí)10ms每幀，以至于

2021-01-05 09:22:02

【FPGA干貨分享六】基于FPGA協(xié)處理器的算法加速的實(shí)現(xiàn)

器可以包含一個(gè)存儲(chǔ)器存取(DMA)引擎。在增加額外的邏輯情況下，DMA引擎允許協(xié)處理器工作在位于連接到總線的存儲(chǔ)器上的數(shù)據(jù)塊，獨(dú)立于CPU。2. I/O連接與I/O連接的加速器直接連接到一個(gè)專用的I/O

2015-02-02 14:18:19

【EASY EAI Nano人工智能開發(fā)套件試用體驗(yàn)】RKNN YOLOV5 例程測(cè)試及橫向?qū)Ρ?/a>

RKNN1 YOLOV5 DEMO及與RKNN2硬件對(duì)比 introduct Rockchip 的 RKNN(Rockchip Neural Network) 是一款 AI 推理框架，能夠在

2023-05-31 21:49:42

【PYNQ-Z2申請(qǐng)】圖像目標(biāo)識(shí)別FPGA硬件加速

項(xiàng)目名稱：圖像目標(biāo)識(shí)別FPGA硬件加速試用計(jì)劃：申請(qǐng)理由本人供職于一家AI公司，現(xiàn)在在使用FPGA硬件加速相關(guān)目標(biāo)檢測(cè)算法的端側(cè)實(shí)現(xiàn)（鑒黃/司機(jī)行為識(shí)別），公司已經(jīng)有非常成熟的軟件算法以及GPU

2019-01-09 14:51:09

【愛芯派 Pro 開發(fā)板試用體驗(yàn)】yolov8模型轉(zhuǎn)換

-v **PWD:/data pulsar2:**{version} 預(yù)先已使用 onnxsim 將 mobilenetv2.onnx 進(jìn)行計(jì)算圖優(yōu)化如果用docker 環(huán)境，可能會(huì)遇到以下錯(cuò)誤

2023-11-20 12:19:32

【愛芯派 Pro 開發(fā)板試用體驗(yàn)】使用yolov5s模型（官方）

上下載好，然后上傳板子，當(dāng)然也可以下面的方法：獲取免費(fèi)的加速方式 1、打開 https://ghproxy.com/ 2、瀏覽網(wǎng)頁可知，通過在 git 鏈接前面添加 https

2023-11-13 11:04:14

一種專門用于檢測(cè)小目標(biāo)的框架Dilated Module

同時(shí)獲取細(xì)節(jié)特征和語義信息，為了模型加速，使用了1x1卷積來降維。（2）基于VEDAI數(shù)據(jù)集和DOTA 數(shù)據(jù)集，我們制作了一個(gè)small vehicle數(shù)據(jù)集，同時(shí)，分析了每個(gè)數(shù)據(jù)集的分布。（3）我們?cè)?/div>

2022-11-04 11:14:00

為什么用MOS管做開關(guān)管？

一. 電子開關(guān)設(shè)計(jì)1. 為什么用MOS管做開關(guān)管？2. MOS驅(qū)動(dòng)電路用圖騰柱還是用推挽電路？3. MOS懸浮電壓設(shè)計(jì)思想以及工作原理。二. PWM驅(qū)動(dòng)波形1. 頻率如何設(shè)置？2. 占空比如何調(diào)整

2021-12-28 07:17:04

為什么用T型加速對(duì)步進(jìn)電機(jī)進(jìn)行控制會(huì)出現(xiàn)頓卡的情況？

為什么用T型加速對(duì)步進(jìn)電機(jī)進(jìn)行控制會(huì)出現(xiàn)頓卡的情況

2023-10-09 07:28:12

為什么用矩陣鍵盤？

?10、KeyPad矩陣鍵盤，Proteus提供了多種矩陣鍵盤，有計(jì)算器，電話機(jī)，以及自定義的布局，封裝多個(gè)按鍵更形象生動(dòng)。再講矩陣鍵盤的原理前，還是講講為什么用矩陣鍵盤？當(dāng)按鍵數(shù)量很多時(shí)，為了節(jié)約

2021-07-13 08:33:05

今天咋們來談?wù)劊裁词?b class="flag-6" style="color: red">FPGA？為什么要使用它？

的集群，把 Bing 的搜索結(jié)果排序整體性能提高到了 2 倍（換言之，節(jié)省了一半的服務(wù)器）。如下圖所示，每 8 塊 FPGA 穿成一條鏈，中間用前面提到的 10 Gbps 專用網(wǎng)線來通信。這 8

2020-09-17 11:03:37

華為FPGA加速云服務(wù)器如何加速讓硬件應(yīng)用高效上云？

華為FPGA加速云服務(wù)器讓“硬用”上云成為新增長(zhǎng)點(diǎn)隨著通信和互聯(lián)網(wǎng)產(chǎn)業(yè)的快速發(fā)展，FPGA作為高性能計(jì)算加速器在大數(shù)據(jù)、深度學(xué)習(xí)、圖像視頻處理、基因計(jì)算、金融分析和加解密等眾多領(lǐng)域得到廣泛應(yīng)用，市場(chǎng)空間巨大。

2019-10-22 07:12:32

反碼位是什么？到底有什么用？

反碼位是什么？到底有什么用？

2021-05-07 07:16:09

在FPGA上加速過winograd嗎

在FPGA上加速過winograd嗎，有沒有和arm端做過加速結(jié)果比較

2022-09-21 11:28:56

在Sigma 300里面使用硬件加速器slew，slew mode為RC type時(shí)不同的time constant的值有什么用？

請(qǐng)問下在Sigma 300里面使用硬件加速器slew，slew mode為RC type時(shí)，對(duì)應(yīng)的time constant 與數(shù)據(jù)從當(dāng)前值到目標(biāo)值得時(shí)間有什么關(guān)系,或者說不同的time constant的值有什么用？謝謝, 中 J Jj

2023-11-29 07:25:43

基于 FPGA 的目標(biāo)檢測(cè)網(wǎng)絡(luò)加速電路設(shè)計(jì)

(FPGA)來構(gòu)建硬件加速電路，來提升計(jì)算CNN的性能。其中 ASIC 具備高性能、低功耗等特點(diǎn)，但 ASIC 的設(shè)計(jì)周期長(zhǎng)，制造成本高，而 GPU 的并行度高，計(jì)算速度快，具有深度流水線結(jié)構(gòu)，非常

2023-06-20 19:45:12

基于YOLOv5的目標(biāo)檢測(cè)文檔進(jìn)行的時(shí)候出錯(cuò)如何解決？

你好：按Milk-V Duo開發(fā)板實(shí)戰(zhàn)——基于YOLOv5的目標(biāo)檢測(cè) 安裝好yolov5環(huán)境，在執(zhí)行main.py的時(shí)候會(huì)出錯(cuò)，能否幫忙看下 main.py: import torch

2023-09-18 07:47:45

基于加速卡的FPGA生態(tài)系統(tǒng)布局是怎樣的？

FPGA加速卡是如何產(chǎn)生的？主要的FPGA加速卡產(chǎn)品有哪些？基于加速卡的FPGA生態(tài)系統(tǒng)布局是怎樣的？

2021-06-17 06:07:15

如何YOLOv5測(cè)試代碼？

使用文檔“使用 YOLOv5 進(jìn)行對(duì)象檢測(cè)”我試圖從文檔第 10 頁訪問以下鏈接（在 i.MX8MP 上部署 yolov5s 的步驟 - NXP 社區(qū)） ...但是這樣做時(shí)會(huì)被拒絕訪問。該文檔沒有說明需要特殊許可才能下載 test.zip 文件。NXP 的人可以提供有關(guān)如何訪問測(cè)試代碼的信息嗎？

2023-05-18 06:08:45

如何使用賽靈思FPGA加速包處理?

FAST包處理器的核心功能是什么如何使用賽靈思FPGA加速包處理?

2021-04-30 06:32:20

怎么樣用FPGA來驅(qū)動(dòng)DS1302芯片啊

怎么樣用FPGA來驅(qū)動(dòng)DS1302芯片啊

2013-05-15 20:03:52

怎樣使用PyTorch Hub去加載YOLOv5模型

PyTorch 快 2-5 倍專業(yè)提示：在CPU 基準(zhǔn)測(cè)試中， ONNX和OpenVINO可能比 PyTorch 快 2-3 倍環(huán)境YOLOv5 可以在以下任何經(jīng)過驗(yàn)證的最新環(huán)境中運(yùn)行（預(yù)裝了所有依賴項(xiàng)，包括CUDA / CUDNN、Python和PyTorch）。原作者：PyTorch Hub

2022-07-22 16:02:42

想問下為什么用mpu6050的加速度傳感器測(cè)不出yaw角,能不能用畫圖解釋下

想問下為什么用mpu6050的加速度傳感器測(cè)不出yaw角,能不能用畫圖解釋下

2018-05-25 17:41:16

排阻有什么用

`請(qǐng)問排阻有什么用？`

2019-10-21 15:58:12

是否可以用ccache來加速鴻蒙編譯

如題是否可以用ccache來加速鴻蒙編譯？應(yīng)該如何配置？

2021-01-09 20:55:34

晶圓有什么用

`　　誰來闡述一下晶圓有什么用？`

2020-04-10 16:49:13

機(jī)器學(xué)習(xí)實(shí)戰(zhàn)：GNN加速器的FPGA解決方案

，在本文撰寫之時(shí)，Googe和百度皆無法搜索到關(guān)于GNN硬件加速的中文研究。本文的撰寫動(dòng)機(jī)，旨在將國(guó)外最新的GNN算法、加速技術(shù)研究、以及筆者對(duì)GNN的FPGA加速技術(shù)的探討相結(jié)合起來，以全景圖的形式

2020-10-20 09:48:39

求大神講解下這個(gè)電路的Q1Q2有什么用？

電路中的Q1Q2不知道有什么用，直接把兩個(gè)三極管去掉工作也是正常的呀

2015-10-26 11:49:33

電子瓷片有什么用

電子瓷片有什么用

2012-01-15 18:04:23

電除塵為什么用直流電

`請(qǐng)問電除塵為什么用直流電？`

2019-09-23 16:44:35

自舉電容有什么用？

自舉電容有什么用？為什么有的buck有自舉電容，有的buck沒有自舉電容？

2021-06-15 08:23:01

講真，這絕對(duì)是加速FPGA的仿真過程的最佳方法

，DMA的同學(xué)具有很大幫助。其中工程中使用到了大量xilinx IP,也是對(duì)《FPGA仿真篇-使用腳本命令來加速仿真一》的進(jìn)一步補(bǔ)充和講解。2.使用腳本語言命令加速仿真Xapp859這個(gè)例程大家可以自己去

2020-04-25 08:00:00

設(shè)計(jì)電源類有什么用

設(shè)計(jì)電源類有什么用

2019-04-16 07:35:01

請(qǐng)問PRNG能做什么用？

PRNG能做什么用？

2023-06-26 06:43:55

請(qǐng)問cc3200中的ANTSEL1和ANTSEL2 有什么用呢？

請(qǐng)問cc3200中的ANTSEL1和ANTSEL2 有什么用呢？需不需設(shè)置！英文沒有看明白！求中文指點(diǎn)

2016-03-09 14:43:05

請(qǐng)問卡爾曼濾波有什么用？

卡爾曼濾波有什么用，怎么用？電調(diào)有什么用？小白，剛接觸四軸不懂。求大神解答

2019-04-18 01:12:59

請(qǐng)問四軸姿態(tài)解算為什么用加速度計(jì)的本次測(cè)量值和陀螺儀的上次值做叉乘？

1 為什么用加速度計(jì)的本次測(cè)量值和陀螺儀的上次值做叉乘？

2019-06-24 04:37:36

請(qǐng)問這是什么？有什么用？

這東西是什么？有什么用？

2017-04-19 11:35:08

采用Xilinx FPGA加速機(jī)器學(xué)習(xí)應(yīng)用

也因而開始轉(zhuǎn)向采用加速器來滿足低時(shí)延、高吞吐量的需求，同時(shí)保持合理的功耗水平。　　賽靈思FPGA所提供的功耗效率讓加速器能部署于整個(gè)數(shù)據(jù)中心，而且可將單位功耗性能比提升10-20倍。百度優(yōu)化的FPGA

2016-12-15 17:15:52

龍哥手把手教你學(xué)視覺-深度學(xué)習(xí)YOLOV5篇

高緯度數(shù)學(xué)工具來解決低維檢測(cè)問題的理想工具，這時(shí)候就體現(xiàn)了方法的重要性。Yolov5所采用的訓(xùn)練集提供的類別有80 類，有超過33 萬張圖片，其中20 萬張有標(biāo)注，整個(gè)數(shù)據(jù)集中個(gè)體的數(shù)目超過150 萬個(gè)

2021-09-03 09:39:28

肉類新鮮度檢測(cè)儀是什么，有什么用

肉類新鮮度檢測(cè)儀有什么用。肉類新鮮度檢測(cè)儀【恒美儀器HM-B12】為集成一體化食品安全快速檢測(cè)分析設(shè)備，廣泛應(yīng)用于食藥監(jiān)局、衛(wèi)生部門、學(xué)校食堂、農(nóng)業(yè)部門、養(yǎng)殖場(chǎng)、屠宰場(chǎng)

2021-04-06 11:36:26

目標(biāo)檢測(cè)-YOLOv2

編程語言行業(yè)芯事經(jīng)驗(yàn)分享

蒙特卡洛家的樹發(fā)布于 2022-03-09 17:49:21

華為 FPGA 加速云服務(wù)與傳統(tǒng) FPGA 開發(fā)相比有哪些優(yōu)勢(shì)？

在數(shù)據(jù)中心引入 FPGA 并實(shí)現(xiàn)云化加速業(yè)務(wù)成為必然趨勢(shì)。隨著華為云 FPGA 加速服務(wù)的推出，打破原有 FPGA 開發(fā)、測(cè)試和應(yīng)用存在的較高門檻，開啟了一個(gè)顛覆 FPGA 開發(fā)的新時(shí)代！

2017-10-10 10:49:17

4798

基于YOLOv2模型的監(jiān)控系統(tǒng)喪失對(duì)人物的識(shí)別能力，從而實(shí)現(xiàn)在攝像頭下順利”隱身”的效果

實(shí)驗(yàn)中，被 Toon Goedemé 和他的團(tuán)隊(duì)”迷惑”的攝像頭，使用著名的 YOLOv2 卷積神經(jīng)網(wǎng)絡(luò)。YOLOv2 屬于實(shí)時(shí)對(duì)象識(shí)別模型，它的結(jié)構(gòu)是由 9 個(gè)不同尺寸的卷積層連接而成。當(dāng)一張圖片

2019-04-29 17:37:40

3485

使用卷積神經(jīng)網(wǎng)絡(luò)技術(shù)實(shí)現(xiàn)行人檢測(cè)的方法詳細(xì)說明

針對(duì)復(fù)雜環(huán)境下行人檢測(cè)不能同時(shí)滿足高召回率與高效率檢測(cè)的問題，提出一種基于卷積神經(jīng)網(wǎng)絡(luò)（CNN）的行人檢測(cè)方法。首先，采用CNN中的單步檢測(cè)升級(jí)版網(wǎng)絡(luò)YOLOv2初步檢測(cè)行人；然后，設(shè)計(jì)一個(gè)網(wǎng)絡(luò)

2019-11-05 16:15:15

卷積神經(jīng)網(wǎng)絡(luò) 物體檢測(cè) YOLOv2

Convolution with Anchor Boxer - 加Anchor機(jī)制：YOLO是通過最后的全連接層直接預(yù)估絕對(duì)坐標(biāo)，而FasterRCNN是通過卷積層預(yù)估相對(duì)坐標(biāo)，作者認(rèn)為這樣更容易學(xué)習(xí)，因此YOLOv2去掉了全連接層，在最后一層卷積層下采樣后用Anchor

2020-04-17 15:51:01

2976

基于Tengine實(shí)現(xiàn)yolov4的cpu推理講解

本期講解便是基于 Tengine 實(shí)現(xiàn) yolov4的 cpu推理。完成動(dòng)機(jī)：主要是為了熟悉tengine的推理部署流程一、模型轉(zhuǎn)換采用下面鏈接中yolov4的...

2020-12-15 00:19:50

527

什么？不用GPU也能加速你的YOLOv3深度學(xué)習(xí)模型

解決煩惱，讓你的深度學(xué)習(xí)模型效率“一節(jié)更比七節(jié)強(qiáng)”！ Neural Magic是專門研究深度學(xué)習(xí)的稀疏方法的公司，這次他們發(fā)布了教程：用recipe稀疏化YOLOv3。聽起來有點(diǎn)意思啊，讓我們來看看是怎么實(shí)現(xiàn)的~ 稀疏化的YOLOv3 稀疏化的YOLOv3使用剪枝（prune）和量化（qua

2021-06-10 15:33:02

1975

NCNN Yolov5 Android apk開發(fā)記錄

本文轉(zhuǎn)自：知乎作者：djh一、環(huán)境準(zhǔn)備1.yolov5[鏈接]1、git clone 改模型。2、下載預(yù)編譯的模型，這里使用yolov5s2.ncnnReleases · Tenc...

2022-01-25 17:49:27

Tengine 支持 NPU 模型部署-YOLOv5s

今天我們?cè)囍?AI 邊緣計(jì)推理框架 Tengine 在 Khadas VIM3 的 AI 加速器上部署 YOLOv5s。

2022-01-25 18:38:24

Yolov3&Yolov4核心基礎(chǔ)知識(shí)

Yolov3是目標(biāo)檢測(cè)Yolo系列非常非常經(jīng)典的算法，不過很多同學(xué)拿到Yolov3或者Yolov4的cfg文件時(shí)，并不知道如何直觀的可視化查看網(wǎng)絡(luò)結(jié)構(gòu)。如果純粹看cfg里面的內(nèi)容，肯定會(huì)一臉懵逼。

2022-04-06 10:42:41

1810

深度解析YOLOv7的網(wǎng)絡(luò)結(jié)構(gòu)

最近，Scaled-YOLOv4的作者（也是后來的YOLOR的作者）和YOLOv4的作者AB大佬再次聯(lián)手推出了YOLOv7，目前來看，這一版的YOLOv7是一個(gè)比較正統(tǒng)的YOLO續(xù)作，畢竟有AB大佬在，得到了過YOLO原作的認(rèn)可。

2022-09-14 11:16:52

6325

加速 FPGA 計(jì)算的 2 張卡

新技術(shù)星期二：加速 FPGA 計(jì)算的 2 張卡

2022-12-30 09:40:20

539

使用旭日X3派的BPU部署Yolov5

本次主要介紹在旭日x3的BPU中部署yolov5。首先在ubuntu20.04安裝yolov5，并運(yùn)行yolov5并使用pytoch的pt模型文件轉(zhuǎn)ONNX。

2023-04-26 14:20:39

479

在AI愛克斯開發(fā)板上用OpenVINO?加速YOLOv8分類模型

本系列文章將在 AI 愛克斯開發(fā)板上使用 OpenVINO 開發(fā)套件依次部署并測(cè)評(píng) YOLOv8 的分類模型、目標(biāo)檢測(cè)模型、實(shí)例分割模型和人體姿態(tài)估計(jì)模型。

2023-05-05 11:47:53

561

在AI愛克斯開發(fā)板上用OpenVINO?加速YOLOv8目標(biāo)檢測(cè)模型

《在 AI 愛克斯開發(fā)板上用 OpenVINO 加速 YOLOv8 分類模型》介紹了在 AI 愛克斯開發(fā)板上使用 OpenVINO 開發(fā)套件部署并測(cè)評(píng) YOLOv8 的分類模型，本文將介紹在 AI 愛克斯開發(fā)板上使用 OpenVINO 加速 YOLOv8 目標(biāo)檢測(cè)模型。

2023-05-12 09:08:12

788

AI愛克斯開發(fā)板上使用OpenVINO加速YOLOv8目標(biāo)檢測(cè)模型

《在AI愛克斯開發(fā)板上用OpenVINO加速YOLOv8分類模型》介紹了在AI愛克斯開發(fā)板上使用OpenVINO 開發(fā)套件部署并測(cè)評(píng)YOLOv8的分類模型，本文將介紹在AI愛克斯開發(fā)板上使用OpenVINO加速YOLOv8目標(biāo)檢測(cè)模型。

2023-05-26 11:03:18

662

在AI愛克斯開發(fā)板上用OpenVINO?加速YOLOv8-seg實(shí)例分割模型

《在 AI 愛克斯開發(fā)板上用 OpenVINO 加速 YOLOv8 目標(biāo)檢測(cè)模型》介紹了在 AI 愛克斯開發(fā)板上使用 OpenVINO 開發(fā)套件部署并測(cè)評(píng) YOLOv8 的目標(biāo)檢測(cè)模型，本文將介紹在 AI 愛克斯開發(fā)板上使用 OpenVINO 加速 YOLOv8-seg 實(shí)例分割模型。

2023-06-05 11:52:15

561

在AI愛克斯開發(fā)板上用OpenVINO?加速YOLOv8-seg實(shí)例分割模型

2023-06-30 10:43:54

420

無Anchor的目標(biāo)檢測(cè)算法邊框回歸策略

導(dǎo)讀本文主要講述：1.無Anchor的目標(biāo)檢測(cè)算法：YOLOv1，CenterNet，CornerNet的邊框回歸策略；2.有Anchor的目標(biāo)檢測(cè)算法：SSD，YOLOv2，F(xiàn)aster

2023-07-17 11:17:05

558

解鎖YOLOv8修改+注意力模塊訓(xùn)練與部署流程

很多人也想跟修改YOLOv5源碼一樣的方式去修改YOLOv8的源碼，但是在github上面卻發(fā)現(xiàn)找到的YOLOv8項(xiàng)目下面TAG分支是空的

2023-08-11 14:14:40

2324

基于FPGA的加速基礎(chǔ)知識(shí)

電子發(fā)燒友網(wǎng)站提供《基于FPGA的加速基礎(chǔ)知識(shí).pdf》資料免費(fèi)下載

2023-09-18 10:12:20

OpenCV4.8+YOLOv8對(duì)象檢測(cè)C++推理演示

自從YOLOv5更新成7.0版本，YOLOv8推出以后，OpenCV4.6以前的版本都無法再加載導(dǎo)出ONNX格式模型了，只有OpenCV4.7以上版本才可以支持最新版本YOLOv5與YOLOv8模型的推理部署。首先看一下最新版本的YOLOv5與YOLOv8的輸入與輸出格式。

2023-09-27 11:07:05

632

深入淺出Yolov3和Yolov4

Yolov3是目標(biāo)檢測(cè)Yolo系列非常非常經(jīng)典的算法，不過很多同學(xué)拿到Yolov3或者Yolov4的cfg文件時(shí)，并不知道如何直觀的可視化查看網(wǎng)絡(luò)結(jié)構(gòu)。

2024-01-11 10:42:13

159

已全部加載完成

搜索歷史

為什么用FPGA來加速YOLOV2

評(píng)論