女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

深度剖析卷積操作的維度計算

電子工程師 ? 來源:今日頭條 ? 作者:數(shù)據(jù)學習DataLearn ? 2021-03-24 15:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

卷積操作的維度計算是定義神經(jīng)網(wǎng)絡結構的重要問題,在使用如PyTorch、Tensorflow深度學習框架搭建神經(jīng)網(wǎng)絡的時候,對每一層輸入的維度和輸出的維度都必須計算準確,否則容易出錯,這里將詳細說明相關的維度計算。

一、卷積操作的維度計算

卷積操作的維度計算是定義神經(jīng)網(wǎng)絡結構的重要問題,在使用如PyTorch、Tensorflow等深度學習框架搭建神經(jīng)網(wǎng)絡的時候,對每一層輸入的維度和輸出的維度都必須計算準確,否則容易出錯,這里將詳細說明相關的維度計算。

首先,我們看一下卷積操作涉及的東西,一個卷積操作需要定義卷積核的大小、輸入圖像的padding長度以及卷積操作的步長。以一個RGB圖像輸入為例,一個多卷積核操作的示意圖如下:

使用兩個卷積核掃描輸入圖像

這個例子的輸入數(shù)據(jù)是一個三維數(shù)據(jù),帶有通道數(shù),輸入數(shù)據(jù)第三個維度是通道數(shù),使用了兩個卷積核(濾波器)掃描得到一個帶有兩個通道的圖像(一個卷積核對一個三維的數(shù)據(jù),即帶多個通道的二維圖像掃描可以得到一個二維單通道圖像結果,要求卷積核也是三維,且通道數(shù)和輸入數(shù)據(jù)通道數(shù)一樣)。下面我們來描述具體計算。

假設輸入數(shù)據(jù)大小是w × h,其中,w是寬度,h是高度。掃描的卷積核大小是f × f。padding的長度是p(padding),步長是s(stride)。那么經(jīng)過卷積操作之后,輸出的數(shù)據(jù)大小:

如果輸入的數(shù)據(jù)是三維數(shù)據(jù),即:w × h × c。其中,w是寬度,h是高度,c是通道數(shù)(對于RGB圖像輸入來說,這個值一般是3,在文本處理中,通常是不同embedding模型的個數(shù),如采用騰訊訓練的、谷歌訓練的等)。這個時候的卷積核通常也是帶通道的三維卷積核:f × f × c。

注意,一般來說,卷積核的通道數(shù)c和輸入數(shù)據(jù)的通道數(shù)是一致的。因此,這個時候卷積之后的輸出依然是一個二維數(shù)據(jù),其大小為:

這里的維度做了向下取整,防止結果不是整數(shù)的情況。假如希望輸出的也是帶通道的結果,那么這時候就要使用多個卷積核來操作了,最終輸出的數(shù)據(jù)維度是:

其中c'是卷積核的個數(shù)。

二、深度學習框架中Conv1d、Conv2d

在像PyTorch、Tensorflow中,都有類似Conv1d、Conv2d和Conv3d的操作。這也都和卷積操作的維度有關,里面的參數(shù)都要定義好。例如如下的卷積操作:

self.convs = nn.Sequential( nn.Conv1d(in_channels=32, out_channels=16, kernel_size=5, stride=1, padding=0), nn.BatchNorm1d(16), nn.ReLU(inplace=True) )

這里面的參數(shù)要定義好,否則容易出錯。我們將分別介紹。

Conv1d是一維卷積操作,它要求輸入的數(shù)據(jù)是三維的,即:N × C_in × L_in。

最終輸出的參數(shù)也是三維的:N × C_out × L_out。

這里的N是mini batch size,C是通道數(shù)量,L是寬度。

這里的out_channels定義了將由幾個卷積核來掃描,kernel_size則定義了每一個卷積核大小,都可以自己定義。最終,輸出的min_batch_size不變,out_channels數(shù)量根據(jù)定義的參數(shù)來,而輸出的width計算如下:

深度學習卷積操作的維度計算

這里的p是上面padding的參數(shù)值,f是kernel_size的值。類似的,如果使用Conv2D做卷積操作,那么輸入就是四維的:N × C_in × H_in × W_in。

這里的N是min batch size,C_in是輸入數(shù)據(jù)的通道數(shù),H_in是輸入數(shù)據(jù)的高度,W_in是輸入數(shù)據(jù)的寬度。其輸出也是四維的,根據(jù)定義的卷積核大小和數(shù)量得到的輸出維度如下:N × C_out × H_out × W_out。其中,C_out是根據(jù)卷積核的數(shù)量定義的輸出數(shù)據(jù)的通道數(shù),因為一個卷積核只能掃描得到一個二維圖。其中H_out 和 W_out的計算如下:

三、總結

卷積操作的輸入和輸出數(shù)據(jù)的維度在構建神經(jīng)網(wǎng)絡中很重要,也很容易出錯。使用PyTorch或者Tensoflow構建卷積神經(jīng)網(wǎng)絡的時候一定要注意參數(shù)的設置,如果計算錯誤,下一層的輸入與上一層的輸出對不上那么很有可能失敗。為了避免這種情況發(fā)生,可以先用小數(shù)據(jù)集測試,同時為了檢測哪里出錯可以在測試的時候把每一層的輸出結果的維度(shape)打印出來,這樣就更容易檢測結果了。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 濾波器
    +關注

    關注

    162

    文章

    8139

    瀏覽量

    182131
  • RGB
    RGB
    +關注

    關注

    4

    文章

    807

    瀏覽量

    59956
  • 卷積
    +關注

    關注

    0

    文章

    95

    瀏覽量

    18762
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    大模型推理顯存和計算量估計方法研究

    估算剪枝后的模型所需的顯存大小。 三、計算量估計方法 基于模型結構的計算量估計 根據(jù)深度學習模型的層次結構和參數(shù)數(shù)量,可以估算模型在推理過程中的計算量。具體方法如下: (1)統(tǒng)計模型中
    發(fā)表于 07-03 19:43

    從接口到架構:工控一體機定制化的深度技術剖析

    工業(yè)場景需求的關鍵路徑。本文將從接口設計、硬件架構、操作系統(tǒng)、通信協(xié)議及智能決策五個維度深度剖析工控一體機定制化的技術內(nèi)核。 一、接口定制化:工業(yè)互聯(lián)的“神經(jīng)末梢” 工控一體機的接口
    的頭像 發(fā)表于 06-17 16:47 ?154次閱讀

    如何使用MATLAB實現(xiàn)一維時間卷積網(wǎng)絡

    本文對一維卷積操作進行介紹,包括一維擴展卷積和一維因果卷積,以及 MATLAB 對一維卷積的支持情況。在最后通過一個實例演示如何在 MATL
    的頭像 發(fā)表于 03-07 09:15 ?1086次閱讀
    如何使用MATLAB實現(xiàn)一維時間<b class='flag-5'>卷積</b>網(wǎng)絡

    BNC 連接器接線原理深度剖析

    在電子設備的信號連接領域,BNC 連接器作為一種射頻同軸連接器,憑借其穩(wěn)定的性能和便捷的操作,在通信、廣播電視、測試測量等行業(yè)中占據(jù)著舉足輕重的地位。深入了解 BNC 連接器的接線原理,對于正確
    的頭像 發(fā)表于 02-28 08:45 ?580次閱讀
    BNC 連接器接線原理<b class='flag-5'>深度</b><b class='flag-5'>剖析</b>

    AI云端計算資源的多維度優(yōu)勢

    AI云端計算資源,作為AI技術與云計算深度融合的產(chǎn)物,在成本效益、性能優(yōu)化、數(shù)據(jù)安全、靈活擴展以及創(chuàng)新加速等多個維度都具有顯著優(yōu)勢。下面,AI部落小編帶您探討AI云端
    的頭像 發(fā)表于 01-07 11:11 ?489次閱讀

    AI模型部署邊緣設備的奇妙之旅:目標檢測模型

    步長。 卷積計算過程 2.3.2 逐深度卷積深度卷積(Depthwise convolut
    發(fā)表于 12-19 14:33

    卷積神經(jīng)網(wǎng)絡的參數(shù)調(diào)整方法

    的數(shù)量和大小 :增加卷積層可以提高模型的學習能力,但同時也會增加計算成本和過擬合的風險。通常需要根據(jù)具體任務和數(shù)據(jù)集的大小來平衡這兩者。 濾波器(卷積核)的數(shù)量和大小 :濾波器的數(shù)量決定了特征圖的
    的頭像 發(fā)表于 11-15 15:10 ?1217次閱讀

    卷積神經(jīng)網(wǎng)絡在自然語言處理中的應用

    自然語言處理是人工智能領域的一個重要分支,它致力于使計算機能夠理解、解釋和生成人類語言。隨著深度學習技術的發(fā)展,卷積神經(jīng)網(wǎng)絡(CNNs)作為一種強大的模型,在圖像識別和語音處理等領域取得了顯著成果
    的頭像 發(fā)表于 11-15 14:58 ?808次閱讀

    深度學習中的卷積神經(jīng)網(wǎng)絡模型

    深度學習近年來在多個領域取得了顯著的進展,尤其是在圖像識別、語音識別和自然語言處理等方面。卷積神經(jīng)網(wǎng)絡作為深度學習的一個分支,因其在圖像處理任務中的卓越性能而受到廣泛關注。 卷積神經(jīng)網(wǎng)
    的頭像 發(fā)表于 11-15 14:52 ?851次閱讀

    卷積神經(jīng)網(wǎng)絡的基本原理與算法

    卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,CNN)是一類包含卷積計算且具有深度結構的前饋神經(jīng)網(wǎng)絡(Feedforward Neural Networks
    的頭像 發(fā)表于 11-15 14:47 ?1789次閱讀

    FPGA加速深度學習模型的案例

    FPGA(現(xiàn)場可編程門陣列)加速深度學習模型是當前硬件加速領域的一個熱門研究方向。以下是一些FPGA加速深度學習模型的案例: 一、基于FPGA的AlexNet卷積運算加速 項目名稱
    的頭像 發(fā)表于 10-25 09:22 ?1242次閱讀

    高斯濾波的卷積核怎么確定

    N為一個奇數(shù),如3、5、7等。奇數(shù)大小的卷積核有助于確定一個中心像素點,便于計算。 大小選擇 :卷積核的大小決定了濾波器的范圍。較大的卷積核可以覆蓋更多的像素點,從而更好地平滑圖像,但
    的頭像 發(fā)表于 09-29 09:29 ?1697次閱讀

    MEMS 可編程振蕩器的卓越代表:SiT9121 系列(1 to 220 MHZ)深度剖析

    MEMS 可編程振蕩器的卓越代表:SiT9121 系列(1 to 220 MHZ)深度剖析
    的頭像 發(fā)表于 08-13 10:56 ?1044次閱讀
    MEMS 可編程振蕩器的卓越代表:SiT9121 系列(1 to 220 MHZ)<b class='flag-5'>深度</b><b class='flag-5'>剖析</b>

    探索巔峰性能 | 迅為RK3588開發(fā)板深度剖析

    探索巔峰性能 | 迅為RK3588開發(fā)板深度剖析
    的頭像 發(fā)表于 08-12 14:07 ?1628次閱讀
    探索巔峰性能 | 迅為RK3588開發(fā)板<b class='flag-5'>深度</b><b class='flag-5'>剖析</b>

    表面貼裝低相位噪音晶體振蕩器 DSO531SHH 深度剖析

    表面貼裝低相位噪音晶體振蕩器 DSO531SHH 深度剖析
    的頭像 發(fā)表于 07-26 14:12 ?722次閱讀
    表面貼裝低相位噪音晶體振蕩器 DSO531SHH <b class='flag-5'>深度</b><b class='flag-5'>剖析</b>