女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

經(jīng)典圖像分類算法AlexNet介紹

新機器視覺 ? 來源:智能計算系統(tǒng) ? 作者:智能計算系統(tǒng) ? 2022-04-06 14:50 ? 次閱讀

本期開小灶Heyro將帶領(lǐng)大家進入下一趟旅程——基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類算法講解,從而幫助大家了解在卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)下衍生出的被用于圖像分類的經(jīng)典算法。

在了解圖像分類算法以前,我們先來了解“何為圖像分類”。

圖像分類的核心是從給定的分類集合中給圖像分配一個標簽的任務(wù)。簡言之,我們需要對一個輸入圖像進行分析后返回一個對應(yīng)的分類標簽,標簽來自預先定義的可能類別集。圖像分類的任務(wù)即為正確給出輸入圖像的類別或輸出不同類別的概率。例如,我們先假設(shè)一個含有可能類別的類別集:

Categories = {cat, dog, fox}

然后,我們向分類系統(tǒng)提供一張狐貍?cè)膱D片。

經(jīng)過分類系統(tǒng)的處理,最終輸出可以是單一標簽dog,也可以是基于概率的多個標簽,例如cat:1%, dog:94%,fox:5% 。

計算機并不能像人類一樣快速通過視覺系統(tǒng)識別出圖像信息的語義。對于計算機而言,RGB圖像是由一個個像素數(shù)值構(gòu)成的高維矩陣(張量)。計算機識別圖像的任務(wù)即尋找一個函數(shù)關(guān)系,該函數(shù)可將高維矩陣信息映射到一個具體的類別標簽中。利用計算機實現(xiàn)圖像分類目的過程隨即衍生出圖像分類算法。

圖像分類算法的起源——神經(jīng)認知機

傳統(tǒng)的圖像識別模型一般包括:底層特征學習>特征編碼>空間約束>分類器設(shè)計>模型融合等幾個流程。

2012年Alex Krizhevsky提出的CNN(卷積神經(jīng)網(wǎng)絡(luò))模型在ImageNet大規(guī)模視覺識別比賽(ILSVRC)中脫穎而出,其效果大大超越了傳統(tǒng)的圖像識別方法,該模型被稱為AlexNet。

基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類算法起源最早可追溯到日本學者福島邦彥提出的neocognition(神經(jīng)認知機)神經(jīng)網(wǎng)絡(luò)模型。

福島邦彥于1978年至1984年研制了用于手寫字母識別的多層自組織神經(jīng)網(wǎng)絡(luò)——認知機。福島邦彥在認知機中引入了最大值檢出等概念。簡言之,當網(wǎng)格中某種神經(jīng)元損壞時,該神經(jīng)元立即可由其他神經(jīng)元來代替。由此一來,認知機就具有較好的容錯能力。

但是,認知機的網(wǎng)絡(luò)較為復雜,它對輸入的大小變換及平移、旋轉(zhuǎn)等變化并不敏感。雖然它能夠識別復雜的文字,但卻需要大量的處理單元和連接,這使得其硬件實現(xiàn)較為困難。

而福島邦彥在1980年提出的“神經(jīng)認知機”神經(jīng)網(wǎng)絡(luò)模型卻能夠很好地應(yīng)對以上問題。

該模型借鑒了生物的視覺神經(jīng)系統(tǒng)。它對模式信號的識別優(yōu)于認知機。無論輸入信號發(fā)生變換、失真,抑或被改變大小等,神經(jīng)認知機都能對輸入信號進行處理。但是,該模型被提出后一直未受到較大關(guān)注,直至AlexNet在ILSVRC中大獲全勝,卷積神經(jīng)網(wǎng)絡(luò)的潛力才為業(yè)界所認知。

深度學習算法

自AlexNet之后,深度學習的發(fā)展極為迅速,網(wǎng)絡(luò)深度也在不斷地快速增長,隨后出現(xiàn)了VGG(19層)、GoogleNet(22層)、ResNet(152層),以及SENet(252層)等深度學習算法。

隨著模型深度和結(jié)構(gòu)設(shè)計的發(fā)展,ImageNet分類的Top-5錯誤率也越來越低。在ImageNet上1000種物體的分類中,ResNet的Top-5錯誤率僅為3.57%。在同樣的數(shù)據(jù)集上,人眼的識別錯誤率約為5.1%,換言之,目前深度學習模型的識別能力已經(jīng)超過了人眼。

在卷積神經(jīng)網(wǎng)絡(luò)的歷史上,比較有里程碑意義的算法包括AlexNet、VGG、Inception (GoogleNet是Inception系列中的一員),以及ResNet。

在本期開小灶中,我們將首先為大家介紹經(jīng)典圖像分類算法AlexNet。

AlexNet 網(wǎng)絡(luò)結(jié)構(gòu)

作為G. Hinton代表作的AlexNet是深度學習領(lǐng)域最重要的成果之一。下面讓我們一起從左到右依次認識這個結(jié)構(gòu)。

在AlexNet網(wǎng)絡(luò)結(jié)構(gòu)(如下圖所示)中,輸入為一個224×224大小的RGB圖像。

經(jīng)典圖像分類算法AlexNet介紹

AlexNet網(wǎng)絡(luò)結(jié)構(gòu)

第一層卷積,用48個11×11×3的卷積核計算出48個55×55大小的特征圖,用另外48個11×11×3的卷積核計算出另外48個55×55大小的特征圖,這兩個分支的卷積步長都是4,通過卷積把圖像的大小從224′224減小為55×55。第一層卷積之后,進行局部響應(yīng)歸一化 (LRN) 以及步長為2、池化窗口為3×3的最大池化,池化輸出的特征圖大小為27×27。

第二層卷積,用兩組各128個5×5×48的卷積核對兩組輸入的特征圖分別進行卷積處理,輸出兩組各128個27×27的特征圖。第二層卷積之后,做局部響應(yīng)歸一化和步長為2、池化窗口為3×3的最大池化,池化輸出的特征圖大小為13×13。

第三層卷積,將兩組特征圖合為一組。采用192個3×3×256的卷積核對所有輸入特征圖做卷積運算,再用另外192個3×3×256的卷積核對所有輸入特征圖做卷積運算,輸出兩組各192個13×13的特征圖。

第四層卷積,對兩組輸入特征圖分別用192個3×3×192的卷積核做卷積運算。

第五層卷積,對兩組輸入特征圖分別用128個3×3×192的卷積核做卷積運算。第五層卷積之后,做步長為2、池化窗口為3×3的最大池化,池化輸出的特征圖大小為6×6。

第六層和第七層的全連接層都有兩組神經(jīng)元(每組2048個神經(jīng)元)。

第八層的全連接層輸出1000種特征并送到softmax中,softmax輸出分類的概率。

AlexNet 技術(shù)創(chuàng)新點

相較于傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)而言,AlexNet的技術(shù)創(chuàng)新體現(xiàn)在四個方面。

其一為Dropout(隨機失活)。Dropout于2012年由G. Hinton等人提出。該方法通過隨機舍棄部分隱層節(jié)點來緩解過擬合。目前,Dropout已經(jīng)成為深度學習訓練常用的技巧之一。

使用Dropout進行模型訓練的過程為:a. 以一定概率隨機舍棄部分隱層神經(jīng)元,即將這些神經(jīng)元的輸出設(shè)置為0;b.一小批訓練樣本經(jīng)過正向傳播后,在反向傳播更新權(quán)重時不更新其中與被舍棄神經(jīng)元相連的權(quán)重;c. 恢復被刪除神經(jīng)元,并輸入另一小批訓練樣本;d. 重復步驟a ~ c ,直到處理完所有訓練樣本。

其二為LRN(局部響應(yīng)歸一化)。LRN對同一層的多個輸入特征圖在每個位置上做局部歸一化,從而提升高響應(yīng)特征并抑制低響應(yīng)特征。LRN的輸入是卷積層輸出特征圖經(jīng)過ReLU激活函數(shù)后的輸出。但近年來業(yè)界發(fā)現(xiàn)LRN層作用有限,因此目前使用LRN的研究并不多。

其三是Max Pooling(最大池化)。最大池化可以避免特征被平均池化模糊,從而提高特征的魯棒性。在AlexNet之前,很多研究用平均池化;從AlexNet開始,業(yè)界公認最大池化的效果比較好。

其四是ReLU激活函數(shù)。在AlexNet之前,常用的激活函數(shù)是sigmoid和tanh。而ReLU函數(shù)很簡單,我們在之前的開小灶中為大家講解過ReLU激活函數(shù)的特征,即輸入小于0時輸出0,輸入大于0時輸出等于輸入。看似非常簡單的ReLU函數(shù)卻在訓練時帶來了非常好的效果,這是業(yè)界在AlexNet之前未曾料想到的。AlexNet在卷積層和全連接層的輸出均使用ReLU激活函數(shù),從而有效提高訓練時的收斂速度。

AlexNet通過把看似平凡的技術(shù)組合起來取得了驚人的顯著效果。

正是由于AlexNet采用了深層神經(jīng)網(wǎng)絡(luò)的訓練思路,并輔以ReLU函數(shù)、Dropout及數(shù)據(jù)擴充等操作,使得圖像識別真正走向了與深度學習結(jié)合發(fā)展的方向。

原文標題:基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類算法講解

文章出處:【微信公眾號:機器視覺智能檢測】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4807

    瀏覽量

    102756
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4698

    瀏覽量

    94721

原文標題:基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類算法講解

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    基于RV1126開發(fā)板實現(xiàn)自學習圖像分類方案

    在RV1126開發(fā)板上實現(xiàn)自學習:在識別前對物體圖片進行模型學習,訓練完成后通過算法分類得出圖像的模型ID。 方案設(shè)計邏輯流程圖,方案代碼分為分為兩個業(yè)務(wù)流程,主體代碼負責抓取、合成
    的頭像 發(fā)表于 04-21 13:37 ?11次閱讀
    基于RV1126開發(fā)板實現(xiàn)自學習<b class='flag-5'>圖像</b><b class='flag-5'>分類</b>方案

    FPGA上的圖像處理算法集成與優(yōu)化

    本文詳細介紹了多種圖像處理技術(shù),包括RG/GB單通道提取、亮度和對比度調(diào)整、圖像反轉(zhuǎn)、均值濾波、高斯濾波、圖像銳化、中值濾波、閾值分割、邊緣檢測(Sobel算子)、
    的頭像 發(fā)表于 02-14 13:46 ?506次閱讀
    FPGA上的<b class='flag-5'>圖像</b>處理<b class='flag-5'>算法</b>集成與優(yōu)化

    xgboost在圖像分類中的應(yīng)用

    和易用性,在各種機器學習任務(wù)中得到了廣泛應(yīng)用,包括分類、回歸和排序問題。在圖像分類領(lǐng)域,盡管深度學習模型(如卷積神經(jīng)網(wǎng)絡(luò)CNN)占據(jù)主導地位,但XGBoost仍然有其獨特的應(yīng)用價值,特別是在數(shù)據(jù)量較小或需要快速原型開發(fā)的場景中。
    的頭像 發(fā)表于 01-19 11:16 ?846次閱讀

    ?ISP算法及架構(gòu)分析介紹

    一、ISP算法及架構(gòu)分析介紹 ISP即Image Signal Processor,是一種圖像處理架構(gòu),不是我們用的下載器。 ISP其實算是圖像處理的一個特例,一般應(yīng)用于前端設(shè)備(相對
    的頭像 發(fā)表于 11-26 10:05 ?1573次閱讀
    ?ISP<b class='flag-5'>算法</b>及架構(gòu)分析<b class='flag-5'>介紹</b>

    【「從算法到電路—數(shù)字芯片算法的電路實現(xiàn)」閱讀體驗】+介紹基礎(chǔ)硬件算法模塊

    作為嵌入式開發(fā)者往往比較關(guān)注硬件和軟件的協(xié)調(diào)。本書介紹了除法器,信號發(fā)生器,濾波器,分頻器等基本算法的電路實現(xiàn),雖然都是基礎(chǔ)內(nèi)容,但是也是最常用到的基本模塊。 隨著逆全球化趨勢的出現(xiàn),過去的研發(fā)
    發(fā)表于 11-21 17:05

    使用卷積神經(jīng)網(wǎng)絡(luò)進行圖像分類的步驟

    使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)進行圖像分類是一個涉及多個步驟的過程。 1. 問題定義 確定目標 :明確你想要分類圖像類型,例如貓和狗、不同的植物種類等。 數(shù)據(jù)需求 :確定需要多少數(shù)據(jù)以及
    的頭像 發(fā)表于 11-15 15:01 ?754次閱讀

    主動學習在圖像分類技術(shù)中的應(yīng)用:當前狀態(tài)與未來展望

    本文對近年來提出的主動學習圖像分類算法進行了詳細綜述,并根據(jù)所用樣本數(shù)據(jù)處理及模型優(yōu)化方案,將現(xiàn)有算法分為三類:基于數(shù)據(jù)增強的算法,包括利用
    的頭像 發(fā)表于 11-14 10:12 ?1105次閱讀
    主動學習在<b class='flag-5'>圖像</b><b class='flag-5'>分類</b>技術(shù)中的應(yīng)用:當前狀態(tài)與未來展望

    圖像識別算法有哪幾種

    圖像識別算法是計算機視覺領(lǐng)域的核心技術(shù)之一,它通過分析和處理圖像數(shù)據(jù),實現(xiàn)對圖像中的目標、場景和物體的識別和分類
    的頭像 發(fā)表于 07-16 11:22 ?2253次閱讀

    圖像識別算法都有哪些方法

    圖像識別算法是計算機視覺領(lǐng)域的核心任務(wù)之一,它涉及到從圖像中提取特征并進行分類、識別和分析的過程。隨著深度學習技術(shù)的不斷發(fā)展,圖像識別
    的頭像 發(fā)表于 07-16 11:14 ?7149次閱讀

    圖像識別算法的提升有哪些

    引言 圖像識別是計算機視覺領(lǐng)域的核心任務(wù)之一,旨在使計算機能夠自動地識別和理解圖像中的內(nèi)容。隨著計算機硬件的發(fā)展和深度學習技術(shù)的突破,圖像識別算法的性能得到了顯著提升。本文將
    的頭像 發(fā)表于 07-16 11:12 ?979次閱讀

    圖像識別算法的優(yōu)缺點有哪些

    圖像識別算法是一種利用計算機視覺技術(shù)對圖像進行分析和理解的方法,它在許多領(lǐng)域都有廣泛的應(yīng)用,如自動駕駛、醫(yī)療診斷、安全監(jiān)控等。然而,圖像識別算法
    的頭像 發(fā)表于 07-16 11:09 ?2846次閱讀

    圖像識別算法的核心技術(shù)是什么

    圖像識別算法是計算機視覺領(lǐng)域的一個重要研究方向,其目標是使計算機能夠像人類一樣理解和識別圖像中的內(nèi)容。圖像識別算法的核心技術(shù)包括以下幾個方面
    的頭像 發(fā)表于 07-16 11:02 ?1163次閱讀

    opencv圖像識別有什么算法

    OpenCV(Open Source Computer Vision Library)是一個開源的計算機視覺和機器學習軟件庫,提供了大量的圖像處理和計算機視覺相關(guān)的算法。以下是一些常見的OpenCV
    的頭像 發(fā)表于 07-16 10:40 ?1740次閱讀

    經(jīng)典卷積網(wǎng)絡(luò)模型介紹

    經(jīng)典卷積網(wǎng)絡(luò)模型在深度學習領(lǐng)域,尤其是在計算機視覺任務(wù)中,扮演著舉足輕重的角色。這些模型通過不斷演進和創(chuàng)新,推動了圖像處理、目標檢測、圖像生成、語義分割等多個領(lǐng)域的發(fā)展。以下將詳細探討幾個經(jīng)典
    的頭像 發(fā)表于 07-11 11:45 ?1056次閱讀

    計算機視覺怎么給圖像分類

    圖像分類是計算機視覺領(lǐng)域中的一項核心任務(wù),其目標是將輸入的圖像自動分配到預定義的類別集合中。這一過程涉及圖像的特征提取、特征表示以及分類器的
    的頭像 發(fā)表于 07-08 17:06 ?1541次閱讀