資料介紹
我們訓練了一個大型的深度卷積神經網絡,來將在ImageNet LSVRC-2010 大賽中的120萬張高清圖像分為1000 個不同的類別。對測試數據,我們得到了top-1 誤差率37.5%,以及top-5 誤差率17.0%,這個效果比之前最頂尖的都要好得多。該神經網絡有6000 萬個參數和650,000 個神經元,由五個卷積層,以及某些卷積層后跟著的max-pooling 層,和三個全連接層,還有排在最后的1000-way 的softmax 層組成。為了使訓練速度更快,我們使用了非飽和的神經元和一個非常高效的GPU 關于卷積運算的工具。為了減少全連接層的過擬合,我們采用了最新開發的正則化方法,稱為“ dropout”,它已被證明是非常有效的。在ILSVRC-2012 大賽中,我們又輸入了該模型的一個變體,并依靠top-5 測試誤差率15.3%取得了勝利,相比較下,次優項的錯誤率是26.2%。
?
1 引言
當前物體識別的方法基本上都使用了機器學習方法。為了改善這些方法的性能,我們可以收集更大的數據集,學習更強有力的模型,并使用更好的技術,以防止過擬合。直到最近,標記圖像的數據集都相當小——大約數萬張圖像(例如,NORB [16] ,Caltech-101/256[8, 9] ,以及CIFAR-10/100 [12] )。簡單的識別任務可以用這種規模的數據集解決得相當好,特別是當它們用標簽-保留轉換增強了的時候。例如,在MNIST 數字識別任務中當前最好的誤差率(《0.3%)接近于人類的表現[4] 。但是現實環境中的物體表現出相當大的變化,因此要學習它們以對它們進行識別就必須使用更大的訓練集。事實上,小規模圖像數據集的缺陷已被廣泛認同(例如, Pinto 等人[21]),但是直到最近,收集有著上百萬張圖像的帶標簽數據集才成為可能。更大型的新數據集包括LabelMe [23],它由幾十萬張完全分割圖組成,還有ImageNet [6],它由多于22,000個種類中超過1500 萬張帶標簽的高分辨率圖像組成。
為了從幾百萬張圖像中學習數以千計的物體,我們需要一個學習能力更強的模型。然而,物體識別任務的極大復雜性意味著這個問題不能被指定,即使是通過與ImageNet一樣大的數據集,所以我們的模型中也應該有大量的先驗知識,以補償我們所沒有的全部數據。卷積神經網絡(CNN)構成了一個這種類型的模型[16, 11, 13, 18, 15, 22, 26]。它們的能力可以通過改變其深度與廣度得到控制,它們也可作出有關圖像性質的強壯且多半正確的假設(即,統計數據的穩定性和像素依賴關系的局部性) 。因此,與層次規模相同的標準前饋神經網絡相比, CNN 的連接關系和參數更少,所以更易于訓練,而其理論上的最佳性能可能只略差一點。不論CNN 的性質多有吸引力, 也不論它們局部結構的相對效率有多高,將它們大規模地應用到高分辨率圖像中仍然是極其昂貴的。幸運的是,目前的GPU 搭配了一個高度優化的2D 卷積工具,強大到足以促進大規模CNN 的訓練,而且最近的數據集像ImageNet2包含足夠的帶標簽的樣例來訓練這樣的模型,還不會有嚴重的過擬合。本文的具體貢獻如下:我們在ILSVRC-2010 和ILSVRC-2012 大賽中使用過的ImageNet的子集上[2] ,訓練了迄今為止最大型的卷積神經網絡之一,并取得了迄今為止在這些數據集上報告過的最好結果。我們寫了一個高度優化的GPU 二維卷積工具以及訓練卷積神經網絡過程中的所有其他操作,這些我們都提供了公開地址。我們的網絡中包含一些既新鮮而又不同尋常的特征,它們提高了網絡的性能,并減少了網絡的訓練時間,這些詳見第3 節。我們的網絡中甚至有120 萬個帶標簽的訓練樣本,這么大的規模使得過擬合成為一個顯著的問題,所以我們使用了幾種有效的方法來防止過擬合,這些在第4 節中給以描述。我們最終的網絡包含五個卷積層和三個全連接層,且這種層次深度似乎是重要的:我們發現,移去任何卷積層(其中每一個包含的模型參數都不超過1%)都會導致性能變差。
最后,網絡的規模主要受限于當前GPU 的可用內存和我們愿意容忍的訓練時間。我們的網絡在兩塊GTX 580 3GB GPU 上訓練需要五到六天。我們所有的實驗表明,等更快的GPU 和更大的數據集可用以后,我們的結果就可以輕而易舉地得到改進。
- 基于域適應的卷積神經網絡人臉識別結構 7次下載
- 深度學習中的卷積神經網絡層級分解綜述 5次下載
- 基于剪枝與量化的卷積神經網絡壓縮算法 6次下載
- 基于不同神經網絡的文本分類方法研究對比 49次下載
- 綜述深度學習的卷積神經網絡模型應用及發展 20次下載
- 使用深度卷積神經網絡進行ImageNet數據庫分類 4次下載
- 基于特征交換的卷積神經網絡圖像分類算法 27次下載
- 綜述深度神經網絡的解釋方法及發展趨勢 19次下載
- 基于深度神經網絡的文本分類分析 37次下載
- 基于多孔卷積神經網絡的圖像深度估計模型 5次下載
- 如何使用深度卷積神經網絡改進服裝圖像分類檢索算法 6次下載
- 如何使用復雜網絡描述進行圖像深度卷積的分類方法介紹 4次下載
- 如何使用混合卷積神經網絡和循環神經網絡進行入侵檢測模型的設計 19次下載
- 卷積神經網絡的權值反向傳播機制和MATLAB的實現方法 14次下載
- 面向大規模圖像分類的深度卷積神經網絡的優化 3次下載
- 卷積神經網絡共包括哪些層級 1457次閱讀
- 神經網絡中的卷積層、池化層與全連接層 6600次閱讀
- 全卷積神經網絡的工作原理和應用 1237次閱讀
- BP神經網絡和卷積神經網絡的關系 1677次閱讀
- 卷積神經網絡與循環神經網絡的區別 3582次閱讀
- 深度學習與卷積神經網絡的應用 978次閱讀
- 卷積神經網絡的基本概念和工作原理 3962次閱讀
- 卷積神經網絡在文本分類領域的應用 782次閱讀
- 卷積神經網絡的基本結構 515次閱讀
- 詳解深度學習、神經網絡與卷積神經網絡的應用 2241次閱讀
- 詳解卷積神經網絡卷積過程 1.8w次閱讀
- NVIDIA深度神經網絡加速庫cuDNN軟件安裝教程 2288次閱讀
- 卷積神經網絡CNN架構分析-LeNet 2769次閱讀
- 初學者必讀:卷積神經網絡指南(一) 1724次閱讀
- 【科普】卷積神經網絡(CNN)基礎介紹 1.1w次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費下載
- 0.00 MB | 1491次下載 | 免費
- 2單片機典型實例介紹
- 18.19 MB | 95次下載 | 1 積分
- 3S7-200PLC編程實例詳細資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識別和講解說明
- 4.28 MB | 18次下載 | 4 積分
- 5開關電源原理及各功能電路詳解
- 0.38 MB | 11次下載 | 免費
- 6100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 7基于單片機和 SG3525的程控開關電源設計
- 0.23 MB | 4次下載 | 免費
- 8基于AT89C2051/4051單片機編程器的實驗
- 0.11 MB | 4次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費
- 4LabView 8.0 專業版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費
- 5555集成電路應用800例(新編版)
- 0.00 MB | 33562次下載 | 免費
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費
- 8開關電源設計實例指南
- 未知 | 21539次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537793次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191183次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183277次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138039次下載 | 免費
評論