隨著Halcon新版本的更新,截止2019年5月1號(hào)。Halcon的最新版本為halcon18.11.這次新版本最大的更新在于完整的加入了深度學(xué)習(xí)在視覺(jué)應(yīng)用的三個(gè)重要部分,即目標(biāo)分類分類、目標(biāo)檢測(cè)、語(yǔ)義分割這三個(gè)內(nèi)容。與此同時(shí)超人視覺(jué)即將向大家簡(jiǎn)介Halcon軟件這三個(gè)方向的應(yīng)用示例,幫助大家進(jìn)一步認(rèn)識(shí)到機(jī)器視覺(jué)的魅力與當(dāng)前的機(jī)器視覺(jué)技術(shù)的應(yīng)用前沿。
在開(kāi)始內(nèi)容前我們先明確一下前面提到的三個(gè)重要概念即深度學(xué)習(xí)下的分類,目標(biāo)檢測(cè)、語(yǔ)義分割這三個(gè)方向具體的概念及其應(yīng)用場(chǎng)景是什么?幫助大家理解其技術(shù)的產(chǎn)生背景以及形成自己的理解。
1圖像分類
圖像分類這一類問(wèn)題常用與區(qū)分不同的物品,圖像分類,顧名思義,是一個(gè)輸入圖像,輸出對(duì)該圖像內(nèi)容分類的描述的問(wèn)題。它是視覺(jué)方向的其中一個(gè)核心,實(shí)際應(yīng)用廣泛。許多同學(xué)在學(xué)習(xí)計(jì)算機(jī)視覺(jué)中有一個(gè)練習(xí)題是練習(xí)如何區(qū)分貓狗如圖1所示:
我們觀察一下這些圖片的特點(diǎn),這些圖片各種各樣,分辨率也各不相同。圖片中的貓和狗形狀、所處位置、體表顏色各不一樣。它們的姿態(tài)不同,有的在坐著而有的則不是,它們的情緒可能是開(kāi)心的也可能是傷心的,貓可能在睡覺(jué),而狗可能在汪汪地叫著。照片可能以任一焦距從任意角度拍下。
總而言之這些圖片有著無(wú)限種可能,對(duì)于我們?nèi)祟悂?lái)說(shuō)在一系列不同種類的照片中識(shí)別出一個(gè)場(chǎng)景中的寵物自然是毫不費(fèi)力的事情,然而這對(duì)于一臺(tái)機(jī)器來(lái)說(shuō)可不是一件小事。實(shí)際上,如果要機(jī)器實(shí)現(xiàn)自動(dòng)分類,那么我們需要知道如何強(qiáng)有力地描繪出貓和狗的特征,也就是說(shuō)為什么我們認(rèn)為這張圖片中的是貓,而那張圖片中的卻是狗。這個(gè)需要描繪每個(gè)動(dòng)物的內(nèi)在特征。
1.在傳統(tǒng)的分類方法下圖像分類是特征描述及檢測(cè),這類傳統(tǒng)方法可能對(duì)于一些簡(jiǎn)單的圖像分類是有效的,但由于實(shí)際情況非常復(fù)雜,傳統(tǒng)的分類方法不堪重負(fù)。深度學(xué)習(xí)下的神經(jīng)網(wǎng)絡(luò)在圖像分類任務(wù)上效果很好的原因是,它們有著能夠自動(dòng)學(xué)習(xí)多重抽象層的能力,神經(jīng)網(wǎng)絡(luò)可以識(shí)別極端變化的模式,在扭曲的圖像和經(jīng)過(guò)簡(jiǎn)單的幾何變換的圖像上也有著很好的魯棒性。
2目標(biāo)檢測(cè)
圖像分類是將圖像劃分為單個(gè)類別,通常對(duì)應(yīng)于圖像中最突出的物體。但是現(xiàn)實(shí)世界的很多圖片通常包含不只一個(gè)物體,此時(shí)如果使用圖像分類模型為圖像分配一個(gè)單一標(biāo)簽其實(shí)是非常粗糙的,并不準(zhǔn)確。對(duì)于這樣的情況,就需要目標(biāo)檢測(cè)模型,目標(biāo)檢測(cè)模型可以識(shí)別一張圖片的多個(gè)物體,并可以定位出不同物體并且給出邊界框。目標(biāo)檢測(cè)在很多場(chǎng)景有用,如無(wú)人駕駛和安防系統(tǒng)。
傳統(tǒng)的目標(biāo)檢測(cè)的算法多用模板匹配完成,但是模板匹配針對(duì)復(fù)雜場(chǎng)景下下的識(shí)別并不良好,特別是在光照情況不穩(wěn)定物體有遮擋的情況下算法的魯棒性如何確保一直是傳統(tǒng)視覺(jué)算法的一個(gè)難題。
由上圖所示,我們可以總結(jié)出來(lái)目標(biāo)檢測(cè)要解決的核心問(wèn)題是:1)目標(biāo)可能出現(xiàn)在圖像的任何位置,2)目標(biāo)有各種不同的大小,3)目標(biāo)可能有各種不同的形狀。深度學(xué)習(xí)在這方面的處理已經(jīng)部分超越了傳統(tǒng)算法的上限,目前較為先進(jìn)的深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),通過(guò)其具有局部連接權(quán),值共享及池化操作等功能,有效降低了網(wǎng)絡(luò)的復(fù)雜度,減少了訓(xùn)練參數(shù)的數(shù)目。使模型對(duì)于平移、扭曲、縮放具有一定程度不變性并具有較強(qiáng)的魯棒性和容錯(cuò)能力,且易于訓(xùn)練與優(yōu)化的網(wǎng)絡(luò)結(jié)構(gòu)。
3.語(yǔ)義分割
語(yǔ)義分割方法在處理圖像時(shí),具體到像素級(jí)別,也就是說(shuō),該方法會(huì)將圖像中每個(gè)像素分配到某個(gè)對(duì)象類別。語(yǔ)義分割是一種典型的計(jì)算機(jī)視覺(jué)問(wèn)題,其涉及將一些原始數(shù)據(jù)(例如,平面圖像)作為輸入并將它們轉(zhuǎn)換為具有突出顯示的感興趣區(qū)域的掩模。
許多人使用術(shù)語(yǔ)全像素語(yǔ)義分割,其中圖像中的每個(gè)像素根據(jù)其所屬的感興趣對(duì)象被分配類別ID。 早期的計(jì)算機(jī)視覺(jué)問(wèn)題只發(fā)現(xiàn)邊緣(線條和曲線)或漸變等元素,但它們從未完全按照人類感知的方式提供像素級(jí)別的圖像理解。語(yǔ)義分割將屬于同一目標(biāo)的圖像部分聚集在一起來(lái)解決這個(gè)問(wèn)題,從而擴(kuò)展了其應(yīng)用領(lǐng)域。如圖所示。
語(yǔ)義分割問(wèn)題也可以被認(rèn)為是分類問(wèn)題,其中每個(gè)像素被分類為來(lái)自一系列對(duì)象類中的某一個(gè)。因此一個(gè)使用案例是利用土地的衛(wèi)星影像制圖。土地覆蓋信息是重要的各種應(yīng)用,如監(jiān)測(cè)地區(qū)的森林砍伐和城市化等。為了識(shí)別衛(wèi)星圖像上每個(gè)像素的土地覆蓋類型(例如,城市、農(nóng)業(yè)、水等區(qū)域),土地覆蓋分類可以被視為多級(jí)語(yǔ)義分割任務(wù)。道路和建筑物檢測(cè)也是交通管理,城市規(guī)劃和道路監(jiān)測(cè)的重要研究課題。
以上介紹的三個(gè)方向是目前深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)領(lǐng)域非常火熱的三個(gè)研究方。市面上許多網(wǎng)絡(luò)教程通過(guò)使用開(kāi)源的視覺(jué)開(kāi)發(fā)軟件OpenCV結(jié)合Caffe/Tensorflow進(jìn)行發(fā)開(kāi),但是對(duì)于初學(xué)者,這一套開(kāi)發(fā)與部署流程對(duì)于剛剛接觸深度學(xué)習(xí)的同學(xué)非常不友好,學(xué)習(xí)周期漫長(zhǎng)并且部署流程繁瑣。德國(guó)著名視覺(jué)算法軟件開(kāi)發(fā)公司MVtec開(kāi)發(fā)的Halcon算法工具包集成了開(kāi)發(fā)環(huán)境。后期將會(huì)帶大家了解如何通過(guò)Halcon軟件開(kāi)發(fā)包快速上手玩轉(zhuǎn)當(dāng)前最火的深度學(xué)習(xí)三大方向應(yīng)用。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4806瀏覽量
102685 -
圖像分類
+關(guān)注
關(guān)注
0文章
96瀏覽量
12105 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5554瀏覽量
122443
原文標(biāo)題:深度學(xué)習(xí)在視覺(jué)中的應(yīng)用(1)
文章出處:【微信號(hào):chaorenshijue,微信公眾號(hào):超人Halcon機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
labview調(diào)用yolo目標(biāo)檢測(cè)、分割、分類、obb
目標(biāo)檢測(cè)和圖像語(yǔ)義分割領(lǐng)域性能評(píng)價(jià)指標(biāo)
van-自然和醫(yī)學(xué)圖像的深度語(yǔ)義分割:網(wǎng)絡(luò)結(jié)構(gòu)
van-自然和醫(yī)學(xué)圖像的深度語(yǔ)義分割:網(wǎng)絡(luò)結(jié)構(gòu)
遷移學(xué)習(xí)
機(jī)器學(xué)習(xí)簡(jiǎn)介與經(jīng)典機(jī)器學(xué)習(xí)算法人才培養(yǎng)
如何使用深度學(xué)習(xí)進(jìn)行視頻行人目標(biāo)檢測(cè)

分析總結(jié)基于深度神經(jīng)網(wǎng)絡(luò)的圖像語(yǔ)義分割方法

基于深度學(xué)習(xí)的三維點(diǎn)云語(yǔ)義分割研究分析

基于深度神經(jīng)網(wǎng)絡(luò)的圖像語(yǔ)義分割方法

基于深度學(xué)習(xí)的場(chǎng)景分割算法研究
語(yǔ)義分割數(shù)據(jù)集:從理論到實(shí)踐
自動(dòng)駕駛深度多模態(tài)目標(biāo)檢測(cè)和語(yǔ)義分割:數(shù)據(jù)集、方法和挑戰(zhàn)

深度學(xué)習(xí)圖像語(yǔ)義分割指標(biāo)介紹

評(píng)論