計算機在看圖的時候,它在看什么?
圖像識別技術是指對圖像進行處理,識別各種不同模式的目標和對象的技術。
隨著數(shù)字化浪潮的到來,越來越多的數(shù)據(jù)以圖片為載體存在。面對海量的數(shù)據(jù),就要求我們具備能快速從中提取信息的能力。
圖像識別就是我們需要的技術,它就像給計算機裝上了眼睛,可以和人類一樣從圖像中快速獲取信息,給數(shù)字化智能化提供更多的可能性。目前圖像識別技術已經(jīng)被廣泛應用,比如人臉識別、自動駕駛。這些看似高大上標簽背后的邏輯其實并不難。
當我們?nèi)祟愑醚劬匆粯訓|西的時候,會先在大腦的記憶中搜索匹配,完成識別。當計算機識別一張圖片也是類似的過程,它會提取圖片中主要特征,與程序中的規(guī)則進行比較。這些特征和規(guī)則可以來自預設,也可以通過學習獲得。前者就是單純的圖像處理識別,后者通常應用于人工智能中。可能很多朋友看到人工智能這幾個詞就感到非(失)常(去)有(興)趣,其實就用簡單的圖像處理已經(jīng)能解決很多問題了。
計算機“看”一張圖片時,它究竟在看什么呢?
當一張圖片被無限放大的時候,可以發(fā)現(xiàn)它是由一個個像素點組成的。對計算機來說,每張圖片就是不同像素值的排列組合。如果我們用不同的數(shù)字代表不同的顏色,圖像就可以表示為一個矩陣。當計算機去“看”一張圖片的時候,其實就是對矩陣中的數(shù)字進行運算,找到一些特征值。其中,顏色特征和輪廓特征是比較基礎和常用的兩種。
顏色
圖片中每一個像素值代表的就是一種顏色。不同類型格式的圖片采用的顏色模式不同,比如RGB、HSV、HSL等。其中最常用的像素顏色描述方式就是RGB(紅、綠、藍)空間,通過這三原色的組合能描述任何顏色。顏色相關的處理中,可以直接通過像素值進行圖像分割,提取目標信息。也可以進行直方圖(顏色分布)等統(tǒng)計分析,提取關鍵信息。
輪廓
輪廓是圖像很重要的一個外部特征。對于人來說,很容易能夠區(qū)分物體的邊界,也就是那些顏色發(fā)生明顯變化的地方。這一點對于機算機也是一樣,它也是根據(jù)像素值的變化率(梯度)來找出邊緣。在這一步中,一般會將三通道的RGB圖片轉為單通道的灰度圖,僅保留一個通道。通過輪廓識別算法獲得了圖形的邊緣輪廓之后,就可以進行定位或匹配,或者更進一步的應用。
我們掌握了以上兩點其實已經(jīng)可以解決很多問題了,不信?你看看這個案例!
在設計測試PCB過程中的某個環(huán)節(jié),工程師需要從以下這樣的圖片中提取特定顏色連接線的連接關系。這本是一個非常枯燥且容易出錯的工作,要找到指定顏色的所有線段,還有列出它們連接關系。利用圖像識別技術就可以輕松完成這個工作,用到的就是顏色和輪廓特征。例如其中針對連接線的操作:
利用顏色特征將指定顏色像素從圖片中分割出來
灰度化:減少信息量
獲取圖形邊緣輪廓信息
除了以上這些,還有其他圖片處理及特征提取的方法,需要根據(jù)具體的處理需求選擇。現(xiàn)有的一些圖像算法庫也都提供了很好的支持。
這樣一個小功能可以替代原本枯燥耗時的工作,大大提高了工作效率。通過這些數(shù)字化智能化的手段對價值流的可能環(huán)節(jié)進行優(yōu)化,也能讓工程師把更多的時間投入到核心設計工作中。對于開發(fā)團隊來說,也得到了互相學習的機會,能更好地理解業(yè)務中的需求。
-
計算機
+關注
關注
19文章
7626瀏覽量
90138 -
圖像識別
+關注
關注
9文章
526瀏覽量
38891 -
數(shù)字化
+關注
關注
8文章
9247瀏覽量
63061
原文標題:揭密圖像識別 | 計算機在看圖的時候,它在看什么?
文章出處:【微信號:AE_China_10,微信公眾號:博世汽車電子事業(yè)部】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
評論