計算機視覺與人工智能的關系
計算機視覺顧名思義,就是讓計算機具備像人眼一樣觀察和識別的能力,更進一步的說,就是指用攝像機和電腦代替人眼對目標進行識別、跟蹤和測量,并進一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。
作為一個科學學科,計算機視覺研究相關的理論和技術,試圖建立能夠從圖像或者多維數(shù)據(jù)中獲取“信息”的人工智能系統(tǒng)。計算機視覺目前還主要停留在圖像信息表達和物體識別階段,人工智能更強調推理和決策。
人工智能與計算機視覺是什么關系?
第一,它是一個人工智能需要解決的很重要的問題;
第二,它是目前人工智能的很強的驅動力。因為它有很多應用,很多技術是從計算機視覺誕生出來以后,再反運用到AI領域中去;
第三,計算機視覺擁有大量的量子AI的應用基礎。
圖像處理、計算機視覺和模式識別領域的區(qū)別和聯(lián)系
一、區(qū)別
1.數(shù)字圖像處理(Digital Image Processing)
數(shù)字圖像處理是對已有的圖像進行變換、分析、重構,得到的仍是圖像。
Digital Image Processing,簡稱 DIP。輸入的是圖像,輸出的也是圖像。Photoshop中對一副圖像應用濾鏡就是典型的一種圖像處理。常見操作有模糊、灰度化、增強對比度等。
圖像處理,這個主要針對圖像圖像的基本處理,如圖像檢索或則圖像識別,壓縮,復原等等操作。機器視覺技術其實就是工業(yè)數(shù)字圖像處理。
2.計算機圖形學(Computer Graphics)
計算機圖形學是給定關于景象結構、表面反射特性、光源配置及相機模型的信息,生成圖像。
圖形學講的是圖形,也就是圖形的構造方式,是一種從無到有的概念,從數(shù)據(jù)得到圖像。
Computer Graphics,簡稱 CG 。輸入的是對虛擬場景的描述,通常為多邊形數(shù)組,而每個多邊形由三個頂點組成,每個頂點包括三維坐標、貼圖坐標、rgb顏色等。輸出的是圖像,即二維像素數(shù)組。
計算機圖形學,主要涉及圖形成像及游戲類開發(fā),如opengl等,還有就是視頻渲染等。
3.計算機視覺(Computer Vision)
計算機視覺是給定圖像,推斷景象特性實現(xiàn)的是從模型到圖像的變換,也就是說從圖像數(shù)據(jù)提取信息,包括景象的三維結構,運動檢測,識別物體等。
Computer Vision,簡稱 CV。輸入的是圖像或圖像序列,通常來自相機或usb攝像頭。輸出的是對于圖像序列對應的真實世界的理解,比如檢測人臉、識別車牌。
計算機視覺,里面人工智能的東西更多一些,不僅僅是圖像處理的知識,還涵蓋了人工智能,機器學習等領域知識
4.模式識別(Pattern Recognition)
模式識別則是從特征空間到類別空間的變換。研究內容包括特征提取(PCA,LDA,LFA,Kernel,Mean Shift,SIFT,ISOMAP,LLE);特征選擇;分類器設計(SVM,AdaBoost)等。
PR(模式識別)本質就是分類,根據(jù)常識或樣本或二者結合進行分類,可以對圖像進行分類,從圖像得到數(shù)據(jù)。
二、聯(lián)系
計算機圖形學是計算機視覺的逆問題,兩者從最初相互獨立的平行發(fā)展到最近的融合是一大趨勢。圖像模式的分類是計算機視覺中的一個重要問題,模式識別中的許多方法可以應用于計算機視覺中。
Computer Graphics和Computer Vision是同一過程的兩個方向。Computer Graphics將抽象的語義信息轉化成圖像,Computer Vision從圖像中提取抽象的語義信息。Image Processing探索的是從一個圖像或者一組圖像之間的互相轉化和關系,與語義信息無關。
CG 中也會用到 DIP,現(xiàn)今的三維游戲為了增加表現(xiàn)力都會疊加全屏的后期特效,原理就是 DIP,只是將計算量放在了顯卡端。
CV 更是大量依賴 DIP 來打雜活,比如對需要識別的照片進行預處理。
最后還要提到近年來的熱點——增強現(xiàn)實(AR),它既需要 CG,又需要 CV,當然也不會漏掉 DIP。它用 DIP 進行預處理,用 CV 進行跟蹤物體的識別與姿態(tài)獲取,用 CG 進行虛擬三維物體的疊加。
-
圖像處理
+關注
關注
27文章
1325瀏覽量
57707 -
模式識別
+關注
關注
3文章
45瀏覽量
14501 -
人工智能
+關注
關注
1804文章
48701瀏覽量
246455 -
計算機視覺
+關注
關注
9文章
1706瀏覽量
46570
發(fā)布評論請先 登錄
評論