因應(yīng)機器人產(chǎn)業(yè)與工業(yè)自動化快速發(fā)展,結(jié)合相機與影像處理以取代或補強人力的機器視覺技術(shù)與相關(guān)應(yīng)用持續(xù)升溫,并在工業(yè)檢測與制造領(lǐng)域獲得了廣泛的部署。然而,對于超越傳統(tǒng)應(yīng)用以外的日常生活與其他領(lǐng)域,機器視覺仍然深藏著無限潛力與商機。
過去幾年來,這個以知識為導(dǎo)向的產(chǎn)業(yè)經(jīng)歷機器視覺系統(tǒng)的元件與模組日益復(fù)雜化;另一方面,與機器視覺系統(tǒng)相關(guān)的市場應(yīng)用也持續(xù)擴展到超越工業(yè)制造以外的新應(yīng)用領(lǐng)域,特別是如今當(dāng)硬體尺寸縮減以及嵌入式系統(tǒng)持續(xù)展現(xiàn)動能之際,即將來臨的奈米技術(shù)、先進(jìn)感測器、機器對機器(M2M)通訊系統(tǒng)以及物聯(lián)網(wǎng)(IoT) 等新興技術(shù)發(fā)展,將進(jìn)一步推動機器視覺應(yīng)用擴展至消費性電子、可穿戴式裝置、汽車先進(jìn)駕駛輔助系統(tǒng)(ADAS)以及智能化監(jiān)控等更貼近大眾生活的領(lǐng)域。
根據(jù)市場調(diào)查機構(gòu)MarketsandMarkets在去年發(fā)布的調(diào)查報告指出,2012年機器視覺系統(tǒng)與元件的全球市場規(guī)模超過30億美元,預(yù)計在 2013-2018年間將以8.2%的年復(fù)合成長率(CAGR)成長,在2018年以前達(dá)到50億美元。全球機器視覺市場帶來的新商機已經(jīng)成為業(yè)界廠商關(guān)注的焦點。
CEVA公司投資者關(guān)系與企業(yè)傳播副總裁Richard Kingston透露,該公司已經(jīng)將電腦視覺DSP授權(quán)給八家企業(yè),其中包括三家行動領(lǐng)域的OEM廠商。而加拿大CogniVue公司業(yè)務(wù)開發(fā)副總裁 Tom Wilson也看好“可穿戴式裝置和汽車領(lǐng)域?qū)⒋嬖诜浅娏业某砷L商機?!?/p>
全球機器視覺市場可望在2018年以前超越50億美元大關(guān)。
視覺處理向3D跨越
隨著Google正式發(fā)布Project Tango后,3D機器視覺變得更熱門。Kingston表示,“消費領(lǐng)域的3D處理主要瞄準(zhǔn)3D成像、自然使用者界面(NUI)和3D視覺應(yīng)用,如PC、筆記型電腦、平板電腦、智能手機和其它消費性設(shè)備?!?/p>
業(yè)界追尋3D視覺的主要原因在于解決2D機器視覺的固有局限,若能更有效地實現(xiàn)在分割(分離近景和遠(yuǎn)景)、照明(用于人臉辨識)、相對位置(場景中的物體)等方面的功能,就能讓更多應(yīng)用透過3D空間資訊來簡化并提高視覺系統(tǒng)的精密度與可靠性。
但無論是3D感測器(例如TOF相機)或以2個2D影像感測器實現(xiàn)的立體感測器,對于處理能力的要求也更高。Wilson指出,“立體匹配(使用兩個影像感測器的輸入)要求差異映射來產(chǎn)生3D景深圖。這是一個非常困難的電腦視覺問題,學(xué)術(shù)界也積極研究最佳化立體辨識演算法?!庇捎趯崿F(xiàn)3D感測的每一種方法都存在性能的折衷, CogniVue目前正開發(fā)一種新的演算法,期望針對低成本3D感測器計算其視差圖。
處理大量即時資料需要密集的運算能力。若是想實現(xiàn)穩(wěn)定的3D感測映射是非常困難的,特別是對于低功耗的設(shè)備來說。為此,他強調(diào),“CogniVue的APEX影像辨識處理(ICP)技術(shù)能在電量有限的3D視覺應(yīng)用中發(fā)揮關(guān)鍵作用?!鄙剃P(guān)注的焦點。 CEVA公司投資者關(guān)系與企業(yè)傳播副總裁Ri
對于系統(tǒng)設(shè)計人員來說,設(shè)計一款能有效執(zhí)行不同視覺演算法的硬體是一項艱巨的挑戰(zhàn)。系統(tǒng)廠商選擇影像/視訊處理解決方案時,可以選擇全部集中在CPU完成,也可以選擇卸載一部份影像處理工作給GPU,或者專為影像處理增加硬體邏輯。在需要3D處理的應(yīng)用中,GPU已經(jīng)讓系統(tǒng)的一部份執(zhí)行多種電腦視覺演算法,從而有助于為通用CPU分擔(dān)工作負(fù)載。
“i.MX6擁有強大的GPU運算能力,其3D引擎GC2000內(nèi)含4個渲染核心,可提供高達(dá)30GFLOPS的運算能力,支援OpenCL 1.1 EP,”飛思卡爾(Freescale)微控制器事業(yè)部亞太區(qū)市場行銷和業(yè)務(wù)拓展經(jīng)理李星宇介紹,“此外,i.MX6Q還擁有一個專用的2D引擎 (1Gpixel/s)和一個向量繪圖處理引擎?!?/p>
針對影像擷取領(lǐng)域,經(jīng)常利用2D相機感測器或其他光學(xué)感測技術(shù)來分析運算3D資料。除了飛行時間法(TOF)3D成像(為目標(biāo)物連續(xù)發(fā)送光線脈沖,根據(jù)光線脈沖與感測器接收反射光線之間的時間,計算出目標(biāo)物距離),在工業(yè)制造檢測方面較廣泛應(yīng)用的是3D雷射三角法,差別在于3D雷射感測器采用逐點掃描,而TOF相機則同時得到整幅影像的深度資訊。
相較于雷射三角的3D成像方式,美商國家儀器(NI)技術(shù)行銷工程師黃翔鉎介紹,NI LabVIEW可為3D視覺應(yīng)用提供雙目立體視覺功能,工程師可將2部相機安裝在物體的不同角度后,使用校準(zhǔn)技術(shù)調(diào)校兩部相機之間的畫素資訊以及擷取資料,并透過LabVIEW的3D工具庫進(jìn)行數(shù)學(xué)運算分析。透過一個軟硬體無縫整合的繪圖開發(fā)環(huán)境來設(shè)計3D視覺應(yīng)用,更能簡化工程師的工作。
IP與處理器的完美結(jié)合
為了在日益精巧的機臺或裝置中整合嵌入式視覺系統(tǒng),需要更先進(jìn)的CPU進(jìn)行密集運算來處理龐大的資料量,黃翔鉎強調(diào),這將持續(xù)對于CPU效能、功耗與資源是否足以支援強大的視覺分析運算帶來了挑戰(zhàn)。
CongmiVue 在官網(wǎng)上提到,“為了滿足不斷提高的應(yīng)用需求,過去幾十年來,處理器架構(gòu)持續(xù)因應(yīng)不同階段而進(jìn)展。1980年代的用于桌上型電腦和和伺服器的 CPU;1990年代DSP出現(xiàn)加速音訊編解碼和無線/有線語音/資料編解碼的要求;2000年GPU達(dá)到更先進(jìn)的性能與平行性,從而實現(xiàn)2D和3D影像;如今,嵌入式視覺處理需要的是完全不同的處理器架構(gòu):ICP?!?/p>
Tom Wilson也指出,“新一代的視覺應(yīng)用需要100倍以上的嵌入式視覺性能/功耗,為了滿足這些應(yīng)用的性能和功率需求,我們必須在相同功耗下提升較傳統(tǒng)處理架構(gòu)更高100-400倍的性能,”因此,CogniVue強調(diào)其APEX ICP技術(shù)可實現(xiàn)這一性能要求。
連同APEX ICP核心、APEX程式設(shè)計工具以及一個APEX-CV嵌入式視覺功能庫,可涵蓋多種視覺應(yīng)用。例如特征檢測和搭配適用于可穿戴式(增強實境)和汽車 (光流和運動追蹤)等。他補充道:“除了常見的電腦視覺功能,CognVue還為特定應(yīng)用提供更先進(jìn)的產(chǎn)品,例如用于人臉辨識的FaceVue、用于監(jiān)控應(yīng)用中運動監(jiān)測的MotionVue、用于汽車車道偏離警示的FrontVue,以及用于汽車盲點監(jiān)測的SideVue等。”
針對密集型運算需求,CEVA公司包括CEVA-MM3101在內(nèi)的CEVA-MM3000系列使用非常高效且功能強大的向量引擎,從而實現(xiàn)電腦視覺所需的大量平行運算。此外,整合的功率調(diào)節(jié)單元(PSU)可在處理器內(nèi)實現(xiàn)動態(tài)電壓調(diào)節(jié),協(xié)助實現(xiàn)‘永不斷線’的應(yīng)用類型。
除了CogniVue和CEVA,致力于機器視覺IP的廠商還包括Mobileye、Tensilica(現(xiàn)隸屬于Cadence IP部門)與Imagination Technologies等。Imagination基于‘Raptor’的可合成ISP IP核心已于2014 年第一季上市,使得IP陣營的競爭愈發(fā)激烈。
多家半導(dǎo)體廠商則透過與專業(yè)IP廠商合作/授權(quán)的方式,推出其專用視覺處理器,包括飛思卡爾 (Freescale)、德州儀器(TI)以及意法半導(dǎo)體(ST)等。ST與Mobileye共同開發(fā)EyeQ3影像處理器,可實現(xiàn)行人檢測;飛思卡爾基于CogiVue核心推出影像辨識處理器家族SCP2200;以色列Inuitive公司開發(fā)基于雙CEVA-MM3101引擎的3D視覺處理器,實現(xiàn) 3D景深圖;賽靈思(Xilinx)利用MVTec公司的HALCON以及Silicon Software公司的VisualApplets開發(fā)平臺,為Zynq-7000 All Programmable SoC打造端對端的Smarter Vision開發(fā)環(huán)境。
TI旗下種類繁多的處理器產(chǎn)品中,KeyStone系列多核心處理器具備 5.6GHz的ARM及9.6GHz的DSP處理能力,且具備比多晶片方案低功耗的優(yōu)勢,適合機器視覺領(lǐng)域的攝影機應(yīng)用;此外該公司的Jacito 6系列車用處理器,亦可用于ADAS中的行人辨識、防碰撞警示等機器視覺功能。
機器視覺的界面之爭
機器視覺對于傳輸速度的追求催生了新一代感測器,它們能在極高的速度下拍攝高解析度影像,但其資料量遠(yuǎn)遠(yuǎn)超出傳統(tǒng)界面的容納限制。目前較為流行的界面是GigE和USB 3.0,這兩種界面各有優(yōu)勢與不足。
加拿大Point Grey公司是USB 3.0 Vision技術(shù)委員會的共同創(chuàng)始廠商,曾經(jīng)在2011年推出了首款量產(chǎn)的USB 3.0相機。該公司比較USB3.0與其他多種界面表示,USB 3.0 頻寬遠(yuǎn)高于GigE POE,且能實現(xiàn)更低的CPU使用率,幾乎所有的主流電腦系統(tǒng)制造商都提供主機板上具有USB 3.0界面的系統(tǒng),預(yù)期USB 3.0可望成為市場通用的主流規(guī)格。
表1:GigE PoE與USB 3.0的比較。
不過,“真正的工業(yè)應(yīng)用肯定都得使用以太網(wǎng)絡(luò),”嘉?影像銷售部副經(jīng)理張小偉認(rèn)為,“因為工業(yè)應(yīng)用需要的距離較長,而且以太網(wǎng)絡(luò)的抗干擾性更佳。”的確,對于傳輸距離來說,UB S3.0的線纜長度建議使用5m,而實際應(yīng)用中只用到3m。
表2:不同界面的頻寬與線纜長度。
黃翔鉎則認(rèn)為:“以現(xiàn)階段的應(yīng)用需求來看,GigE和USB3.0可望在市場上共存。GigE的好處是可配置多臺相機互連的網(wǎng)絡(luò)架構(gòu),而USB雖然頻寬較大傳輸速率更快,但必須透過強大的USB中樞管理與傳送,成本較采用切換式的GigE更高。因此,針對遠(yuǎn)距離、多相機的應(yīng)用,以及相機數(shù)少但要求精確度與傳輸速率的應(yīng)用,仍需要分別使用GigE和USB3.0進(jìn)行配置?!?/p>
此外,黃翔鉎建議,針對更高速的影像擷取應(yīng)用則需使用Camer Link規(guī)格。NI針對Camera Link相機提供專為機器視覺與科學(xué)成像應(yīng)用所設(shè)計的影像擷取產(chǎn)品,透過軟體即可設(shè)定相機,只需簡易接線即可達(dá)到高效能的影像擷取,同時相容于NI Vision Builder AI、LabVIEW、LabWindows/CVI、C/C++與Visual Basic。
除此之外,機器視覺領(lǐng)域還有一個以高階競爭姿態(tài)出現(xiàn)的CoaXPress界面。該界面在2009年即已推出,可讓設(shè)備(如照相機)以一根同軸電纜實現(xiàn)高達(dá)6.25Gbps的速度傳輸資料,在使用4根線纜時的速率高達(dá)25Gbps/相機。
CoaXpress的連接方法簡單,“這種推拉自鎖系統(tǒng),確保了在工業(yè)應(yīng)用的可靠性。”比利時Euresys公司CEO Marc Damhaut展示該公司支援該新界面的Coaxlink系列。
圖2:不同界面的頻寬與線纜長度。
CoaXpress目前和Camera Link一樣需要透過一張截取卡,但可實現(xiàn)比Camera Link更快的傳輸速度。然而,CoaXPress的成本高昂仍是其于普及道路的一大阻礙。
由于CoaXpress界面具有在更遠(yuǎn)距離以更高速率進(jìn)行影像擷取的優(yōu)勢,黃翔鉎預(yù)期,隨著資料量的需求持續(xù)進(jìn)展到超過Gb級,未來在CoaXpress技術(shù)發(fā)展更成熟后,可望在相機影像擷取領(lǐng)域取代GigE和USB3.0成為市場主流。
評論