本篇文章節(jié)選自安森美半導體原創(chuàng)文章《安森美半導體領先的智能感知技術和方案應對工業(yè)人工智能應用挑戰(zhàn)》。本篇文章是此次系列文章的第二篇,完整文章共兩篇~
如果您還未閱讀本系列第一篇文章,點擊下方鏈接即可閱讀~ 領先的智能感知技術和方案應對工業(yè)人工智能應用挑戰(zhàn) 第一篇
市場對高分辨率的需求不斷增長
越來越多的應用對分辨率有了很高的需求,例如手機/電視/電腦顯示器的LCD、OLED屏幕檢測。在這檢測應用中,使用相機檢測顯示器的輸出,以查找顯示亮度的均勻性、顏色準確性、線條缺陷、顆粒缺陷等。這就要求檢測相機提供非常高的圖像質量和高度均勻性,以確保相機中的質量問題不會被誤解為顯示器中的產品缺陷。 顯示屏實際上都由紅綠藍等多個LED子像素組成,檢測系統(tǒng)需要能夠解析所有這些子像素,以便正確成像和顯示并確認設備的質量,為提高檢測的精度和可靠性,行業(yè)中通常會使用圖像傳感器靶面的3x3,或者4x4, 甚至5x5個像元來識別顯示屏設備的一個LED子像素,這就需要用到更多的傳感器像元個數(shù),并且隨著顯示器分辨率的不斷提高-從傳統(tǒng)高清到4k到8k甚至更高,檢測相機所需的分辨率也在不斷提高,才不會犧牲應用所需的高圖像質量和均勻性,為AI算法的精度提供更可靠的數(shù)據(jù)支持。 又如另一個常見的工業(yè)成像應用是印刷電路板檢測,以確認電路板組件上的集成元器件、電容器、電阻器等已正確安裝并焊接到位。電路板的檢測速度是受圖像分辨率和幀率的組合影響,圖像中能夠捕獲的電路板尺寸面積越大,一次可以檢測的電路板就越多,圖像能捕獲的越快,檢測的效率就越高。
雖然當前市場上提供的圖像傳感器可以每秒輸出約500或1400個像素的數(shù)據(jù),但是安森美半導體的XGS 45000可以以接近1900個像素/秒的速度捕獲更多的圖像數(shù)據(jù)用于算法判斷,比競爭對手快3倍以上,圖像數(shù)據(jù)寬度可以達8000個像素。高分辨率和高帶寬的結合使這種檢測應用的AI算法可以更快,更有效地執(zhí)行,從而提高了制造過程的生產率。
圖2:XGS 45000的演示效果
再如用于監(jiān)控或廣播的影像應用,圖像需求結合了上述性能,該應用對圖像質量的要求非常高,市場對分辨率的需求也不斷增長,從高清到4K到現(xiàn)在的8k,高分辨率提供了更強大的圖像結構和細節(jié)可以看到寬視野的能力,還提供了用于AI分類的裁剪開窗的選項,來放大感興趣的內容。 安森美半導體的XGS 45000圖像傳感器實際上具有比8k視頻所需的分辨率更高,不僅可以使用少量裁切來提供8k視頻,還由于XGS 45000具有很高的帶寬,它可以60幀每秒的速度提供8k視頻以及完整的12位輸出,滿足了該應用所需的高分辨率、高帶寬和高圖像質量。
值得一提的是,安森美半導體也提供完整的參考設計X-Cube,基于X-class圖像傳感器系列, 在1.1英寸光學格式提供1600萬像素分辨率,提供用于機器視覺和ITS的 29 mm x 29 mm工業(yè)相機占位所需的成像細節(jié)和性能,且一個攝像機可支持多種分辨率,幫助設計人員加快開發(fā)。
圖3:高分辨率X-Cube 系統(tǒng)用于29 mm x 29 mm 相機設計
從僅捕獲RGB信息和X,Y二維信息到添加深度信息或多光譜區(qū)域信息
除了圖像傳感器的性能提升,另外更為豐富的成像信息的集成也可以增強人工智能的性能,逐漸成為工業(yè)客戶做出明智決策的關鍵。 通過對多種模式和AI處理的投資,也使得安森美半導體具備獨特的優(yōu)勢,從僅提供三種紅綠藍(RGB)組成的成像系統(tǒng)發(fā)展到添加詳細的光譜特征,這樣可以在檢測中看到RGB無法識別的地方。使用12比特位的圖像數(shù)據(jù),可以提高識別圖像的精度,從僅提供x、y二維定位信息到使用結合了深度像元技術或毫米波雷達、激光雷達技術和圖像融合后帶來深度信息,可更深入地了解檢測對象的全部體積大小高度等的信息,也就是深度學習。 所以現(xiàn)在圖像傳感器的開發(fā)正在從僅捕獲RGB信息轉移到新的形式,增強的數(shù)據(jù)集提供的信息將不僅僅是顏色和二維位置。圖像傳感器的廠家都在開發(fā)新技術以獲取更可靠的深度信息或者多光譜區(qū)域信息。 比如開發(fā)通過融合內部不同數(shù)據(jù)流的Super Depth像元技術,開發(fā)通過有規(guī)律的結構,調制入射光振幅或相位的衍射光柵技術,開發(fā)基于單光子雪崩二極管(SPAD)和硅光電倍增管(SiPM)的傳感器等方式來實現(xiàn)為圖像提供更多的深度信息。 或者開發(fā)基于等離子體波導濾波片,或以法布里-珀羅(F-P)結構原理為基礎的多通道分光濾光片制造技術實現(xiàn)在更多的光譜區(qū)域成像的超多光譜技術。
神經網絡處理
隨著人工智能的發(fā)展,分類系統(tǒng)設計需要功能強大的圖像處理單元(GPU)或張量處理單元(TPU)神經網絡處理器,因為訓練和推理都需要大量計算,人工智能界正在面臨前所未有的算力挑戰(zhàn),網絡拓撲需要數(shù)億個乘法和加法邏輯計算(MAC),需要數(shù)百萬個卷積神經網絡參數(shù),就比如能實現(xiàn)分類/目標檢測/語義分割等多目標任務的MobileNetV2結構就具有3億個MAC計算和420萬個參數(shù),但這相對于ResNet微結構,已經是減少了9倍的計算量。 訓練過程由于涉及海量的大數(shù)據(jù)和復雜的深度神經網絡結構,需要的計算規(guī)模非常龐大,通常需要GPU或云去完成,推斷部署環(huán)節(jié)的計算量相比訓練環(huán)節(jié)會少一些,但仍然涉及大量的矩陣運算,通常在邊緣的高功率GPU / TPU上執(zhí)行以實現(xiàn)低延遲。面對深度學習的訓練和推斷的算力需求,市場上大部分使用的是NVIDIA的GPU或google的TPU來實現(xiàn)。
AI的發(fā)展
要真正實現(xiàn)快速決策,AI也需要發(fā)展。如今,用于成像的AI決策已從云過渡到邊緣再遷移到與成像系統(tǒng)本身。 比如把AI的訓練環(huán)節(jié)保留在GPU或云端,利用堆棧工藝可以將決策或甚至與之相關的一些預處理集成到圖像傳感器上,比如在傳感器上集成用于圖像識別的底層或者輕算力的卷積神經網絡層,集成具有內存的數(shù)字矩陣乘法計算單元體系結構。這些AI功能集成在圖像傳感器中都將會實現(xiàn),也已經有公司發(fā)布了內置人工智能引擎的圖像傳感器芯片。
如安森美半導體的融合了AI的水果新鮮度分類系統(tǒng)的演示,整個ECOsystem是基于安森美半導體的AR1335的相機和NVIDIA Xavier edge GPU, 使用了TensorRT版本的MobileNetV2結構來處理分類新鮮和腐爛的蘋果、橘子、香蕉等6類多達上萬個CNN訓練參數(shù),可以識別三種水果及其新鮮度,這個系統(tǒng)的準確率達到97%以上。
圖4:AI用于機器視覺,識別水果新鮮度
總結
圖像傳感器的開發(fā)正在從僅提供RGB和二維坐標信息轉移到新的更豐富的形式。圖像傳感器可提供更多類型的數(shù)據(jù),無論是深度數(shù)據(jù)還是增加的光譜信息,以及AI合并這些數(shù)據(jù)集并實現(xiàn)高級決策,從而使系統(tǒng)能夠通過新的測量和決策機會提供更快、更準確的結果。安森美半導體是工業(yè)機器視覺的領袖之一,以全方位的智能感知產品陣容和領先的技術,應對工業(yè)AI應用挑戰(zhàn)并推進智能制造的創(chuàng)新。
-
電路板
+關注
關注
140文章
5094瀏覽量
101653 -
圖像傳感器
+關注
關注
68文章
1966瀏覽量
130440 -
安森美半導體
+關注
關注
17文章
565瀏覽量
61559
原文標題:領先的智能感知技術和方案應對工業(yè)人工智能應用挑戰(zhàn) 第二篇
文章出處:【微信號:onsemi-china,微信公眾號:安森美】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
普強信息入選2025人工智能感知層創(chuàng)新榜單
【「具身智能機器人系統(tǒng)」閱讀體驗】1.初步理解具身智能
【「具身智能機器人系統(tǒng)」閱讀體驗】+數(shù)據(jù)在具身人工智能中的價值
嵌入式和人工智能究竟是什么關系?
《AI for Science:人工智能驅動科學創(chuàng)新》第6章人AI與能源科學讀后感
AI for Science:人工智能驅動科學創(chuàng)新》第4章-AI與生命科學讀后感
《AI for Science:人工智能驅動科學創(chuàng)新》第二章AI for Science的技術支撐學習心得
《AI for Science:人工智能驅動科學創(chuàng)新》第一章人工智能驅動的科學創(chuàng)新學習心得
risc-v在人工智能圖像處理應用前景分析
名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅動科學創(chuàng)新
報名開啟!深圳(國際)通用人工智能大會將啟幕,國內外大咖齊聚話AI
FPGA在人工智能中的應用有哪些?
依靠創(chuàng)新產品組合,安森美正引領智能感知新浪潮

評論