
在當前的人工智能領域,尤其是涉及到深度學習的推理階段,行業普遍認為GPU是唯一的選擇。然而,GPU的成本相對較高,且對于某些特定的應用場景,其高昂的價格和較高的能耗成為了一大負擔。
相比之下,CPU作為一種性價比極高的推理硬件,逐漸進入了人們的視野,尤其是在對結果準確度有較高要求且需要考慮成本效益的行業中,如制造業、圖像處理與分析等。經過數年的內部研究,阿丘科技的工業AI視覺算法平臺軟件AIDI已經成功驗證了CPU推理的可行性,為行業提供了新的解決方案。
具體應用場景01
舊產線改造
許多制造企業的生產線啟動時間較早,初期采用的傳統算法并不過多依賴于GPU資源。隨著時間的發展,這些產線的主板可能無法支持新增的GPU、NPU、TPU等加速卡。
在這種情況下,如果企業希望在其生產線上添加AI檢測功能,全面更換工控機會導致成本激增,并延長上線周期。通過使用AIDI提供的CPU推理模式,企業可以迅速實現AI檢測功能的上線,同時避免了高昂的硬件升級費用。
相關詞語解釋:
CPU(中央處理器,Central Processing Unit)
CPU是計算機的主要處理單元,負責執行系統中的大部分基本指令集,包括算術邏輯運算、控制單元的功能以及數據的移動等。它通常設計為能夠高效地處理廣泛的任務,從運行操作系統到執行應用程序的各種任務。
GPU(圖形處理器,Graphics Processing Unit)
GPU最初是為加速計算機圖形渲染而設計的處理器,但現在其應用范圍已經遠遠超出了圖形處理領域。GPU擁有大量的核心,能夠并行處理大量數據,這使得它們在圖像和視頻處理、深度學習、科學計算等領域非常有用。
NPU(神經網絡處理器,Neural Network Processing Unit)
NPU是一種專門為處理機器學習算法而設計的微處理器,尤其是針對深度學習任務。NPU優化了對向量和矩陣運算的支持,這些運算是神經網絡訓練和推理過程中的基礎。
TPU(張量處理單元,Tensor Processing Unit)
TPU是由谷歌開發的一種定制ASIC(專用集成電路),專門用于加速機器學習工作負載,特別是針對使用TensorFlow框架的應用程序。TPU能夠高效地執行大規模的矩陣運算,這對于訓練和推斷階段的深度學習模型至關重要。
02
輕量型項目
對于一些新的項目,尤其是那些算力需求較小的場景(如圖像小于500萬像素,僅需進行圖像分類或單圖推理,且可接受100毫秒的延遲),使用單個GPU卡往往無法達到滿負荷運行的狀態,從而造成資源浪費。
這類項目非常適合采用CPU進行推理,訓練階段則可以利用GPU工控機或云端資源。這種方法不僅能夠顯著降低硬件采購成本,還能確保項目的順利推進。
03
舊產線改造的具體情形
如下圖所示,通過傳統算法進行項目的測量與檢測,硬件配置主要為CPU+內存+主板。
圖:舊產線
目前,舊產線改造通常有以下兩種情形。
情形一:硬件配置基本不變,即CPU+內存+主板,通過傳統算法做測量,而利用AI算法做外觀檢測。
圖:情形一
情形二:硬件配置基本不變,即CPU+內存+主板,通過傳統算法做測量與外觀檢測,而利用AI算法做缺陷復判。
圖:情形二AIDI-CPU推理的優勢01
推理速度比肩GTX1060,500萬圖像像素級推理僅需50ms
AIDI的CPU推理在速度方面表現出色,其底層采用DefectNet網絡+Aqinfer推理引擎的創新模式。
DefectNet網絡專門針對工業數據的特性而設計,具備輕量且檢測能力強的特點。Aqinfer自研推理引擎則針對工業場景中圖像分辨率高、目標小的特點,在原本就較高的推理速度基礎上,進一步優化計算速度。
02
節省硬件成本,降低耗能風險
CPU在市場上供應充足,價格相對更為親民,相較于一些高性能GPU,CPU的獲取成本更低。對于企業來說,尤其是預算有限的中小企業,選擇CPU推理可以在不犧牲太多性能的前提下,大幅降低硬件采購成本。
以一家小型服裝加工廠為例,在引入AI檢測系統時,如果選擇GPU方案,高昂的硬件成本可能使其望而卻步;而采用CPU推理方案,僅需利用現有的工控機資源,就能實現基本的質量檢測功能。
同時,GPU的高功耗不僅增加了企業的用電成本,還會導致設備硬件容易因過熱等問題而損壞。相比之下,CPU的功耗較低,運行更加穩定,能夠有效降低企業的能耗風險和設備維護成本。在長期運行過程中,這一優勢將為企業節省大量的資金和人力投入。
03
快速驗證,減少額外投資
利用CPU進行AI推理,企業可以充分挖掘既有平臺的空閑算力,避免了為新的算力需求而進行大規模的額外投資。在項目的初期驗證階段,CPU推理能夠快速搭建起一個低成本的測試環境,幫助企業快速驗證AI算法的可行性和有效性。例如,視覺團隊可以先在現有的服務器上利用CPU進行算法驗證,根據驗證結果再決定是否需要進一步投資更強大的GPU算力。
成功案例
在某膠體檢測項目中,產品的檢測項涵蓋少膠、溢膠、斷膠、漏膠等關鍵指標。老設備方案中,膠水識別采用的是傳統算法,但在實際應用中,偶爾會出現定位不準的問題,這對產品質量產生了一定的影響。為了提高檢測精度,降低過檢率,企業決定引入AI檢測方案。
由于新增GPU需要對工控機配置進行復雜的修改,并且采購流程耗時較長,為了確保產線的正常運行,不耽誤生產進度,項目團隊最終選擇了CPU推理方案。經過實際測試和驗證,該方案能夠直接上線,并且取得了令人滿意的效果。
在此次項目中,圖像分辨率為1000W,客戶要求的CT(Cycle Time,周期時間)為1000ms,而實際CT時間僅為500ms,單圖推理時間更是縮短至100ms,完全滿足了上線要求。這一案例充分證明了阿丘科技AIDI的CPU推理在實際工業場景中的可行性和有效性,為其他類似項目提供了寶貴的參考經驗。
綜上,CPU推理作為AI算力配置的新范式,在特定的應用場景中展現出了獨特的優勢。隨著技術的不斷發展和優化,相信阿丘科技AIDI的CPU推理將在更多領域得到廣泛應用,為企業的智能化轉型提供更加經濟、高效的解決方案。
-
cpu
+關注
關注
68文章
11033瀏覽量
215974 -
人工智能
+關注
關注
1804文章
48691瀏覽量
246423 -
AI算力
+關注
關注
0文章
87瀏覽量
9139
發布評論請先 登錄
RAKsmart智能算力架構:異構計算+低時延網絡驅動企業AI訓練范式升級
大算力芯片的生態突圍與算力革命
DeepSeek推動AI算力需求:800G光模塊的關鍵作用
信而泰CCL仿真:解鎖AI算力極限,智算中心網絡性能躍升之道


算智算中心的算力如何衡量?

評論