以下是摘錄給我們的合作伙伴內容計劃的文章的摘錄,標題為“利用自然與養育來構建驚人的AI SoC”。它由Synopsys產品營銷經理Ron Lowman撰寫,最初出現在EETimes上。
依靠傳統的設計流程將不會產生每個公司都追求的高性能,市場領先的AI解決方案。設計人員必須考慮各種各樣的半導體解決方案。一個Semico公司2018市場報告中指出,“對于訓練和推理架構正在不斷地改進,在最佳配置,提供表演權水平到達。”
數據中心架構包括GPU,FPGA,ASIC,CPU,加速器和高性能計算(HPC)解決方案,而移動市場則是諸如ISP,DSP,多核應用處理器,音頻之類的異構片上處理解決方案的大雜燴。和傳感器處理子系統。這些異構解決方案可通過專有的SDK有效利用,以適應AI和深度學習功能。此外,基于預期的自主能力,汽車市場將出現巨大變化。例如,可以預料,第5級自治SoC的帶寬和計算能力比第2級以上自治SoC支持的性能要高得多。
這些AI設計中的三個始終如一的挑戰包括:
添加專門的處理功能,可以更高效地執行必要的數學運算,例如矩陣乘法和點積
高效的內存訪問,用于處理深度學習所需的唯一系數(例如權重和激活)
可靠的,經過驗證的實時接口,用于芯片到芯片,芯片到云,傳感器數據以及加速器到主機的連接
機器學習算法的最大障礙之一是傳統SoC架構的內存訪問和處理能力沒有達到所需的效率。例如,人們批評流行的馮·諾依曼(von Neumann)架構對AI不夠有效,導致人們爭相開發更好的機器(即SoC系統設計)。
那些幸運地設計出第二代和第三代針對AI的SoC的人已經添加了更高效的AI硬件加速器,并且/或者選擇為現有ISP和DSP添加功能以適應神經網絡的挑戰。
但是,僅添加高效的矩陣乘法加速器或高帶寬內存接口已被證明是有幫助的,但不足以成為AI的市場領導者,從而強化了在特定于AI的系統設計期間進行特定優化的概念。
機器學習和深度學習適用于各種各樣的應用程序,因此設計人員在定義特定硬件實現目標的方式上千差萬別。另外,機器學習數學的進步正在迅速變化,這使體系結構靈活性成為一個強烈的要求。對于垂直整合的公司,他們可以將設計范圍縮小到特定目的,增加優化程度,但也可以靈活地匹配其他不斷發展的算法。
最后,如《林利微處理器報告》(Linley Microprocessor Report)的“AI基準仍然不成熟”所述,跨AI算法和芯片的基準測試仍處于起步階段:
“幾個流行的基準測試程序評估CPU和圖形性能,但是即使AI工作負載變得越來越普遍,比較AI性能仍然是一個挑戰。許多芯片供應商僅引用每秒浮點運算的峰值執行速率,或者對于僅整數設計而言,每秒引用的峰值執行速率。但是,像CPU一樣,由于軟件,內存或設計中的其他部分存在瓶頸,深度學習加速器(DLA)的工作性能通常遠低于其峰值理論性能。每個人都同意在運行實際應用程序時應該衡量性能,但是他們在什么應用程序以及如何運行它們上存在分歧。”(2019年1月)
有趣的新基準開始針對特定市場。例如,MLPerf目前正在提高培訓AI SoC的有效性,并計劃進行擴展。盡管這是應對基準測試挑戰的一個很好的開始,但培訓AI SoC只是影響系統結果的許多不同市場,算法,框架和壓縮技術的一小部分。
另一個組織AI-Benchmark致力于基準測試手機的AI功能。移動電話使用少數芯片組,其中一些芯片組的早期版本除了傳統處理器外不包含任何AI加速功能,而是實現了AI專用軟件開發套件(SDK)。這些基準表明,利用現有的非AI優化處理解決方案無法提供所需的吞吐量。
所選的處理器或處理器陣列通常具有每秒最大的操作額定值或特定處理技術的特定最高頻率。處理器性能還取決于每個指令的能力。另一方面,接口IP(PCIe?,MIPI,DDR)和基礎IP(邏輯庫,內存編譯器)具有最大的理論內存帶寬和數據吞吐量級別,在接口IP的情況下,通常由標準組織定義。
但是,系統的真正性能不是這些部分的總和。它具有將處理器,內存接口和數據管道正確連接在一起的能力。系統整體性能是每個集成組件的功能以及如何優化這些功能的結果。
設計人員在AI SoC的處理器,SDK,數學和其他有助于設計的方面取得了飛速發展的同時,這些變化使得難以進行逐個比較的能力。
編輯:hfy
-
數據中心
+關注
關注
16文章
5226瀏覽量
73497 -
AI
+關注
關注
88文章
35093瀏覽量
279457 -
機器學習
+關注
關注
66文章
8501瀏覽量
134572 -
AI算法
+關注
關注
0文章
263瀏覽量
12690
發布評論請先 登錄
怎么結合嵌入式,Linux,和FPGA三個方向達到一個均衡發展?

DC/DC轉換器選型的三個要點

不可忽視!四層PCB打樣設計中的關鍵細節大盤點!
Linux系統中最重要的三個命令
請問DLP4710 EVM-LC中的RGB三個LED的參數是多少?
動態無功補償的三個必要條件

評論