中央控制器作為自動駕駛核心部件,作為自動駕駛的“大腦”端,通常需要外接多個攝像頭、毫米波雷達、激光雷達,以及IMU等設備,完成的功能包含圖像識別、數(shù)據(jù)處理等。
域控制器作為一個智能硬件,為了完成復雜的AI計算和智能控制,硬件層面需要承擔環(huán)境感知和深度學習等超大算力需求的AI處理芯片、負責控制決策和邏輯運算的CPU、以及負責功能安全和車輛控制的MCU;軟件層面包括操作系統(tǒng)、中間件以及應用層AI算法等。
硬件層面的三部分芯片或者叫三顆重要芯片:
第一部分通常是GPU或TPU,承擔大規(guī)模浮點數(shù)并行計算需求,主要用于環(huán)境感知和信息融合,包括攝像頭、激光雷達等傳感器信息的識別、融合、分類等,如Xavier的GPU單元、昇騰310。
第二部分大多為ARM架構,類似于CPU,主要負責邏輯運算和決策控制,處理高精度浮點數(shù)串行計算。
第三部分主要負責可靠性和車輛控制,也就是功能安全和冗余監(jiān)控作用,不要求很高的算力,但是可靠性必須要有保障,ISO26262等級要求達到ASIL-D,目前用的較多的就是Infineon的TC297或者TC397。
軟件層面應用層AI算法一般由造車企業(yè)或主機廠自行研發(fā),這是體現(xiàn)車輛性能和差性的所在;中間件一般由域控制器開發(fā)商提供,類似于ROS,主要包含一些接口驅動和對于操作系統(tǒng)的優(yōu)化部署。
操作系統(tǒng)方面,華為采用自研鴻蒙系統(tǒng),并且MDC平臺支持兼容Adaptive AUTOSAR;QNX是目前車規(guī)級的最佳也是唯一選擇,但是面臨高昂的費用;Linux和Autoware 由于開源反而獲取了最多的用戶,尤其是Linux,借助其強大的工程師基礎和生態(tài),加之ROS的多年應用基礎,基于Linux內核的操作系統(tǒng)目前很受歡迎。
關于自動駕駛AI芯片選型
目前市面上可供選擇的AI芯片并不多,尤其是達到量產狀態(tài)的,只有特斯拉、NVIDIA、Mobileye了。除了特斯拉自研自用不對外,其他品牌目前都可以通過合作開發(fā)方式拿到測試樣件。
以NVIDIA Xavier為例,相對而言,由于NVIDIA Xavier推出較早,并且生態(tài)布局相對完善,對于開發(fā)者來說可以快速構建系統(tǒng)和開發(fā)AI應用,因此基于Xavier模組進行域控制器設計的企業(yè)不在少數(shù)。
XavierSoC最高算力可達30TOPs,內有Valta TensorCore GPU,八核ARM64 CPU,雙NVDLA 深度學習加速器,圖像處理器,視覺處理器和視頻處理器等六種不同的處理器,使其能夠同時、且實時地處理數(shù)十種算法,用于傳感器數(shù)據(jù)處理、環(huán)境感知、定位和繪圖以及路徑規(guī)劃。
芯片內部結構如下圖所示:
NVIDIA 提供的Xavier為核心模組,其接口如下圖所示:
對于自動駕駛控制器芯片選型而言,主要考慮如下一些技術要求參數(shù)信息來進行方案設計——芯片的關鍵指標:
1)Core:內核通常是空間中心。一方面便于自動駕駛控制器和外圍傳感器、執(zhí)行器通訊,同時也用外圍來保護它。core強調運行態(tài),通常出現(xiàn)的core-down,是指cpu計算上出現(xiàn)問題了,core強調的是自動駕駛控制器整體對外功能中的核心功能。
2)DMIPS:主要用于測整數(shù)計算能力。包含每秒鐘能夠執(zhí)行的指令集數(shù)量,以及其這些指令集在實現(xiàn)我的測試程序的時候,每秒鐘能夠實現(xiàn)的工作數(shù)量,這個能力由cpu的架構,內存memory的訪問速度等硬件特性來決定。它是一個測量CPU運行相應測試程序時表現(xiàn)出來的相對性能高低的一個單位(很多自動駕駛芯片評估場合,人們習慣用MIPS作為這個性能指標的單位)。
3)Memory:存儲器管理單元的主要功能包括:虛擬地址到物理地址映射、存儲器訪問權限控制、高速緩存支持等;
4)DataFlash:DataFlash是美國ATMEL公司推出的大容量串行Flash存儲器產品,采用Nor技術制造,可用于存儲數(shù)據(jù)和程序代碼。與并行Flash存儲器相比,所需引腳少,體積小,易于擴展,與單片機或控制器連接簡單,工作可靠,所以類似DataFlash的串行Flash控制器越來越多的用在自動駕駛控制器產品和測控系統(tǒng)評估中。
5)ISP:ISP作為視覺處理芯片核心,其主要功能包括 AE(自動曝光)、AF(自動對焦)、AWB(自動白平衡)、去除圖像噪聲、LSC(Lens Shading Correction)、BPC(Bad PixelCorrection),最后把 Raw Data 保存起來,傳給 videocodec 或 CV 等。通過 ISP 可以得到更好的圖像效果,因此在自動駕駛汽車上對ISP的要求很高,比如開始集成雙通道甚至三通道的 ISP。一般來說 ISP 是集成在 AP 里面(對很多 AP 芯片廠商來說,這是差異化競爭的關鍵部分),但是隨著需求的變化也出現(xiàn)了獨立的 ISP,主要原因是可以更靈活的配置,同時彌補及配合 AP 芯片內 ISP 功能的不足。
6)算力:自動駕駛的實現(xiàn),需要依賴環(huán)境感知傳感器對道路環(huán)境的信息進行采集,將采集到的數(shù)據(jù)傳送到汽車中央處理器進行處理,用來識別障礙物、可行道路等,依據(jù)識別結果,規(guī)劃路徑、制定車速,自動控制汽車行駛。整個過程需要在一瞬間完成,延時必須要控制在毫秒甚至微秒級別,才能保證自動駕駛的行駛安全。要完成瞬時處理、反饋、決策規(guī)劃、執(zhí)行的效果,對中央處理器的算力要求非常高。
在自動駕駛中,最耗費算力的當屬視覺處理,占到全部算力需求的一半以上,且自動駕駛級別每升高一級,對計算力的需求至少增加十倍。L2級別需要2個TOPS的算力,L3需要24個TOPS的算力,L4為320TOPS,L5為4000+TOPS。
光有算力還不夠,考慮汽車應用的復雜性,汽車處理器還需要同時考慮算力利用率、是否通過車規(guī)和安全標準等。算力理論值取決于運算精度、MAC的數(shù)量和運行頻率。
理論算力是根據(jù)Net卷積層的乘法運算累加得出,卷積層中的每次乘加(MAC)算成兩個OPS,卷積運算量占DL NET的90%以上,其它輔助運算或其它層的運算忽略不計,SSD所有卷積層乘法運算總數(shù)是40G MACs,所以理論算力是80GOPS。
其中,
真實值和理論值差異極大,考慮其它運算層,硬件實際利用率要高一些。決定算力真實值最主要因素是內存( SRAM和DRAM)帶寬,還有實際運行頻率(即供電電壓或溫度),還有算法的batch尺寸。
7)功耗:在最高性能模式下,如果自動駕駛控制器的芯片功耗級別較高,即便其自身性能強勁,但也會引發(fā)某些未可預知的隱患,如發(fā)熱量成倍增加,耗電率成倍增加,這些結果尤其對于新能源車型來說也毫無疑問是顆“核彈”。因此,我們在前期自動駕駛芯片設計中需要充分考慮其功耗指標。
8)3D GPU:GPU是基于大的吞吐量設計,用來處理大規(guī)模的并行計算。GPU的控制單元可以把多個的訪問合并成少的訪問。GPU將更多的晶體管用于執(zhí)行單元,而非像CPU那樣用作復雜的數(shù)據(jù)cache和指令控制。由于GPU具有超強的浮點計算能力,可用于在智能汽車前端的圖像或視頻處理領域的應用,也越來越多地應用在中央控制器高性能計算的主流設計中。
9)豐富的IO接口資源
自動駕駛的主控處理器需要豐富的接口來連接各種各樣的傳感器設備。目前業(yè)界常見的自動駕駛傳感器主要有:攝像頭、激光雷達、毫米波雷達、超聲波雷達、組合導航、IMU以及V2X模塊等。
對攝像頭的接口類型主要有:MIPI CSI-2、LVDS、FPD Link等。
激光雷達一般是通過普通的Ethernet接口來連接。
毫米波雷達都是通過CAN總線來傳輸數(shù)據(jù)
超聲波雷達基本都是通過LIN總線
組合導航與慣導IMU常見接口是RS232
V2X模塊一般也是采用Ethernet接口來傳輸數(shù)據(jù)
除了上述傳感器所需IO接口外,常見的其它高速接口與低速接口也都是需要的,比如:PCIe、USB、I2C、SPI、RS232等等。
10)PCIe:作為CPU的局部總線,最大的特點在于數(shù)據(jù)傳輸吞吐量大和延遲低。
11)SaftyGoal:功能安全目標是整個自動駕駛中央控制器的核心設計需求,由于其影響對整個自動駕駛功能設計中的單點失效分析結果,因此,在前期硬件設計中就需要充分考慮其是否能夠完全滿足系統(tǒng)對于硬件的功能安全設計需求。
12)OTA:遠程升級為用戶修復軟件故障,大幅度縮短中間步驟的時間,使軟件快速到達用戶,同時可以為車輛增加新功能,拓寬 “服務”和“運營”的范疇。因此,中央控制器芯片是否支持OTA對于減少汽車制造產商和用戶的成本,包括汽車制造產商的召回成本,用戶的時間成本,增加用戶的新鮮感,增加車輛的附加價值顯得不可或缺。
13)封裝類型:控制器封裝尺寸的大小、引腳定義等影響整體駕駛控制器對安裝形式的影響,同時影響對外圍部件的連接情況分布。另外,接口是否防水,如果能防水,則控制器的安裝環(huán)境可以相對更加自由。不過,目前的域控接口都是不防水的。
14)溫度/電壓:控制器的溫度控制范圍包括其存儲、使用環(huán)境溫度,且后期若實際車輛確認前毫米波控制器總成布置區(qū)域存儲、使用環(huán)境溫度高于該值,需要在該基礎上進行一定程度的整改上調范圍,并滿足OEM要求,且供應商需要保證不因為硬件設計缺陷導致召回。特別是算力達到100以上,功耗在60W以上時,溫度的上升極可能需要主動散熱來確保熱量可以及時的傳遞出去,不影響控制器的正常工作。主動散熱一般包括:風扇散熱、水冷散熱。
15)車規(guī)與功能安全
與消費電子產品相比,汽車芯片在安全性和可靠性上有這個最高的要求。
汽車芯片長年工作在“-40℃到125℃”高低溫以及劇烈震動的惡劣環(huán)境下,為了保證汽車電子產品達到對工作溫度、可靠性與產品壽命的高標準質量要求,國際汽車電子協(xié)會(Automotive Electronics Council,AEC)建立了相關的質量認證標準,其中AEC-Q100是針對于車載集成電路壓力測試的認證標準。AEC-Q100標準經過多年發(fā)展,已經成為汽車電子產品在可靠性和產品壽命等方面的工業(yè)事實標準。
除了滿足車規(guī)級要求之外,自動駕駛芯片也需要滿足由ISO 26262標準定義的“功能安全(Function Safety,簡稱Fusa)”的認證要求。功能安全對芯片上的設計要求是要盡可能找出并糾正芯片的失效(分為:系統(tǒng)失效和隨機失效)。系統(tǒng)失效本質上是產品設計上的缺陷,因此主要依靠設計和實現(xiàn)的流程規(guī)范來保證,而隨機失效則更多依賴于芯片設計上的特殊失效探測機制來保證。
ISO 26262對安全等級做了劃分,常見的是ASIL-B和ASIL-D級別。ASIL-B要求芯片能覆蓋90%的單點失效場景,而ASIL-D則要求能達到99%。芯片面積越大,晶體管越多,相應的失效率越高。
16)芯片系統(tǒng):如控制器是否支持MCU+MPU的集成控制方式,還是只支持單芯片控制的形式。
17)供應鏈保障
較大的市場需求導致半導體供應鏈和產能緊缺,包括疫情在內的各種“天災人禍”不斷擾亂半導體的正常生產節(jié)奏,而需求與產能之間的矛盾在短期內難以解決。對
在全球芯片供應鏈如此緊張的背景下,對于域控制器供應商而言,供應鏈的保障也是十分的具有挑戰(zhàn)性。整車廠在選擇域控制器供應商的時候,其合作伙伴芯片廠商的供貨能力也是重要的考量指標。
2022 年,芯片短缺仍在影響汽車行業(yè),有些整車廠已經開始思考半導體供應的新思路,有的甚至繞過Tier1直接找芯片設計廠商。更深入一點的主機廠已經開始參與到芯片設計的研發(fā)流程中。比如,多家車企已經與黑芝麻、地平線這樣的自動駕駛AI芯片廠商建立了戰(zhàn)略合作關系。更有甚者,直接打入半導體供應鏈內部,將芯片設計引入主機廠內部,這種模式稱之為“OEM-Foundry-Direct”模式,代表企業(yè)有特斯拉、比亞迪等。
18)市場定位
選擇什么樣的主控芯片,首先要看該域控制器的市場定位:打算實現(xiàn)什么樣的功能,用于配置在什么價位區(qū)間的車型上。
如果目標定位是做輔助駕駛,做一個L1~L2級的產品,而且是走量的,在選擇芯片的時候對成本就很敏感。這樣的域控產品,選擇中低端芯片即可。
“如果說目標定位是打造一款L4級限定場景下的無人駕駛,那么客戶可能更傾向于去打造一款定制化的產品。比如,定位做Robotaxi,打算走運營的一個模式,目的是想要先把算法打磨出來。它的量就不會特別大,那么選擇芯片時,對成本相對就沒那么敏感,但要求性能足夠好,足夠穩(wěn)定。”
19)芯片的Roadmap
東軟睿馳副總經理劉威提到:“從與芯片公司合作的角度來看,會看它是不是一個主流的芯片廠商,有沒有連續(xù)的產品Roadmap。比如,有一些芯片廠商可能開發(fā)出了一款不錯的芯片,但是后續(xù)沒有更新?lián)Q代。那么圍繞該芯片來做域控制器,后續(xù)產品的迭代和升級會存在很大的問題。”
同樣,均勝電子智能駕駛系統(tǒng)設計負責人李茂青也提到了相同的觀點:“在域控制器系統(tǒng)設計中對于硬件方案的選型上除了關注芯片本身的功能性能外,還需要充分了解芯片公司的產品Roadmap,是否有靈活的家族化芯片系列,后續(xù)的芯片能不能PIN to PIN地在硬件平臺上升級,繼而可以在提升硬件性能的同時降低開發(fā)成本?”
20)芯片的生態(tài)(工具鏈)
芯片整個軟件的工具鏈或者對一些算法的開發(fā)是不是能滿足客戶的需求。也就是說芯片的生態(tài)怎么樣,是否具備一個良好的生態(tài)系統(tǒng)能夠支撐客戶做可落地化的開發(fā),也是主機廠或Tier1在選擇芯片時候的重要考量因素之一。
英偉達的芯片生態(tài)在業(yè)界做的是比較領先的,它的生態(tài)包含了開發(fā)者、可用的應用軟件、豐富的工具和庫:
可為汽車領域提供豐富的軟件算法人才;
在通用AI領域已訓練出大量的算法模型及相關應用軟件;
統(tǒng)一的硬件和底層軟件接口架構(CUDA-X),可便捷的移植到汽車領域;
由于大量的用戶使用,合作伙伴為CUDA平臺貢獻了大量的庫和工具。
知行科技硬件研發(fā)總監(jiān)解釋道:“現(xiàn)在很多主機廠都在用英偉達的Orin芯片,除了它是一個大算力平臺,另外一個重要的原因是它能提供整個軟件的工具鏈,甚至一些底層的代碼以及一些算法的代碼都可以提供;開發(fā)者可以在上面做更多的適配,能夠更好地開發(fā)出一款可以落地的高級自動駕駛計算平臺。選擇芯片,除了芯片本身,更多的是在選擇一種生態(tài)。”
由如上對于自動駕駛域控制器選型過程中比較重要的幾個因素,我們對市場主流的控制器芯片進行了統(tǒng)計分析得出如下分析結果對比表:
自動駕駛控制器主流芯片性能對比 | ||||
品牌 | NXP/S32G274 | 瑞 薩/RCAR M3 | TI/TDA4x | 地平線/J3 |
Core | 1GHz:4 x A53 | 1.7GHz:2 x A57 | 1.8GHz:2 x A72 | 4 x A53 |
功耗 | 2w | 1w | 5w | 2.5w |
DMIPS | 15.9k | 24.5k | 34k | 10K |
Memory | 32-bit LPDDR4/1ch | 32-bit LPDDR4 /2ch | 32-bit LPDDR4/1ch | 32-bit LPDDR4/1ch |
CSI | 雙路MIPI | 雙路MIPI | 雙路MIPI | 雙路MIPI |
算力 | -- | 5TOPs | 8Tops | 5Tops |
GPU+ISP | 2x1 or 1x2 megapixel @ 30 fps | IMR+230 GFLOPS | 176 GFLOPS | -- |
功能安全 | ASIL B+ | ASIL B | ASIL B+ | QM |
ETH | 2 x SGMII/1x RGMII | RGMII | 8x RGMII/SGMII | 1x RGMII |
CANFD | 支持 | 支持 | 支持 | 支持 |
OTA | 支持 | 支持 | 支持 | 支持 |
前端技術應用 | MCU+MPU集成 | 無 | MCU+MPU集成 | MCU+MPU集成 |
總結:
最近由于工作需要,整理了一下域控制器的關鍵參數(shù),供芯片選型使用。NVIDIA的計算平臺真的時是行業(yè)首屈一指,***們廠商的榜樣!
審核編輯:湯梓紅
-
中央控制器
+關注
關注
0文章
12瀏覽量
7433 -
自動駕駛
+關注
關注
790文章
14321瀏覽量
170692 -
AI芯片
+關注
關注
17文章
1983瀏覽量
35917 -
域控制器
+關注
關注
0文章
276瀏覽量
3086
原文標題:自動駕駛域控制器研究:AI芯片選型方案詳解
文章出處:【微信號:談思實驗室,微信公眾號:談思實驗室】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
評論