1
自動駕駛是一種類人駕駛,即計算機模擬人類的駕駛行為,其功能的實現(xiàn)同樣分為感知、理解、決策和執(zhí)行四個層次,由各類傳感器、ECU和執(zhí)行器來實現(xiàn)。
在整個自動駕駛實現(xiàn)的流程中:
1)感知層主要依賴激光雷達和攝像頭等傳感器設(shè)備所采集的信息感知汽車周圍環(huán)境,以硬件設(shè)備的精確度、可靠性為主要的衡量標準。
2)執(zhí)行層通過汽車執(zhí)行器,包括油門、轉(zhuǎn)向和制動(剎車)等,實現(xiàn)車輛決策層輸出的加速、轉(zhuǎn)向和制動等決策,主要依靠機械技術(shù)實現(xiàn)。
3)AI技術(shù)主要應(yīng)用于理解層和決策層,擔任駕駛汽車“大腦”的角色。
2
理解層對感知層數(shù)據(jù)進行解析,AI 算法技術(shù)優(yōu)勢盡現(xiàn)
依據(jù)感知層傳感器的不同,理解層主要完成兩個任務(wù):車輛的高精度定位,以及物體識別和追蹤。
高精度定位任務(wù)的實現(xiàn)主要是通過GPS或視覺的算法實現(xiàn)非常精準的車輛定位,目前主要的技術(shù)路線有三種:慣性傳感器(IMU)和GPS定位、基于視覺里程計算法定位、基于雷達的定位。
AI 算法在理解層最主要的應(yīng)用是物體的識別和追蹤。物體跟蹤和識別包括靜態(tài)物體識別和動態(tài)物體識別,對于動態(tài)物體還需要對其軌跡進行追蹤,基于追蹤的結(jié)果預(yù)測其下一步的位臵,計算出安全的行車空間。自動駕駛車輛需要實時進行多個物體的識別和追蹤,典型的物體包括車輛、行人、自行車等。
激光雷達和計算機視覺是實現(xiàn)物體識別和跟蹤的兩種途徑,Google和Tesla分別代表了這兩種不同的技術(shù)路線。
激光雷達生成的點云數(shù)據(jù)包含物體的3D輪廓信息,同時通過強度掃描成像獲取物體的反射率,因此可以輕易分辨出草地、樹木、建筑物、路燈、混凝土、車輛等。識別軟件算法簡單,很容易達到實時性的要求。
計算機視覺的方法是利用深度學(xué)習(xí)對攝像頭圖像進行處理,從像素層面的顏色、偏移和距離信息提取物體層面的空間位臵(立體視覺法)和運動軌跡(光流法)。基于視覺的物體識別和跟蹤是當前的研究熱點,但是總體來說輸出一般是有噪音,如物體的識別有可能不穩(wěn)定,可能有短暫誤識別等。
3
決策層如何應(yīng)對復(fù)雜情形是自動駕駛的關(guān)鍵瓶頸
在理解層的基礎(chǔ)上,決策層解決的問題是如何控制汽車行為以達到駕駛目標。在一個具有障礙物并且動態(tài)變化的環(huán)境中,按照一定的評價條件尋找一條從起始狀態(tài)到目標狀態(tài)的無碰撞路徑。自動駕駛汽車的決策包括全局性導(dǎo)航規(guī)劃、駕駛行為決策和運動軌跡規(guī)劃。
1)全局導(dǎo)航規(guī)劃在已知電子地圖、路網(wǎng)以及宏觀交通信息等先驗信息下,根據(jù)某優(yōu)化目標,選擇不同的道路。
2)駕駛行為決策根據(jù)當前交通狀況、交通法規(guī)、結(jié)構(gòu)化道路約束,決定車輛的目標位臵,抽象化為不同的駕駛行為,如變換車道、路口轉(zhuǎn)向等。
3)運動軌跡規(guī)劃是基于駕駛行為決策,躲避障礙物,對到達目標位臵的路線進行規(guī)劃。
強化學(xué)習(xí)在自動駕駛決策層具有應(yīng)用前景。強化學(xué)習(xí)的目的是通過和環(huán)境交互學(xué)習(xí)到如何在相應(yīng)的觀測中采取最優(yōu)行為。行為的好壞可以通過環(huán)境給的獎勵來確定。不同的環(huán)境有不同的觀測和獎勵。
例如,駕駛中環(huán)境觀測是攝像頭和激光雷達采集到的周圍環(huán)境的圖像和點云,以及其他的傳感器的輸出。駕駛中的環(huán)境的獎勵根據(jù)任務(wù)的不同,可以通過到達終點的速度、舒適度和安全性等指標確定。當前增強學(xué)習(xí)的算法在自動駕駛汽車決策上的研究還比較初步,有試錯次數(shù)多、算法可解釋性差等弱點。
4
深度學(xué)習(xí)算法在自動駕駛中廣泛應(yīng)用,端到端自動駕駛?cè)跃咛魬?zhàn)
車輛的道路行駛環(huán)境非常復(fù)雜,需要處理大量非結(jié)構(gòu)化數(shù)據(jù)。深度學(xué)習(xí)算法能夠高效的處理非結(jié)構(gòu)化數(shù)據(jù),并自動地從訓(xùn)練樣本中學(xué)習(xí)特征,當訓(xùn)練樣本足夠大時,算法能夠處理遇到的新的狀況以應(yīng)對復(fù)雜決策問題。以基本的車輛識別問題為例,在用足夠多的汽車圖像對算法進行訓(xùn)練后,算法具備了識別汽車的能力。
深度學(xué)習(xí)在自動駕駛中的應(yīng)用可以分為兩個學(xué)派:端到端式(End to End Architecture)和問題拆解式(Semantic Abstraction)。與人類相比,在端到端式的構(gòu)架中,一個DNN網(wǎng)絡(luò)模擬了人的整個駕駛行為;而在問題拆解式的構(gòu)架中,每個DNN網(wǎng)絡(luò)僅模擬了人的一部分駕駛行為。
端對端式不需要人工將問題進行拆解,只需要一個深度神經(jīng)網(wǎng)絡(luò)(DNN),在經(jīng)過訓(xùn)練后,基于傳感器的輸入信息(如照片),直接對車輛的加減速和轉(zhuǎn)向等進行控制。
問題拆解式需要人工將問題進行拆解,分別訓(xùn)練多個DNN網(wǎng)絡(luò),實現(xiàn)諸如車輛識別、道路識別、交通信號燈識別等功能。然后基于各個DNN網(wǎng)絡(luò)的輸出,再對車輛的加減速和轉(zhuǎn)向進行控制。
目前,問題拆解式深度學(xué)習(xí)在自動駕駛領(lǐng)域得到廣泛的應(yīng)用,主要是進行圖像識別。如識別行駛途中遇到的車輛、行人、地上的交通標志線、交通信號燈等。
-
AI
+關(guān)注
關(guān)注
88文章
34401瀏覽量
275642 -
自動駕駛
+關(guān)注
關(guān)注
788文章
14223瀏覽量
169674
原文標題:行業(yè) | AI賦能汽車理解決策能力,端到端自動駕駛是終極目標
文章出處:【微信號:THundersoft,微信公眾號:ThunderSoft中科創(chuàng)達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
新能源車軟件單元測試深度解析:自動駕駛系統(tǒng)視角
索尼FCB-EV9520L攝像頭:賦能自動駕駛新體驗
AI將如何改變自動駕駛?
NVIDIA DRIVE技術(shù)推動自動駕駛發(fā)展
淺析基于自動駕駛的4D-bev標注技術(shù)

一文聊聊自動駕駛測試技術(shù)的挑戰(zhàn)與創(chuàng)新

MEMS技術(shù)在自動駕駛汽車中的應(yīng)用
NVIDIA助力初創(chuàng)公司W(wǎng)ayve開發(fā)創(chuàng)新自動駕駛技術(shù)
聊聊自動駕駛離不開的感知硬件
FPGA在自動駕駛領(lǐng)域有哪些優(yōu)勢?
FPGA在自動駕駛領(lǐng)域有哪些應(yīng)用?
自動駕駛識別技術(shù)有哪些
自動駕駛的傳感器技術(shù)介紹
國科微AI首席科學(xué)家邢國良:打造全系邊端AI芯片,賦能下一代自動駕駛

評論