如果故事的開頭,從端到端和模塊化兩種自動(dòng)駕駛系統(tǒng)的發(fā)展溯源講起,人們會(huì)發(fā)現(xiàn),路線之爭對于高階智駕而言并非是問題的關(guān)鍵。系統(tǒng)的性能、可靠性、安全性等因素需要以人為核心尋找合理的“設(shè)計(jì)交集”,從而共同約束相關(guān)發(fā)展路徑的實(shí)際應(yīng)用和效果呈現(xiàn)。
自2024年開始,城區(qū)NOA普及速度不斷加快。然則在一些研究機(jī)構(gòu)的報(bào)告中顯示,截至2023年底,只有3%的城區(qū)NOA滲透率說明其中仍有明顯的應(yīng)用鴻溝等待跨越。其中原因就是現(xiàn)實(shí)的隨機(jī)性為正確預(yù)測下一秒造成了極大的困難,反映到實(shí)際自動(dòng)駕駛行為中的表現(xiàn)就是:決策保守,應(yīng)對死板、機(jī)械,效率低。在地平線看來,選擇一條可達(dá)成的發(fā)展路徑需要遵循“用戶價(jià)值”,從場景出發(fā),地平線全新一代智駕方案Horizon SuperDrive(下簡稱“SuperDrive”)為了解決城區(qū)的規(guī)控難題采用了更擬人、更像老司機(jī)的“交互博弈”。
讓智駕系統(tǒng)更“老練”的交互博弈
什么樣的智能駕駛能被稱為老司機(jī)?首先來看一些SuperDrive在城市中的行駛片段——
從以上場景的自動(dòng)駕駛行為可以看到,SuperDrive系統(tǒng)已經(jīng)具備一個(gè)老練司機(jī)的開車本能。例如,當(dāng)遇到騎行人或行人主動(dòng)避讓、等待車輛先行時(shí),它會(huì)果決判斷、不猶豫地行駛過去,而不是僵硬地只滿足行人先行的約束條件(為了安全);直行遇到左轉(zhuǎn)高頻場景,在判定擁有路權(quán)的時(shí)候SuperDrive會(huì)選擇徑直過去,而不會(huì)像其他系統(tǒng)一樣躊躇;及時(shí)檢測到前方占道車輛然后減速繞行,整個(gè)繞行路徑優(yōu)雅從容,讓駕駛者獲得如同自己正常駕駛一樣的體驗(yàn),并且有效避免了當(dāng)識別到前方占道車輛減速剎停時(shí),無法主動(dòng)繞行最終被迫接管的窘境。
SuperDrive想要做的,就是能夠平順地處理很多場景(優(yōu)雅),不會(huì)僅為了安全而不去做一些人會(huì)做的博弈行為(不慫),并且能夠感知到車的狀態(tài),像人一樣在一個(gè)相對長的時(shí)間周期里通過思考明白要如何去行動(dòng),而不會(huì)很猶豫、糾結(jié),出現(xiàn)方向盤無目的地亂擺導(dǎo)致車身不明所以地?fù)u晃等(從容篤定),可謂謀定而后動(dòng)。
其背后,有兩大技術(shù)支撐。一個(gè)是讓智駕系統(tǒng)“看”得更明白的“端到端感知架構(gòu)”;另一個(gè)是讓智駕系統(tǒng)“想”得清楚的“交互式博弈算法”。后者作為整個(gè)智駕系統(tǒng)的決策規(guī)劃核心,最主要的是為高階智駕提供了一種思維路徑,而非一種設(shè)計(jì)定式。在實(shí)現(xiàn)端到端感知的基礎(chǔ)上,SuperDrive系統(tǒng)還需要具備超強(qiáng)的博弈能力,才能針對復(fù)雜多元的城區(qū)場景以及中國式交通參與者,實(shí)現(xiàn)“優(yōu)雅不慫,從容篤定”。
SuperDrive的整個(gè)規(guī)控系統(tǒng)的輸入擁有Tensor級別的先驗(yàn)和實(shí)時(shí)結(jié)果,憑借著系統(tǒng)內(nèi)的搜索模塊,在大量數(shù)據(jù)和可能性中尋找最優(yōu)解或相關(guān)信息,同時(shí)考慮時(shí)間和空間因素,根據(jù)輸入數(shù)據(jù)和推理結(jié)果,生成物體或事件隨著時(shí)間和空間變化的軌跡,然后做出預(yù)測或決策,制定運(yùn)動(dòng)規(guī)劃,最終控制車子做出相應(yīng)的駕駛行為。
地平線認(rèn)為,上述所有的處理過程都會(huì)有一個(gè)交互式預(yù)測決策神經(jīng)網(wǎng)絡(luò)的Core,能夠讓系統(tǒng)真正的實(shí)現(xiàn)交互式博弈,整個(gè)推理過程最重要的是輸出Plan/Prediction Pairs,包含自車和他車的,這樣才能更準(zhǔn)確的給出是搶還是讓的決策,且這一過程并不是一次性的,而是所有可能性在每一個(gè)“Planning Cycle”里能夠調(diào)用推演,這能使得系統(tǒng)能夠真的像人一樣在“反復(fù)博弈、尋求最優(yōu)解”,而不是單向從A問題到B結(jié)論般的直白、僵硬。
但當(dāng)輸入的信息超越了過往的“經(jīng)驗(yàn)”,系統(tǒng)則能夠自行做出交互式思考和判斷,從而生成合理的駕駛行為,整體的交互博弈,能夠反復(fù)迭代、推演、強(qiáng)化,在不斷的進(jìn)化中,離“更擬人”無窮近。這相對于之前串行預(yù)測決策的規(guī)控有著很大的區(qū)別。
在目前的應(yīng)用試驗(yàn)中,除了本節(jié)上述的場景外,地平線SuperDrive在面對施工區(qū)避讓、城市環(huán)島通行、路口交互-動(dòng)態(tài)Driveline、效率變道、擁堵變道、擁堵匯流等城市典型場景時(shí),均能夠給用戶帶來優(yōu)雅不慫的智能駕乘體驗(yàn)。典型動(dòng)態(tài)現(xiàn)場案例如下:
背后思考:慢思考
相對于傳統(tǒng)智駕領(lǐng)域的決策規(guī)劃而言,交互博弈是更復(fù)雜的一種決策行為。地平線創(chuàng)始人兼CEO余凱博士介紹,高階智駕系統(tǒng)不能僅僅只在簡單的case里靠直覺去處理,在復(fù)雜的case里,也能夠通過自己的自主思考、博弈去“舉一反三”,也就是說自主思考的背后需要邏輯推演鏈條更長的反復(fù)思考,最終要求達(dá)到anytime、anywhere的反復(fù)博弈,這時(shí)的車子仿佛擁有了一顆“大腦”,能夠全天候、全場景地仿真、想象、演繹甚至腦補(bǔ)。
由此可以引申出SuperDrive設(shè)計(jì)交互博弈背后的思維動(dòng)因,地平線稱之為“慢思考”。“慢思考”這個(gè)概念來自于美國心理學(xué)家丹尼爾·卡尼曼的著作《思考,快與慢》。丹尼爾·卡尼曼認(rèn)為,人類大腦有快與慢兩種做決定的方式。快思考依賴情感、記憶和經(jīng)驗(yàn)迅速作出判斷,它見聞廣博,能夠迅速對眼前的情況做出反應(yīng),但是這樣的思考過程固守“眼見即為事實(shí)”的原則,很容易被蠱惑進(jìn)而上當(dāng);而慢思考通過調(diào)動(dòng)注意力來分析和解決問題,它擁有一個(gè)不斷反芻的思維過程,比較慢,不容易出錯(cuò),但有時(shí)也會(huì)偷懶,選擇讓“快思考”直接接管,用直覺來“走捷徑”。地平線認(rèn)為,智駕系統(tǒng)的交互博弈應(yīng)當(dāng)像人一樣思考,更多的時(shí)候強(qiáng)調(diào)“快和慢”相結(jié)合,以便能夠在動(dòng)態(tài)和不可預(yù)測的環(huán)境中做出更加合理和有效的決策。
現(xiàn)如今,很多決策規(guī)劃模塊的開發(fā)過程中,隨著應(yīng)用場景無限趨于開集形態(tài),依賴人類工程師不斷手寫的(if.else,搜索,優(yōu)化)規(guī)則去對抗自動(dòng)駕駛問題不僅在技術(shù)上陷入窮途末路,而且也沒有無上限的資金用以支持類似的“黑洞投入”。智能駕駛目前遇到的最大瓶頸是“開集和非白名單”的問題,僅靠if.else很難精確地描述并處理不斷變幻的駕駛場景,因此在智能駕駛系統(tǒng)中,人們逐漸采取神經(jīng)網(wǎng)絡(luò)替換掉手寫規(guī)則,憑借數(shù)據(jù)驅(qū)動(dòng)和大模型解決人工短板。
但是地平線想的更進(jìn)一步,雖然基于鑒別式或者單模態(tài)生成式的機(jī)器學(xué)習(xí)技術(shù)能夠通過數(shù)據(jù)的閉環(huán),經(jīng)由算力支持換來了效率,但是仍然無法解決“開集和白名單”的問題,越來越多的判定已經(jīng)達(dá)成共識,機(jī)器學(xué)習(xí)技術(shù)需要具有Common sense(常識),即在沒有特定任務(wù)的訓(xùn)練樣本的情況下,讓模型完成任務(wù)(Zero-shot)。這就涉及到上文所述的“開城”和“ODD無限延展”的問題,智能駕駛的未來就是要讓整個(gè)決策規(guī)劃無限適應(yīng)和處理從來沒有見過的case,而不是遇到問題就簡單粗暴地“confused”,或者直接選擇人為接管。
因此,基于“快、慢”思考的定義,地平線設(shè)計(jì)SuperDrive的時(shí)候也充分注意到了有些場景難以通過直接反饋的方式去處理,而是要像下棋一樣經(jīng)過步驟推演,最好能夠舉一反三(即泛化能力),而不是只有見到才能學(xué)到。針對一些全新的場景,地平線希望做到的是系統(tǒng)能夠完全“從0到1”,這個(gè)“0”并非是數(shù)學(xué)意義上的“空集”,而是能夠在原有的經(jīng)驗(yàn)(這個(gè)經(jīng)驗(yàn)有可能與當(dāng)下場景相關(guān)、準(zhǔn)相關(guān)甚至無關(guān))之上,通過自行比對、自主思考、經(jīng)驗(yàn)推理、不斷模仿,生成更加理性的、符合現(xiàn)實(shí)需要的決策,而不是將一些行駛標(biāo)準(zhǔn)孤立、割裂地看待,導(dǎo)致出現(xiàn)“為了安全能走卻不走”、“遇到突發(fā)狀況毫無變通”的狀況。地平線認(rèn)為,讓系統(tǒng)在交互中學(xué)會(huì)“博弈”,才能跨過智能駕駛迭代過程中的“嘆息之墻”。
軟硬協(xié)同:“1+1>2”
從可用躍遷至好用,對于地平線而言,無論是端到端感知還是交互博弈,最終都需要通過高效的硬件架構(gòu)去運(yùn)行。換句話說,硬件實(shí)力決定了迭代底盤,與此同時(shí)軟件和硬件彼此協(xié)同才能發(fā)揮出“1+1>2”的效用。在交互博弈方面,由于跟以前的串行神經(jīng)網(wǎng)絡(luò)推理模式不一樣,需要相對通用的計(jì)算單元和相對快速的專用計(jì)算單元來完成博弈,因此BPU架構(gòu)也能更加快速高效地處理Close-Loop交互。
基于BPU Nash架構(gòu)的征程6,相比上一代性能上有了大幅提升,其中包含強(qiáng)大的并行浮點(diǎn)計(jì)算能力,以及特別優(yōu)化的超越函數(shù),存儲性能上也進(jìn)行了大面積優(yōu)化,能夠用更加無感的方式、更快的速度實(shí)現(xiàn)各種推理過程。給新一代的計(jì)算架構(gòu)起名為BPU Nash,是意在致敬偉大的數(shù)學(xué)家約翰·納什以及他的著名理論——納什博弈(納什均衡)。所謂的納什博弈,描述了在博弈過程中,無論對方的選擇如何,當(dāng)事人一方都會(huì)選擇某個(gè)確定的策略,任何一方在此策略組合下單方面改變自己的策略(他方策略不變),都不會(huì)提高自身的收益。這個(gè)理論形象地勾勒了地平線在交互博弈算法構(gòu)建過程中想要達(dá)到的最佳狀態(tài):如果這個(gè)系統(tǒng)能夠達(dá)到納什博弈的水平,那么完成對于“人類操作”的替代、實(shí)現(xiàn)自動(dòng)駕駛就不再是空想。
“單點(diǎn)的算法突破或者算力性能突破,都不是高階智駕達(dá)到好用的關(guān)鍵,充分發(fā)揮硬件和軟件的協(xié)同效應(yīng),并以極致開放打造極致效率,才是抵達(dá)高階智駕終局的最佳路徑。”余凱表示。在地平線的邏輯里,軟件與硬件結(jié)合的緊密程度,不僅關(guān)乎計(jì)算效率和能耗降低,也是確保系統(tǒng)和硬件的協(xié)同進(jìn)步、提升整體系統(tǒng)性能效率的核心。
這同樣也是一種全新的開集:實(shí)際駕駛環(huán)境需要系統(tǒng)進(jìn)行徹底的交互博弈,用以完成“擬人化”的終極進(jìn)化,而無論是端到端還是模塊化發(fā)展路徑,都需要硬件基礎(chǔ)的算力支持,在不斷的迭代過程中,軟件層面需要為硬件配備找到效率的邊際拐點(diǎn),硬件需要根據(jù)場景、模型、數(shù)據(jù)的不斷演進(jìn),在提供基礎(chǔ)算力的同時(shí)完成自我革新。
因此,軟硬協(xié)同的邏輯最終孕生的是一個(gè)更加廣袤的產(chǎn)業(yè)生態(tài),軟硬結(jié)合的產(chǎn)業(yè)支柱是所有的參與者開放協(xié)作,由此才能在大模型框架、深度學(xué)習(xí)語料、算法升級和軟硬結(jié)合等層面實(shí)現(xiàn)全業(yè)態(tài)式的互補(bǔ)。目前,地平線已經(jīng)搭建了國內(nèi)最為成熟、高效、開放的生態(tài)體系之一,并與全球超過30家車企達(dá)成了前裝量產(chǎn)合作,合作的量產(chǎn)車型已經(jīng)超過110款。
高階智駕的未來,將是一個(gè)不斷擬人、類人的過程。
從響應(yīng)人,到服務(wù)人,再到解放人,智能駕駛在不斷演進(jìn)的過程中,完成的是人的高維延伸,用優(yōu)雅不慫、從容篤定形容的高階智駕系統(tǒng),一定能夠像“老司機(jī)”一樣預(yù)測、推理、學(xué)習(xí)、決策。在這里,讓我們放下路徑之爭的自我偏見,聚焦到智能駕駛讓人類生活更安全、更美好的目標(biāo)本質(zhì)。當(dāng)高階智駕走向平權(quán)時(shí)代,選擇一種“可達(dá)成”的路線,是地平線的現(xiàn)實(shí)選擇,而當(dāng)智駕產(chǎn)業(yè)邁向以用戶、市場需求為導(dǎo)向的公眾利他之時(shí),多方博弈之下,一定會(huì)窮舉出一個(gè)產(chǎn)業(yè)發(fā)展核心:那就是在產(chǎn)品量產(chǎn)、用戶體驗(yàn)、公眾利益互相交融的智駕市場,技術(shù)普惠最終會(huì)給體驗(yàn)普惠,讓渡出一個(gè)“體驗(yàn)上更擬人、技術(shù)上更類人”的落地空間。
-
智能駕駛
+關(guān)注
關(guān)注
4文章
2813瀏覽量
49952 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
789文章
14318瀏覽量
170606 -
地平線
+關(guān)注
關(guān)注
0文章
397瀏覽量
15523
原文標(biāo)題:SuperDrive背后的“思考”:如何讓智駕決策更像老司機(jī)
文章出處:【微信號:horizonrobotics,微信公眾號:地平線HorizonRobotics】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
地平線攜城區(qū)輔助駕駛系統(tǒng)亮相2025香港車博會(huì)
地平線城區(qū)輔助駕駛系統(tǒng)HSD解讀
地平線余凱:跨越拐點(diǎn),開放共贏加速智駕平權(quán)

雙強(qiáng)聯(lián)手,地平線與大眾汽車集團(tuán)開啟高階智駕合作新征程

地平線與大眾汽車集團(tuán)深化高階智駕合作
地平線SuperDrive相關(guān)問答
地平線SuperDrive首發(fā)三大黑科技,決勝智能化競爭下半場

地平線SuperDrive首發(fā)三大黑科技
智駕科技企業(yè)地平線登陸港交所
智駕科技企業(yè)地平線通過港交所聆訊 IPO進(jìn)入倒計(jì)時(shí)

地平線SuperDrive實(shí)現(xiàn)12城泛化,將于2025年首發(fā)量產(chǎn)

評論