女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自動駕駛中常提的世界模型是個啥?

智駕最前沿 ? 來源:智駕最前沿 ? 作者:智駕最前沿 ? 2025-06-24 08:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

[首發(fā)于智駕最前沿微信公眾號]隨著自動駕駛技術(shù)的不斷成熟,車輛需要在復(fù)雜多變的道路環(huán)境中安全地行駛,這就要求系統(tǒng)不僅能“看見”周圍的世界,還要能“理解”和“推測”未來的變化。世界模型可以被看作一種對外部環(huán)境進(jìn)行抽象和建模的技術(shù),讓自動駕駛系統(tǒng)在一個簡潔的內(nèi)部“縮影”里,對真實世界進(jìn)行描述與預(yù)測,從而為感知、決策和規(guī)劃等關(guān)鍵環(huán)節(jié)提供有力支持。

wKgZO2hZ9viACzMEAAAQo00DEvw607.jpg

什么是世界模型?

我們不妨先把“世界模型”想象成一種“數(shù)字化的地圖”加上“未來預(yù)言機(jī)”。傳統(tǒng)地圖只能告訴我們現(xiàn)在的位置、道路的形狀和一些靜態(tài)信息,但世界模型不僅記錄當(dāng)下路況,還能夠模擬未來幾秒鐘、幾分鐘里可能會發(fā)生的變化。舉個例子,當(dāng)一輛自動駕駛汽車行駛在城市道路上,它通過攝像頭、激光雷達(dá)等傳感器不斷獲取如路邊行人、其他車輛、交通信號燈等周圍環(huán)境信息。世界模型會把這些輸入數(shù)據(jù)轉(zhuǎn)換成一種更小、更抽象的內(nèi)部“狀態(tài)”,類似于把一幅高分辨率的街景圖壓縮成一串?dāng)?shù)字編碼。

當(dāng)汽車需要判斷前方車輛是在減速還是加速、行人是否有可能橫穿馬路時,它會在這個“數(shù)字空間”里模擬幾次不同的動作效果,快速判斷最安全的方案。在實際采集和理解真實圖像時,直接在攝像頭或雷達(dá)數(shù)據(jù)的原始像素或點(diǎn)云上進(jìn)行預(yù)測計算,速度會很慢且耗費(fèi)大量算力;而如果先把環(huán)境“壓縮”成低維的數(shù)字表示,再在這個空間里進(jìn)行多步推演,計算效率會高很多,也更容易應(yīng)對傳感器噪聲帶來的不確定性。

要實現(xiàn)這樣的“抽象與模擬”,其實需要通過神經(jīng)網(wǎng)絡(luò)來自動學(xué)習(xí)。整個過程可以分為三個關(guān)鍵步驟:先是“壓縮”,也就是把原始的圖像、點(diǎn)云等高維感知數(shù)據(jù)變成一個更簡潔的向量表示;接著是“預(yù)測”,也就是在這個向量空間里學(xué)習(xí)環(huán)境如何隨時間變化;最后是“還原”,即把預(yù)測得到的向量再“解碼”回圖像或其他可視化信息,幫助系統(tǒng)評估模擬結(jié)果是否符合真實情況。

在學(xué)術(shù)界和工業(yè)界,這種編碼—預(yù)測—解碼的思路大多通過一種叫做“變分自編碼器”(Variational Autoencoder,簡稱VAE)或者它的升級版“遞歸狀態(tài)空間模型”(Recurrent State Space Model,RSSM)來實現(xiàn)。VAE會先學(xué)習(xí)把每一幀攝像頭圖像壓縮成一個“潛在向量”,然后再嘗試從這個向量重建出相似的圖像;而RSSM在此基礎(chǔ)上,為潛在向量加入了時間維度,通過循環(huán)神經(jīng)網(wǎng)絡(luò)(比如LSTM或者GRU)捕捉連續(xù)幀之間的動態(tài)變化。這樣一來,世界模型既能為當(dāng)前的環(huán)境狀態(tài)建立一個穩(wěn)定的數(shù)字化表示,又能在這個空間里做長短期的多步預(yù)測。

wKgZO2hZ9vmAJbzWAAAR42n7O-I606.jpg

為什么自動駕駛需要世界模型?

為什么要把世界模型應(yīng)用于自動駕駛的仿真訓(xùn)練?原因很簡單:讓計算機(jī)“在腦海里”先演練,再付諸于真實道路。過去,自動駕駛算法大多數(shù)依賴“模型外訓(xùn)練”(Model-Free Training),需要在真實或高度仿真的場景里不斷嘗試、碰撞和糾正,這樣會消耗大量的仿真資源和時間。而世界模型所帶來的“模型內(nèi)訓(xùn)練”(Model-Based Training)思路則是,當(dāng)汽車收集到足夠多的真實駕駛數(shù)據(jù)后,先用這些數(shù)據(jù)訓(xùn)練出一個能夠高度還原現(xiàn)實世界的模型。之后,算法在這個模型里進(jìn)行不斷的強(qiáng)化學(xué)習(xí)和策略優(yōu)化,只在必要時回到真實環(huán)境里檢驗,極大減少了對真實車輛、真實道路的依賴。其實這就像飛行員先在模擬器里反復(fù)訓(xùn)練,再到真機(jī)上飛行,既能提高安全性,也能大幅節(jié)省訓(xùn)練成本。世界模型一旦能準(zhǔn)確反映現(xiàn)實交通的規(guī)則與動態(tài),就能在數(shù)據(jù)的驅(qū)動下讓自動駕駛系統(tǒng)更快地學(xué)會如何避險、跟車、超車和規(guī)避突發(fā)情況,而不必每次都把車開到馬路上去做實驗。

由于不同城市、不同路段的交通狀況往往具有差異,單純用一個固定場景訓(xùn)練出來的算法,到了新環(huán)境就可能表現(xiàn)欠佳。世界模型能夠在潛在空間中模擬多種場景變化,其中包括在高峰時段的城市道路、夜晚燈火昏暗的郊區(qū)公路、雨天積水的路段,甚至是突發(fā)事故或行人闖入的極端情況。通過在單一模型里融合不同場景的特征,自動駕駛算法可以在“內(nèi)部模擬”階段反復(fù)演練多種極端工況,從而提高在真實道路上應(yīng)對新場景時的適應(yīng)能力和魯棒性。換句話說,世界模型相當(dāng)于給算法準(zhǔn)備了一個“千變?nèi)f化的訓(xùn)練場”,幫助它在各種復(fù)雜情形下都能提前“練手”,提升泛化能力。

在實際汽車硬件上部署世界模型時,也有一些有趣的技術(shù)細(xì)節(jié)。車載計算單元(ECU)通常算力有限、內(nèi)存受限,因此需要將訓(xùn)練完成的世界模型進(jìn)行剪枝、量化,或者利用知識蒸餾等手段壓縮模型規(guī)模,才能在實時運(yùn)行時保證延遲足夠低。很多廠商還會借助專門的硬件加速平臺,比如NVIDIA Drive或者英偉達(dá)的Xavier模塊,將深度神經(jīng)網(wǎng)絡(luò)模型加載到專用芯片里。在這樣一個軟硬結(jié)合的架構(gòu)里,車輛能夠在幾毫秒內(nèi)完成世界模型的編碼與預(yù)測,從而為決策模塊提供快速且可靠的“未來場景”信息。如果前方三秒鐘內(nèi)預(yù)測到有行人可能從右側(cè)沖出,車輛就可以在極短時間內(nèi)計算最優(yōu)的制動或轉(zhuǎn)向方案,以確保安全。

wKgZO2hZ9vuAZgV3AAASG3BOmsQ537.jpg

世界模型部署的難點(diǎn)

要讓世界模型真正落地并發(fā)揮優(yōu)勢,也并非易事。第一大挑戰(zhàn)在于數(shù)據(jù)的采集與多樣性,世界模型要學(xué)會準(zhǔn)確地還原現(xiàn)實,就需要大量涵蓋各種道路、天氣、交通密度等場景的高質(zhì)量數(shù)據(jù)。而有些如暴雨天的道路積水、急彎處突然出現(xiàn)的行人或者車輛失控等極端或風(fēng)險場景在真實環(huán)境下往往難以收集到足夠樣本。如果模型只在“平時”的數(shù)據(jù)上學(xué)得很好,到真正出現(xiàn)罕見場景時可能就會力不從心。為應(yīng)對這一點(diǎn),就有技術(shù)提出將現(xiàn)實數(shù)據(jù)與仿真數(shù)據(jù)結(jié)合起來,先用虛擬仿真器生成極端工況的“補(bǔ)充樣本”,再用現(xiàn)實數(shù)據(jù)做微調(diào);同時,還會采用域適應(yīng)(Domain Adaptation)等技術(shù),讓模型在不同數(shù)據(jù)源之間遷移時損失更低,減少“模擬到真實”的性能差距。

第二大挑戰(zhàn)是長期預(yù)測的誤差累積。因為世界模型在潛在空間里一次又一次地根據(jù)上一步的結(jié)果預(yù)測下一步,隨著預(yù)測步數(shù)的增加,小小的誤差就會不斷疊加,最終導(dǎo)致與真實環(huán)境嚴(yán)重偏離。這在做短期預(yù)測(比如一兩秒)時還可以接受,但如果要做更長時間范圍的規(guī)劃時,就需要特別關(guān)注。對此可采用在訓(xùn)練時用“半監(jiān)督、自回歸”和“教師強(qiáng)制”相結(jié)合的策略,即讓模型既學(xué)會用自己預(yù)測的產(chǎn)出作為下一個輸入,也偶爾用真實觀測數(shù)據(jù)來校正;另外,在損失函數(shù)里加入對多步預(yù)測誤差的懲罰,讓模型對長距離時序的穩(wěn)定性更敏感。實車測試時,如果模型預(yù)測與真實觀測的偏差超過閾值,就啟用在線校準(zhǔn)機(jī)制,強(qiáng)制把模型狀態(tài)拉回到真實數(shù)據(jù)上,從而避免誤差在長時間范圍里爆炸式增長。

第三大難題是如何讓世界模型具備一定可解釋性與安全性保障。自動駕駛是典型的安全關(guān)鍵系統(tǒng),如果模型內(nèi)的“潛在向量”像黑盒一樣無法理解,當(dāng)車輛決策出現(xiàn)異常時很難追根溯源。此外,模型可能會被對抗攻擊擾亂,使其對同一個路況輸出完全不同的預(yù)測,這會對行車安全造成嚴(yán)重威脅。對此,可以在世界模型里加入一些可解釋性的設(shè)計,例如讓部分潛在向量專門對應(yīng)車道線、交通標(biāo)志或其他幾何信息,讓模型內(nèi)部有一部分“白盒”成分,便于排查與驗證;同時,在部署前進(jìn)行大規(guī)模的對抗樣本測試,評估在噪聲或故意篡改下的魯棒性,并對潛在向量空間做安全檢查,確保在異常輸入下能及時觸發(fā)緊急制動或安全預(yù)警。

wKgZPGhZ9vuAUXIAAAASAJELks8562.jpg

世界模型的未來趨勢

隨著自監(jiān)督學(xué)習(xí)和多源數(shù)據(jù)融合技術(shù)的發(fā)展,世界模型將進(jìn)一步優(yōu)化。目前,大多數(shù)世界模型仍然需要大量帶標(biāo)簽或弱標(biāo)簽數(shù)據(jù)來學(xué)習(xí);日后更理想的方式是讓模型自己從數(shù)以百萬計的無標(biāo)簽駕駛視頻中挖掘時空規(guī)律,用對比學(xué)習(xí)來保證不同時間或不同視角下的潛在表示保持一致,這樣就能在不依賴人工標(biāo)注的情況下持續(xù)改進(jìn)。而且,未來的世界模型有望與符號推理結(jié)合,比如把交通規(guī)則、路網(wǎng)拓?fù)洹Ⅰ{駛意圖等用邏輯符號表達(dá),與神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的表示互相補(bǔ)充,既能做出嚴(yán)格符合規(guī)則的決策,也能充分利用數(shù)據(jù)驅(qū)動的優(yōu)勢。這種“混合型”世界模型將更加穩(wěn)定可靠,也更容易通過法規(guī)與安全認(rèn)證。隨著車聯(lián)網(wǎng)(V2X)技術(shù)的普及,世界模型還能夠與云端和其他車輛協(xié)同感知,實現(xiàn)實時在線更新:當(dāng)某一地區(qū)突然發(fā)生大規(guī)模擁堵或事故時,其他車輛探測到的路況信息、云端的高精地圖更新,都可以立即反饋到每輛車的世界模型里,讓它們快速調(diào)整預(yù)測,提高對極端情況的敏銳度。

世界模型為自動駕駛系統(tǒng)帶來了一個“在腦海中仿真”的能力,讓車輛能夠在更小、更高效的內(nèi)部空間里對未來環(huán)境做多步預(yù)測,從而加快決策速度、降低誤判風(fēng)險,并在面對多樣化與復(fù)雜化的道路場景時表現(xiàn)得更從容。但要讓這一能力發(fā)揮最大效益,還需要在數(shù)據(jù)收集、長期預(yù)測穩(wěn)定性、可解釋性、安全性和車端部署效率等方面持續(xù)優(yōu)化與攻堅。伴隨著深度學(xué)習(xí)、硬件加速和車聯(lián)網(wǎng)等技術(shù)的不斷進(jìn)步,世界模型將在自動駕駛領(lǐng)域扮演越來越關(guān)鍵的角色,幫助我們實現(xiàn)更安全、更智能無人駕駛出行體驗。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自動駕駛
    +關(guān)注

    關(guān)注

    788

    文章

    14263

    瀏覽量

    170132
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    自動駕駛中常的HMI是

    [首發(fā)于智駕最前沿微信公眾號]在自動駕駛汽車領(lǐng)域,HMI(Human–Machine Interface,人機(jī)交互界面)正成為很多車企相互競爭的一大領(lǐng)域。之所以如此,是因為在車輛從“人控”過渡到“機(jī)
    的頭像 發(fā)表于 06-22 13:21 ?804次閱讀

    自動駕駛中常的“點(diǎn)云”是

    ?對自動駕駛有何影響? 點(diǎn)云是? 點(diǎn)云(Point Cloud)是一種在三維空間中由大量離散點(diǎn)組成的數(shù)據(jù)集合,每個點(diǎn)包含自身的笛卡爾坐標(biāo)(X、Y、Z),并可附帶顏色、強(qiáng)度、時間戳
    的頭像 發(fā)表于 05-21 09:04 ?230次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“點(diǎn)云”是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    模型如何推動自動駕駛技術(shù)革新?

    [首發(fā)于智駕最前沿微信公眾號]近年來,人工智能技術(shù)正以前所未有的速度在各個領(lǐng)域滲透與應(yīng)用,而大模型(大語言模型和多模態(tài)大模型)的迅猛發(fā)展為自動駕駛技術(shù)帶來了新的機(jī)遇。傳統(tǒng)的
    的頭像 發(fā)表于 04-20 13:16 ?245次閱讀
    大<b class='flag-5'>模型</b>如何推動<b class='flag-5'>自動駕駛</b>技術(shù)革新?

    自動駕駛行業(yè)常的高階智駕是

    的調(diào)整,也見證了這個行業(yè)的技術(shù)演進(jìn)。“高階智駕”作為現(xiàn)階段在各大車企發(fā)布會經(jīng)常提到的一詞,也預(yù)示著自動駕駛行業(yè)正加速走入下半場。高階智駕不僅在功能上遠(yuǎn)超傳統(tǒng)的高級輔助駕駛系統(tǒng),更在核心技術(shù)、系統(tǒng)架構(gòu)以及整體安
    的頭像 發(fā)表于 04-18 12:24 ?302次閱讀
    <b class='flag-5'>自動駕駛</b>行業(yè)常<b class='flag-5'>提</b>的高階智駕是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中常的“NOA”是

    近年來,自動駕駛技術(shù)發(fā)展迅速,業(yè)界不斷探索如何在復(fù)雜交通場景中實現(xiàn)真正的無人駕駛。城市NOA作為自動駕駛的一項前沿技術(shù),正成為各大廠商相互爭奪的關(guān)鍵技術(shù)。 何為NOA? NOA,全稱
    的頭像 發(fā)表于 04-09 09:03 ?602次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“NOA”是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛模型中常的Token是?對自動駕駛有何影響?

    、多模態(tài)傳感器數(shù)據(jù)的實時處理與決策。在這一過程中,大模型以其強(qiáng)大的特征提取、信息融合和預(yù)測能力為自動駕駛系統(tǒng)提供了有力支持。而在大模型的中,有一“Token”的概念,有些人看到后或許
    的頭像 發(fā)表于 03-28 09:16 ?321次閱讀

    自動駕駛行業(yè)中的Tier1與Tier2是?有何區(qū)別?

    責(zé)任分工。那么,Tier1和Tier2到底是?兩者之間又有哪些具體區(qū)別? Tier1和Tier2的定義 在自動駕駛行業(yè)中,Tier1和Tier2分別是供應(yīng)鏈中的兩重要環(huán)節(jié),它們在
    的頭像 發(fā)表于 03-16 10:50 ?669次閱讀

    為什么聊自動駕駛的越來越多,聊無人駕駛的越來越少?

    自動駕駛有什么區(qū)別?為什么現(xiàn)在一直都在聊自動駕駛,卻鮮少有企業(yè)無人駕駛?今天智駕最前沿就圍繞這個話題和大家簡單聊聊。 自動駕駛和無人
    的頭像 發(fā)表于 02-23 10:52 ?499次閱讀
    為什么聊<b class='flag-5'>自動駕駛</b>的越來越多,聊無人<b class='flag-5'>駕駛</b>的越來越少?

    自動駕駛中常的魯棒性是

    隨著自動駕駛技術(shù)的快速發(fā)展,魯棒性(Robustness)成為評價自動駕駛系統(tǒng)的重要指標(biāo)之一。很多小伙伴也會在自動駕駛相關(guān)的介紹中,對某些功能用魯棒性進(jìn)行描述。一魯棒的系統(tǒng)能夠在復(fù)雜
    的頭像 發(fā)表于 01-02 16:32 ?7068次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的魯棒性是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    標(biāo)貝科技:自動駕駛中的數(shù)據(jù)標(biāo)注類別分享

    自動駕駛訓(xùn)練模型的成熟和穩(wěn)定離不開感知技術(shù)的成熟和穩(wěn)定,訓(xùn)練自動駕駛感知模型需要使用大量準(zhǔn)確真實的數(shù)據(jù)。據(jù)英特爾計算,L3+級自動駕駛每輛汽
    的頭像 發(fā)表于 11-22 15:07 ?1907次閱讀
    標(biāo)貝科技:<b class='flag-5'>自動駕駛</b>中的數(shù)據(jù)標(biāo)注類別分享

    自動駕駛中常的SLAM到底是

    ?這兩問題。目前,自動駕駛技術(shù)主要依賴高精地圖和RTK(實時動態(tài)定位)系統(tǒng)完成高精度定位。然而,這種方法的實現(xiàn)成本高昂,需要依賴于完善的基礎(chǔ)設(shè)施,且在動態(tài)環(huán)境中適應(yīng)性不足。為此自動駕駛工程師提出了另一種更具靈活性和
    的頭像 發(fā)表于 11-21 15:17 ?1571次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的SLAM到底是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    自動駕駛中一直說的BEV+Transformer到底是

    在很多車企的自動駕駛介紹中,都會聽到一關(guān)鍵技術(shù),那就是BEV+Transformer,那BEV+Transformer到底是?為什么很多車企在
    的頭像 發(fā)表于 11-07 11:19 ?1298次閱讀
    <b class='flag-5'>自動駕駛</b>中一直說的BEV+Transformer到底是<b class='flag-5'>個</b><b class='flag-5'>啥</b>?

    Waymo利用谷歌Gemini大模型,研發(fā)端到端自動駕駛系統(tǒng)

    邁新步,為其機(jī)器人出租車業(yè)務(wù)引入了一種基于谷歌多模態(tài)大語言模型(MLLM)“Gemini”的全新訓(xùn)練模型——“端到端多模態(tài)自動駕駛模型”(EMMA)。
    的頭像 發(fā)表于 10-31 16:55 ?1640次閱讀

    FPGA在自動駕駛領(lǐng)域有哪些優(yōu)勢?

    FPGA(Field-Programmable Gate Array,現(xiàn)場可編程門陣列)在自動駕駛領(lǐng)域具有顯著的優(yōu)勢,這些優(yōu)勢使得FPGA成為自動駕駛技術(shù)中不可或缺的一部分。以下是FPGA在自動駕駛
    發(fā)表于 07-29 17:11

    FPGA在自動駕駛領(lǐng)域有哪些應(yīng)用?

    FPGA(Field-Programmable Gate Array,現(xiàn)場可編程門陣列)在自動駕駛領(lǐng)域具有廣泛的應(yīng)用,其高性能、可配置性、低功耗和低延遲等特點(diǎn)為自動駕駛的實現(xiàn)提供了強(qiáng)有力的支持。以下
    發(fā)表于 07-29 17:09