在高階輔助駕駛的探索中,有一個“感知滯后”的矛盾始終難以解決。
長期以來,自動駕駛系統(tǒng)的基本策略都是:傳感器先看到→ 感知系統(tǒng)識別 → 再決定怎么行動。這個邏輯聽上去合理,但在復(fù)雜真實(shí)的交通環(huán)境中,問題開始暴露。
現(xiàn)實(shí)路況從不按劇本來:限時公交道、潮汐車道、臨時封路、行人突然變道……這些變量,不是“看見之后再反應(yīng)”就能應(yīng)對的。真正的人類駕駛靠的并不是對眼前物體的識別,而是對背后因果的推理——前方急剎,第一反應(yīng)不是“它減速了”,而是“是不是前面堵了?”
這是一種基于“世界模型”的判斷方式。人腦通過經(jīng)驗(yàn)積累形成對環(huán)境的理解模型,從而提前預(yù)判、靈活應(yīng)變。而今天的智能駕駛系統(tǒng),大多數(shù)依然是事后處理——等事件發(fā)生,再想怎么辦。
這也就是為什么,從2023年以來,以特斯拉、Wayve為代表的技術(shù)企業(yè)開始大規(guī)模投入“世界模型”的研發(fā)。而在2025年5月25日,蔚來發(fā)布ET5與ET5T時,低調(diào)上線的“全域NOP+”功能,標(biāo)志著其自研的世界模型NWM即將正式落地。雖然不是第一個提出世界模型的廠商,但蔚來成為國內(nèi)率先實(shí)現(xiàn)“量產(chǎn)上車”的代表。
這并非個例。幾乎所有頭部智能駕駛玩家都在押注“世界模型”,并非追逐風(fēng)口,而是因?yàn)椋簺]有“腦子”的車,注定只能做出有限的反應(yīng);而擁有“認(rèn)知能力”的車,才能真正適應(yīng)千變?nèi)f化的世界。
為什么說“世界模型”是智能駕駛的下一個躍遷?
過去十年,自動駕駛經(jīng)歷了一次重要技術(shù)躍遷:從“模塊化架構(gòu)”過渡到“端到端模型”。
端到端模型的最大特征,是把感知、預(yù)測、決策、控制這幾個原本各自獨(dú)立的環(huán)節(jié),整合進(jìn)一個統(tǒng)一的神經(jīng)網(wǎng)絡(luò)中。一體處理,效率更高、鏈路更短,也被認(rèn)為更具泛化能力。
一時間,它被認(rèn)為是通向“通用智能駕駛”的終極路徑。
但美好愿景很快撞上了現(xiàn)實(shí)。端到端架構(gòu)雖然緊湊高效,卻暴露出三個致命缺陷:
第一,它是“黑盒系統(tǒng)”。系統(tǒng)做出什么決策、為什么這么決策,很難解釋。這讓調(diào)試變得極其困難,也降低了對系統(tǒng)的信任。
第二,它高度依賴海量標(biāo)注數(shù)據(jù),遷移成本極高。換一個城市、換一個國家,模型就可能要重訓(xùn)。
第三,它是典型的概率決策機(jī)制。面對復(fù)雜情況時,它往往給出“最有可能”的方案,卻錯過了“最關(guān)鍵”的細(xì)節(jié)。哪怕只錯一次,結(jié)果也可能是災(zāi)難性的。
隨著技術(shù)演進(jìn)和現(xiàn)實(shí)碰撞的反復(fù)出現(xiàn),業(yè)內(nèi)開始出現(xiàn)反思:
“如果90%的消費(fèi)級數(shù)據(jù)對訓(xùn)練沒幫助,那我們到底在喂模型什么?”
這時,世界模型走上前臺。
它源于AI領(lǐng)域?qū)χ悄荏w長期策略規(guī)劃的探索,本質(zhì)是為系統(tǒng)構(gòu)建一個可解釋、可預(yù)測的“世界認(rèn)知結(jié)構(gòu)”。
簡單來說,過去的模型只是在識別“這是什么”,而世界模型則在追問“這意味著什么”,以及“接下來會發(fā)生什么”。它具備一種“腦內(nèi)模擬”的能力——預(yù)測未來、虛擬試錯。
以一個典型例子說明:
“北京公交專用道工作日7:00-9:00禁行”。過去的系統(tǒng)需要靠“硬編碼”將這條規(guī)則寫入模型,但并不理解它為何如此。而世界模型可以直接接受這句話為輸入,理解其時間邏輯與空間邊界,并在駕駛過程中自主執(zhí)行。
甚至,如果某天市政網(wǎng)站發(fā)布一條臨時封路通告,世界模型可以自動讀取網(wǎng)頁信息,將臨時交通政策納入自身認(rèn)知中,做出即時調(diào)整。
蔚來此前展示的一段Demo也印證了這一點(diǎn)。在一個Y字路口,蔚來與寶馬轎車同時左轉(zhuǎn)。大多數(shù)系統(tǒng)會選擇“等”,但蔚來的策略卻體現(xiàn)出明確的意圖博弈——在規(guī)則允許下先行一步,表現(xiàn)出一種接近“人類駕駛風(fēng)格”的主動性。
這不是“看到了再反應(yīng)”,而是“提前知道要做什么”。
世界模型的最大價值,就在于它是AI邁向“理解世界”的必要門檻。
幾乎所有頭部車企都在押注世界模型
如果說過去十年的智能駕駛技術(shù)在解決“怎么讓車看得清”,那么現(xiàn)在的問題變成了:“怎么讓它想得對”。
這背后的根本挑戰(zhàn)在于:如何真正實(shí)現(xiàn)大規(guī)模泛化能力?
端到端模型做得很像人類:它快速、直覺、整體決策,但一旦遇到?jīng)]見過的情況,系統(tǒng)就極容易“宕機(jī)”。
這不是偶然,而是“機(jī)制設(shè)計(jì)”決定的。端到端依賴的是數(shù)據(jù)分布,而不是邏輯建模。
而世界模型的設(shè)計(jì)目標(biāo)正好相反:它試圖為系統(tǒng)建立一種可遷移、可解釋、可預(yù)測的“世界理解力”。
蔚來的NWM是典型代表。每0.1秒,系統(tǒng)可以生成216種未來軌跡,在下一幀輸入后重新篩選最佳路徑。這個過程近似于人類司機(jī)的“反復(fù)評估—微調(diào)—決策”行為。
理想的MindVLA則更注重三維語義與軌跡生成的語言建模能力,小鵬的XVLA則主攻車端部署效率,華為乾崑WEWA用“云+端”分體方式構(gòu)建認(rèn)知鏈路。
這些架構(gòu)的多樣性背后,隱含的邏輯是一致的:
構(gòu)建一種“可擴(kuò)展的認(rèn)知系統(tǒng)”,不僅能識別路況、理解規(guī)則,還能推演后果,并據(jù)此自主決策。
也正因?yàn)榇?,我們看到行業(yè)呈現(xiàn)出極高的共識:
幾乎所有頭部玩家,都不約而同選擇將世界模型作為“未來架構(gòu)”的核心。這不再是路線之爭,而是一種時代選擇。
智駕遠(yuǎn)未到定格局時刻,技術(shù)進(jìn)步是無限的
很多人認(rèn)為,華為是當(dāng)前智能駕駛的“天花板”,但事實(shí)上,這個行業(yè)遠(yuǎn)未定局。各種技術(shù)路線并行演進(jìn),智能駕駛?cè)匀皇且粋€“群雄逐鹿”的賽場。
端到端模型的確在落地效率上有天然優(yōu)勢,但在泛化能力、認(rèn)知建模等維度上,仍存在結(jié)構(gòu)性瓶頸。
而世界模型雖然看起來更聰明,但也遠(yuǎn)未解決所有問題,比如數(shù)據(jù)重構(gòu)精度、計(jì)算資源約束、訓(xùn)練時長過長、模型調(diào)優(yōu)復(fù)雜……它看起來也并不是一下就跨時代突破的“萬能答案”。
但至少,它為智能駕駛開辟出了一條新的通路。而且從邏輯以及實(shí)際的應(yīng)用上,要優(yōu)于當(dāng)前大家能看到的一些技術(shù)路線的表現(xiàn)。它讓我們有機(jī)會在當(dāng)前“識別-決策-控制”鏈條之外,另起一套基于“理解-推演-博弈”的智能架構(gòu)。
不同企業(yè)的布局選擇,實(shí)際上也代表了對下一代智駕范式的判斷。蔚來的NWM以重建為核心,結(jié)合視頻自監(jiān)督方式做軌跡生成;理想的MindVLA融合語言模型與擴(kuò)散建模,強(qiáng)化了對目標(biāo)行為的“語義感知”;小鵬的XVLA更側(cè)重車端部署的輕量化和高頻閉環(huán)訓(xùn)練;而英偉達(dá)Cosmos則提供了物理世界下的多模態(tài)合成數(shù)據(jù)平臺……每一個方向,既有優(yōu)勢,也有現(xiàn)實(shí)制約。
這場變革,不會一蹴而就,也不是一家企業(yè)能獨(dú)自完成的。
但它確實(shí)已成為越來越多頭部玩家愿意投入資源、賭上一代架構(gòu)去押注的方向。蔚來已經(jīng)打響了第一槍,誰會跟上,值得關(guān)注。
未來,或許會有更多路徑共同并行發(fā)展,也許哪一條最終跑出來仍未可知,但智能駕駛的本質(zhì)不會變——那就是:理解世界。
而在這個方向上,世界模型,的確是一次有意義的開始。
文章推薦
探索沃爾沃XC60:豪華SUV中的安全典范 傳祺gs4霧燈在哪開 傳祺gs4倒車燈型號 比亞迪元用什么機(jī)油好 gs4空調(diào)濾芯怎么換 gs4自動空調(diào)怎么用 傳祺gs4水箱在哪里 廣汽gs4傳祺換車門 傳祺gs4儀表盤圖標(biāo) 傳祺gs4雨刷怎么用最新文章
探索沃爾沃XC60:豪華SUV中的安全典范 傳祺gs4霧燈在哪開 傳祺gs4倒車燈型號 比亞迪元用什么機(jī)油好 gs4空調(diào)濾芯怎么換 gs4自動空調(diào)怎么用 傳祺gs4水箱在哪里 廣汽gs4傳祺換車門 傳祺gs4儀表盤圖標(biāo) 傳祺gs4雨刷怎么用