具備自主預(yù)判性,才是真正的智能輔助駕駛。
一萬年太久,只爭朝夕。高階智能駕駛輔助正駛在發(fā)展的快車道上,技術(shù)迭代幾乎在以一年一大版本的節(jié)奏演化著。頭部玩家們2023年開推“無高精地圖”路線,24年主講“端到端”故事,25年則流行起了“世界模型”。
而當(dāng)版本迭代到“世界模型”后,駕駛輔助終于開始展現(xiàn)出真正的智能,因為系統(tǒng)被賦予了自主預(yù)判的能力,它開始變得像一個擁有自主意識的人類了。
智能駕駛系統(tǒng)利用高清攝像頭、激光雷達(dá)、毫米波雷達(dá)等感知硬件探測出周圍的環(huán)境,在理解了外面的世界后,汽車才能在做出通行策略,并執(zhí)行正確操作。
但外界環(huán)境對于智能駕駛系統(tǒng)來講,還是過于復(fù)雜了。不同特征的道路規(guī)劃、不受控的行人、不規(guī)則的車輛、不可控的天氣狀況等,都是不確定因素,造成的結(jié)果就是,未知“極端個例”永遠(yuǎn)海量般地存在著。身陷在一個個新的Coner case中,智能駕駛自然就成了“人工智障”。
端到端智能輔助駕駛縮短了程序鏈路,尤其一段式的端到端,把感知、決策、執(zhí)行環(huán)節(jié)整合進(jìn)統(tǒng)一的神經(jīng)網(wǎng)絡(luò)之中,一定程度上提高了系統(tǒng)的應(yīng)對效率,因此被認(rèn)為更具泛化、適應(yīng)能力。
但如果智能駕駛的底層邏輯仍停留在“規(guī)則主導(dǎo)”上,依靠數(shù)據(jù)投喂,覆蓋新的個例場景,并制定應(yīng)對的規(guī)則,就永遠(yuǎn)是在進(jìn)行一種“填鴨式”的被動學(xué)習(xí)。
這個過程中,不僅海量的數(shù)據(jù)冗余帶來標(biāo)注負(fù)擔(dān)和算力浪費(fèi),還永遠(yuǎn)無法完全覆蓋所有“極端個例場景”。駕駛關(guān)乎人身安全,一般情況下,不允許妥協(xié),而陷入“龜兔悖論”中,也就意味著永遠(yuǎn)達(dá)不成真正的智能駕駛。
真正的駕駛,并不應(yīng)該是看到信息后機(jī)械似地做出被動應(yīng)對,而是結(jié)合過往經(jīng)驗,理解所處的環(huán)境,在大腦中形成提前的預(yù)判,或做出靈活的應(yīng)變。
這恰是面對未知的極端場景,系統(tǒng)與人類的本質(zhì)區(qū)別所在,而預(yù)見性的自主判斷和靈活的決斷,正是世界模型期許到達(dá)的未來。
例如在蔚來最近發(fā)布的NWM世界模型中,系統(tǒng)每0.1秒可生成超200種的可能軌跡,并且會在下一幀信息輸入后,篩選最佳路徑,這個過程其實就是在模擬人類駕駛員“反復(fù)評估—微調(diào)—決策”行為。
世界模型這種生成式人工智能如此特別,在于其可以“反事實推理”。系統(tǒng)不僅被動地接受我們賦予的限制條件和對應(yīng)決策,還能夠思考如何類似、但還未實際經(jīng)歷的情況下,做出合理的決策。
系統(tǒng)就像一個開始萌發(fā)自主意識的孩童,不光觀察、學(xué)習(xí)著周遭世界,還在執(zhí)行、模仿之余,擁有“舉一反三”的思考能力,去主動探索這個世界。
特斯拉FSD入華后,雖然出現(xiàn)了很多適配性方面的問題,如看不懂交通標(biāo)識、占用非機(jī)動車道等,但體驗過FSD的業(yè)界大佬,都不約而同地認(rèn)可特斯拉是當(dāng)下最成熟的智能駕駛,駕駛得很絲滑。
特斯拉給人的感覺是,它像個不太熟悉中國交規(guī)、路況的老外,經(jīng)常出錯,啼笑皆非。但它又確實是懂怎么開車的,是當(dāng)下最接近人類駕駛員的智駕系統(tǒng)。
特斯拉很少紕漏其智能駕駛方面的技術(shù)細(xì)節(jié),但可以確定的是,特斯拉很早便開始利用高效的大模型,來加速數(shù)據(jù)驅(qū)動下的系統(tǒng)進(jìn)化,這其實也是行業(yè)頭部玩家們都在角力的賽道。
2025年CVPR輔助駕駛國際挑戰(zhàn)賽“端到端輔助駕駛”賽道,NVIDIA輔助駕駛應(yīng)用研究團(tuán)隊通過泛化軌跡評(GTRS)方法連續(xù)奪魁。
這次挑戰(zhàn)賽的主題恰是“實現(xiàn)通用的具身系統(tǒng)”,也即基于數(shù)據(jù)驅(qū)動的非反應(yīng)式輔助駕駛仿真框架,NVIDIA泛化軌跡評(GTRS)方法的核心正是生成各種軌跡,并逐步篩選出最佳路徑。
基于感知到的環(huán)境,GTRS可擴(kuò)散性地創(chuàng)建出涵蓋各種情況的粗略軌跡集和適用于安全關(guān)鍵情況的細(xì)粒度軌跡集,然后利用依賴感知數(shù)據(jù)訓(xùn)練出的Transformer解碼器,捕捉相似軌跡之間細(xì)微但關(guān)鍵的差異,逐漸篩選出最具可能性的候選軌跡。
其實早在CES 2025上,NVIDIA發(fā)布的Cosmos?便是一個為具身智能打造的集成平臺,整合了前沿生成式世界基礎(chǔ)模型的各個環(huán)節(jié),用于加速數(shù)據(jù)處理和管理,目的就是為世界模型訓(xùn)練提供支持,加速智能汽車、機(jī)器人的物理AI開發(fā)。
當(dāng)強(qiáng)化學(xué)習(xí)的效率被提高,智能駕駛終于開始展現(xiàn)出“所有AI項目之母”的潛力,雖然曾經(jīng)這么認(rèn)為的蘋果CEO蒂姆·庫克早已經(jīng)放棄了造車。
世界模型遠(yuǎn)不是自動駕駛的終點,需要解決的問題有很多,例如模型訓(xùn)練時長、構(gòu)架精度優(yōu)化等,不同玩家間的路線和策略也很不同,以“蔚小理”為例:
蔚來NWM的核心是模型重建,結(jié)合視頻自監(jiān)督方式生成軌跡;小鵬的XVLA側(cè)重高頻閉環(huán)訓(xùn)練來加快車端部署和提升用戶體驗;理想MindVLA則強(qiáng)調(diào)了語言模型與擴(kuò)散建模的融合,很獨特的側(cè)重點。
但隨著世界模型等推動強(qiáng)化學(xué)習(xí)的效率提升,底層的技術(shù)在加速迭代,最終也會反應(yīng)在表層的產(chǎn)品體驗上。
曾經(jīng),參加廠家有關(guān)智能駕駛的試駕體驗,多少是有些抗拒的。在我眼中,用著依賴高精地圖的智駕版本,行駛在廠家規(guī)劃好的單調(diào)路線上,和乘坐“有軌電車”的區(qū)別也不算明顯,味如嚼蠟。
現(xiàn)在,汽車面對未知環(huán)境時生成無數(shù)模擬線路,并根據(jù)實時信息選擇或是調(diào)整最優(yōu)路線的方式完全不同,有些像奇異博士,可以看到無數(shù)條未來的時間線,并選擇最優(yōu)解的那一個,酷的。
沒錯,汽車通過強(qiáng)化學(xué)習(xí),擁有自主預(yù)判性,開得更像人類,而不是按照既定規(guī)則去機(jī)械死板地行駛,很重要。
不久前,連續(xù)體驗了三款不同品牌、價位、感知策略的車型,實際感受大相徑庭。其中兩款價位相近、同為純視覺感知、主打“科技平權(quán)”的產(chǎn)品:
搭載德州儀器TDA4 VH智駕芯片(官方未明確公開信息,可能旗艦版搭載3顆TDA4 VH,等效96TOPS算力)的桂B(yǎng)車型,在用戶體驗的完成度上,主要是最體現(xiàn)智駕功力的領(lǐng)航輔助駕駛功能,尚不及接手自滴滴、換裝2顆NVIDIA Orion-X智駕芯片、等效508TOPS算力的新勢力粵A車型(尤其該車與路上其他車輛進(jìn)行路權(quán)博弈時,竟有點人類駕駛的味道了)。
花小錢、辦大事,采用高性價比智駕硬件,推動“科技平權(quán)”,并在泊車等方面帶來切實好用的功能,不失為一種成功的產(chǎn)品策略。
但如果想把“科技平權(quán)”貫徹到底,基于前沿硬件的高昂研發(fā)投入是必要的。智能駕駛走向普及,性能向上的突破與價格向下的普惠,相輔相成,缺一不可。
實際上,桂B(yǎng)廠商也已經(jīng)在規(guī)劃了,在技術(shù)進(jìn)化日上宣布,將會在未來采用NVIDIA Thor芯片,并加快大模型的上車與提高數(shù)據(jù)驅(qū)動的效率。
而首搭700TOPS算力的NVIDIA Thor芯片、多模態(tài)大語言模型、激光雷達(dá)和高清攝像頭,則可以快速賦予一臺售價30萬元以上的自主大型SUV該有的智能化水準(zhǔn)。
但拿到Thor芯片流片用來匹配、開發(fā)的時間還是太短了,僅僅一個多月,所以就用戶體驗而言,還需OTA升級幾個版本后,這臺杭州灣品牌的旗艦SUV才能達(dá)到令人滿意的成熟度。
對于智能駕駛輔助,硬件基礎(chǔ)依然是必要的,但不能確保帶來優(yōu)秀的用戶體驗,這就像一些復(fù)雜、優(yōu)質(zhì)的食材要經(jīng)過大廚的精心烹飪,才會是美味佳肴。而這,是個爭先、投入、探索、迭代的過程。
特斯拉自研的HW3.0系統(tǒng)在2019年便擁有了144TOPS算力與高清攝像頭。蔚來2022年在ET7上落地了1016TOPS的智駕算力與激光雷達(dá)。小鵬也是最早在緊湊級家用車上部署激光雷達(dá),雖然現(xiàn)在開始轉(zhuǎn)為“純視覺+高算力”為主的路線。
大模型的更新與智駕芯片算力的軍備競賽還在被推向新高,小鵬正在研發(fā) 720 億參數(shù)的基座模型,大約是當(dāng)下主流VLA模型的35倍,并構(gòu)建了一個相當(dāng)于萬卡集群的10EFLOPS算力的超算中心。
小鵬G7搭載3顆圖靈AI芯片,算力達(dá)到2200+TOPS。蔚來自研的5納米神璣NX 9031芯片的流片在2024年實現(xiàn)了流片。特斯拉HW5.0芯片算力也可能達(dá)到2500TOPS。
高度自定義硬件底層的高算力自研智駕芯片,與超算中心和強(qiáng)化學(xué)習(xí)模型,組出了駛向完全自動駕駛的車具。
基于“高算力+高感知”積累下的有價值的數(shù)據(jù)喂養(yǎng),經(jīng)過端到端、世界模型等先進(jìn)模型的強(qiáng)化學(xué)習(xí),讓智駕頭部玩家們可以展現(xiàn)出領(lǐng)先的體驗與可期待性。
后來者切換或者構(gòu)建出自身智駕體系時,可能會還要面對,一邊經(jīng)歷著初期有效數(shù)據(jù)和訓(xùn)練量偏少而造成的體驗波動,一邊看著“早鳥們”極速向前迭代。
很有趣,這種先發(fā)優(yōu)勢,有點類似于歐洲車企們在底盤調(diào)校方面的積淀與造詣。就像法系可以把扭力梁調(diào)好、保時捷能把麥弗遜玩出花活,特斯拉和一些自主品牌也在智能化方面展現(xiàn)先出獨到優(yōu)勢,輔之與供應(yīng)鏈的良好合作,這會是智能電動時代定義領(lǐng)先的新能力。
本文作者為踢車幫 孫小樹
文章推薦
探索沃爾沃XC60:豪華SUV中的安全典范 傳祺gs4霧燈在哪開 傳祺gs4倒車燈型號 比亞迪元用什么機(jī)油好 gs4空調(diào)濾芯怎么換 gs4自動空調(diào)怎么用 傳祺gs4水箱在哪里 廣汽gs4傳祺換車門 傳祺gs4儀表盤圖標(biāo) 傳祺gs4雨刷怎么用最新文章
探索沃爾沃XC60:豪華SUV中的安全典范 傳祺gs4霧燈在哪開 傳祺gs4倒車燈型號 比亞迪元用什么機(jī)油好 gs4空調(diào)濾芯怎么換 gs4自動空調(diào)怎么用 傳祺gs4水箱在哪里 廣汽gs4傳祺換車門 傳祺gs4儀表盤圖標(biāo) 傳祺gs4雨刷怎么用