“今天L4公司很多的技術(shù)路線還是算法+小AI模型的組合,都在痛苦的猶豫,是否應(yīng)該轉(zhuǎn)入端到端。我個人的建議是:別猶豫,趕緊改,后面那個才是大家伙。”
7月11日,小鵬汽車董事長何小鵬今日在微博上分享了自己關(guān)于無人駕駛的看法,其中關(guān)于端到端的“個人建議”再次引發(fā)行業(yè)熱議。
據(jù)悉,小鵬早在2022年率先成立了國內(nèi)最大的自動駕駛智算中心“扶搖”,擁有600PFLOPS的算力規(guī)模,專門用于訓(xùn)練智能駕駛的算法模型。
自今年以來,“端到端”已經(jīng)成為了智駕領(lǐng)域最火熱的概念,涵蓋車企、人工智能企業(yè)、自動駕駛技術(shù)公司以及自動駕駛芯片制造商在內(nèi)的多種類型參與者也都紛紛加碼布局,如鴻蒙智行、元戎啟行、商湯絕影、小鵬汽車、零一汽車等等。
那么究竟什么是自動駕駛領(lǐng)域的“端到端”?離大規(guī)模落地還有多遠(yuǎn)?
據(jù)業(yè)內(nèi)人士介紹,當(dāng)前主流的智能駕駛系統(tǒng)仍然采用模塊化模型,將任務(wù)分為感知、定位、預(yù)測、決策和控制等獨(dú)立的模型,每個模型的技術(shù)棧差異較大,處于下游的規(guī)劃模型需要依賴工程師編寫大量代碼去制定行駛規(guī)則。簡而言之,傳統(tǒng)的模塊化架構(gòu)就是像車間流水線一樣,經(jīng)過多個加工步驟,最終輸出可執(zhí)行駕駛指令。
但這種方式往往只能按照原有規(guī)劃處理各種數(shù)據(jù)信息,面對各種突發(fā)情況出現(xiàn)并不能做到“隨機(jī)應(yīng)變”,就可能產(chǎn)生誤差,并且隨著模塊間信息傳遞進(jìn)一步放大,甚至造成“失之毫厘差之千里”。此外,各個模塊進(jìn)行數(shù)據(jù)處理和傳輸也可能因?yàn)樘厥馇闆r的出現(xiàn)導(dǎo)致整體延時。在瞬息萬變的道路情況中,如果智駕系統(tǒng)不能第一時間做出準(zhǔn)確判斷,后果將不堪設(shè)想。
而端到端系統(tǒng)給出了不一樣的“解題思路”,它并不再依賴于編程來處理特定駕駛場景,而是通過大量數(shù)據(jù)信息來不斷學(xué)習(xí)和觀察,能夠像人一樣做出駕駛決策。
端到端自動駕駛能夠用更少的工程處理更多的數(shù)據(jù),將完全基于數(shù)據(jù)驅(qū)動進(jìn)行全局任務(wù)優(yōu)化。馬斯克甚至表示特斯拉采用端到端技術(shù),能夠用3000行代碼,替代了原來的30萬多萬行C++代碼。
端到端不僅降低對高精地圖、激光雷達(dá)以及人工的依賴,還能降低中間環(huán)節(jié)的成本,也為自動駕駛技術(shù)向L4級別無人駕駛的發(fā)展提供了更多可能。當(dāng)前,“端到端將是未來最主流的自動駕駛技術(shù)路線”已經(jīng)成為了業(yè)內(nèi)的共識。
盡管各家車企都叫端到端,但也分為不同的層次,分為顯式端到端(將多個神經(jīng)網(wǎng)絡(luò)拼接形成端到端)、隱式端到端(不輸出中間結(jié)果,直接輸出控制信號)和基于大語言模型的端到端架構(gòu)(將ChatGPT等模型與自動駕駛結(jié)合)。
在業(yè)內(nèi)人士看來,即使車企都宣傳自己是端到端甚至是“首個量產(chǎn)”,但具體采取的是哪種水平的端到端很難被用戶感知,到底誰是“玩噱頭”誰是“黑科技”還需要經(jīng)過實(shí)際檢驗(yàn)。
眾多車企和自動駕駛公司也紛紛押注“端到端”模型。智駕頭部玩家特斯拉已于今年1月向北美用戶正式推送FSD V12,成為首家在量產(chǎn)車型上實(shí)現(xiàn)端到端自動駕駛的公司。小鵬汽車則是國內(nèi)首個發(fā)布量產(chǎn)上車的端到端模型的整車企業(yè),其端到端大模型由神經(jīng)網(wǎng)絡(luò)XNet+規(guī)控大模型XPlanner+大語言模型XBrain三個部分組成。
不久前,理想也首次公開了其端到端自動駕駛技術(shù)架構(gòu),該架構(gòu)主要由端到端模型、VLM視覺語言模型、世界模型三部分共同構(gòu)成。商湯科技、毫末智行、元戎啟行等智能駕駛技術(shù)公司也都公布了自己的端到端智能駕駛量產(chǎn)方案。
除了端到端架構(gòu),想要實(shí)現(xiàn)更為先進(jìn)的智能駕駛功能,還需要大家耳熟能詳?shù)募す饫走_(dá)、攝像頭、智駕芯片等配置,以及軟硬件協(xié)同提供相應(yīng)的算力支持。如果說硬件基礎(chǔ)代表了智駕的“天賦”,那么算力則代表了后天的“學(xué)習(xí)”,而數(shù)據(jù)量則代表了“題庫”。只有既有天賦,又肯提升學(xué)習(xí)效率且拼命刷題庫的智駕系統(tǒng)才能真正成為能夠應(yīng)對各種復(fù)雜道路場景“考試”的“學(xué)霸”。
而隨著各家車企卷向高階智駕,對于算力和數(shù)據(jù)的需求也持續(xù)攀升。特斯拉此前預(yù)測公司算力規(guī)模將于2024年10月達(dá)到10萬PFLOPS(是衡量超級計算機(jī)性能的指標(biāo)之一,代表每秒一百億億次的浮點(diǎn)運(yùn)算能力),相當(dāng)于約30萬塊英偉達(dá)A100的算力總和。在今年4月,特斯拉宣布其FSD累計行駛里程達(dá)到超10億英里。
據(jù)透露,F(xiàn)SD V12版本的訓(xùn)練初期,在輸入超過100萬個視頻后,基于神經(jīng)網(wǎng)絡(luò)的自動駕駛系統(tǒng)才開始展現(xiàn)出良好的性能。在去年年初,特斯拉還上傳了約1000萬個人類駕駛視頻片段,而且是經(jīng)過篩選的優(yōu)質(zhì)司機(jī)。
目前,特斯拉在全球各地近200萬輛的車隊(duì),每天可收集約1600億幀視頻用于訓(xùn)練,但這還遠(yuǎn)遠(yuǎn)不夠。特斯拉預(yù)測,未來用于訓(xùn)練的視頻將達(dá)到數(shù)十億幀。
即使特斯拉FSD目前在北美表現(xiàn)不錯,但業(yè)內(nèi)一直也有觀點(diǎn)認(rèn)為是因?yàn)楸泵赖穆窙r較為簡單,而中國的道路比美國復(fù)雜十倍。尤其是在中國各大城市的道路上,AI需要面對由車、泥土車、單車、行人、兩輪車等組成的復(fù)雜場景。這也是特斯拉FSD入華要面臨的難點(diǎn)之一。
此外,針對不同天氣情況的駕駛場景,也需要有特定的駕駛視頻進(jìn)行訓(xùn)練。例如霧、雪、雨、沙塵等能見度低的天氣以及像那些一天經(jīng)歷四季的地區(qū),這無疑對于駕駛訓(xùn)練人員數(shù)量和優(yōu)質(zhì)訓(xùn)練視頻數(shù)量提出了更高的要求。
而各家企業(yè)手里有多少訓(xùn)練算力資源也直接決定了智能駕駛模型的訓(xùn)練效率與水平。目前,商湯已經(jīng)擁有4.5萬張GPU,運(yùn)營總算力規(guī)模達(dá)到12,000PFLOPS,預(yù)計算力在年底能達(dá)到2萬PFLOPS。華為乾崑 ADS 3.0在算力方面已達(dá)到3500PFLOPS。在此前的發(fā)布會上,小鵬汽車宣布每年會在算力上投入7個億,今年會擁有超過7000張GPU,但并未透露具體的算力規(guī)模。
由于智能駕駛技術(shù)涉及到的核心資源眾多,包括但不限于計算機(jī)視覺、語音識別、自然語言處理等方面,因此國內(nèi)車企和人工智能公司之間的競爭非常激烈。為了爭奪更多的市場份額,雙方都在不斷地進(jìn)行技術(shù)創(chuàng)新和產(chǎn)品升級,推動著智能駕駛技術(shù)的發(fā)展和進(jìn)步。
雖然國內(nèi)各家企業(yè)將2025年實(shí)現(xiàn)大規(guī)模端到端量產(chǎn)作為發(fā)展目標(biāo),但在專家看來,端到端模型離大規(guī)模商業(yè)化應(yīng)用還有一段較長距離,并且認(rèn)為當(dāng)前自動駕駛正處于商業(yè)化應(yīng)用的前期階段,預(yù)計2030年前后才能實(shí)現(xiàn)技術(shù)普及。此外,面對端到端模型尚未解決的黑盒問題和幻覺問題,還需要通過技術(shù)進(jìn)步而逐步克服。
綜上所述,在自動駕駛有望迎來徹底爆發(fā)的前夜,國內(nèi)車企和人工智能公司都已經(jīng)進(jìn)入智能駕駛核心資源的軍備賽階段。隨著自動駕駛行業(yè)馬太效應(yīng)更加劇,只有那些具備核心優(yōu)勢的玩家才能留在牌桌上。
文章推薦
探索沃爾沃XC60:豪華SUV中的安全典范 傳祺gs4霧燈在哪開 傳祺gs4倒車燈型號 比亞迪元用什么機(jī)油好 gs4空調(diào)濾芯怎么換 gs4自動空調(diào)怎么用 傳祺gs4水箱在哪里 廣汽gs4傳祺換車門 傳祺gs4儀表盤圖標(biāo) 傳祺gs4雨刷怎么用最新文章
探索沃爾沃XC60:豪華SUV中的安全典范 傳祺gs4霧燈在哪開 傳祺gs4倒車燈型號 比亞迪元用什么機(jī)油好 gs4空調(diào)濾芯怎么換 gs4自動空調(diào)怎么用 傳祺gs4水箱在哪里 廣汽gs4傳祺換車門 傳祺gs4儀表盤圖標(biāo) 傳祺gs4雨刷怎么用