撰文 / 王 劍
編輯 / 軒轅獎執(zhí)委會
設(shè)計 / 師瑜超
我們?yōu)槭裁匆P(guān)注“端到端”?
據(jù)軒轅獎執(zhí)委會統(tǒng)計,在最近4個月(20240517-20240919),至少14款搭載“端到端”技術(shù)的車型在中國市場推出(含OTA更新),截止今年年底,還會有4款車型推出。另外,布局此項技術(shù)的車企或智駕供應(yīng)商6家以上。
隨之,能看到一系列他們爭奪“領(lǐng)先”的宣傳——“行業(yè)首發(fā)、業(yè)內(nèi)首個、全球唯二”;以及對“端到端”智駕體驗的描述——“類人、擬人、超人”;還有技術(shù)路線的不同——兩段式、一段式可解釋、一段式不可解釋。
正如上圖所示,主流車企+智駕供應(yīng)商已經(jīng)推出相關(guān)車型,第二梯隊的企業(yè)也有布局。另外,從近期第十二屆軒轅獎的申報車型中,我們也發(fā)現(xiàn)了好幾款搭載“端到端”技術(shù)的車型。顯然,這是繼2022年BEV、2023年OCC占用網(wǎng)絡(luò)之后,2024年智駕領(lǐng)域最熱、最引人關(guān)注的技術(shù)方向。
但,引人思考的是,“端到端”是乘用車智駕的唯一路線嗎?真的適合所有車企與車型?要做好必備條件是什么?算力成本1-2億元就夠嗎?從消費者體驗而言,所帶來的功能有多重要?軒轅獎在今年的實車評測中,會用怎樣的方法來檢驗這項技術(shù)所帶來的效果?
撥開迷霧,探索本質(zhì)。
為此,我們采訪了軒轅獎評審團與顧問團中智駕領(lǐng)域的3位專家,他們是——軒轅獎評委、同濟大學(xué)汽車學(xué)院教授朱西產(chǎn);軒轅獎技術(shù)顧問與合作伙伴、魔視智能創(chuàng)始人虞正華,以及另一位技術(shù)顧問與合作伙伴、知行科技創(chuàng)始人兼CEO宋陽——他們從自身多年學(xué)術(shù)與實戰(zhàn)經(jīng)驗出發(fā),表達了自己的見解。
Q:我們很好奇,“端到端”一定是未來乘用車智駕的唯一路線嗎?所有車企都適合這條路嗎?
朱西產(chǎn)(軒轅獎評委、同濟大學(xué)汽車學(xué)院教授):從目前看,“端到端”是實現(xiàn)自動駕駛唯一的計算路線。但是并不是所有車企都要做具備自動駕駛功能的高端車型,價格在15萬元以下乘用車是主力車型,BOM成本在3000-5000元人民幣的NOA系統(tǒng)肯定不會走完全“端到端”技術(shù)路線,所以“端到端”這條路并不適合所有車企。
虞正華(軒轅獎技術(shù)顧問與合作伙伴、魔視智能創(chuàng)始人):端到端是主要路線,特別是近兩三年,端到端的上車還是主要處于技術(shù)探索和驗證的階段。對車企來說,有很多不同定位和價位的車型,技術(shù)方案要根據(jù)產(chǎn)品需求和定位來選擇。端到端技術(shù)的優(yōu)勢是用戶體驗上限高,但是所需資源也相應(yīng)更多,更適合注重用戶體驗的高端產(chǎn)品,在近幾年不適合注重成本的高性價比產(chǎn)品。
宋陽(軒轅獎技術(shù)顧問與合作伙伴、知行科技創(chuàng)始人兼CEO):端到端方案具有“上限高,但下限低”的特點。通俗來說就是,做得好可以達到很好的效果,做得不好比傳統(tǒng)方案更差。
對于 L2 和 L3 來說,“端到端”只是可行方案之一,在應(yīng)用時還需要與其他技術(shù)方案進行組合搭配。域控制器式架構(gòu)的數(shù)據(jù)規(guī)模與里程積累正相關(guān),銷量加速才能增加里程積累,并使得數(shù)據(jù)規(guī)模快速提升。
所以個人認為,主機廠中央計算架構(gòu)車型配置和銷量相對集中,更有利于數(shù)據(jù)運營、人才建設(shè)、AI基建等多方面能力的建設(shè)與提升,使得車企能更好地布局“端到端”方案。
Q:“端到端”的優(yōu)劣勢,分別是什么?
朱西產(chǎn):“端到端”模型的優(yōu)勢,是減少了各模塊之間信息傳遞過程中的信息丟失,通過Transformer構(gòu)成一個更大的網(wǎng)絡(luò),訓(xùn)練過程中實現(xiàn)更多參數(shù)的全局最優(yōu)。另外還可以提升開發(fā)效率、全局優(yōu)化、更強泛化性等。
“端到端”的缺點,是無法與人工準(zhǔn)則模型進行組裝,尤其是涉及安全的準(zhǔn)則模型,我們認為在運動規(guī)劃算法中一味地強調(diào)“絲滑”,而取消安全準(zhǔn)則模型的算法存在巨大安全隱患。另外還有數(shù)據(jù)要求質(zhì)量高+數(shù)量大、算力難題、算法難題、可解釋性難題、模型設(shè)計難題、上車難題等挑戰(zhàn)。
虞正華:
優(yōu)勢——
1)用戶體驗:基于算法原理上的突破,能夠提升用戶體驗的上限。
2)提升開發(fā)效率:簡化了系統(tǒng)架構(gòu),減少了模塊間接口的復(fù)雜性,降低了算法開發(fā)的復(fù)雜性,不需要人工設(shè)計各種規(guī)則。
3)無損信息傳遞:不依賴于工程師定義的模塊接口,減少了傳統(tǒng)模塊間的數(shù)據(jù)轉(zhuǎn)換和信息損失。
4)更強泛化性:得益于VLM等大模型,能夠更好地處理各種復(fù)雜場景。
劣勢——
1)驗證方法:對于端到端架構(gòu)開環(huán)的驗證手段無法重現(xiàn)實車的所有問題,而實車測試的代價極大。所以需要支持高保真度和傳感器一致性的仿真測試方案。
2)數(shù)據(jù)要求高:需要大量高質(zhì)量數(shù)據(jù)進行訓(xùn)練。
3)解釋性難題:一端感知輸入,另一端輸出結(jié)果,中間是難以解釋的“黑盒”。
4)算力挑戰(zhàn):需要強大的計算資源來支持模型訓(xùn)練和推理。
5)組織資源:端到端的團隊對于傳統(tǒng)自動駕駛團隊分工和工作方法論具有顛覆性,需要重新按照新的技術(shù)范式組織人員和資源。
宋陽:在傳統(tǒng)自動駕駛系統(tǒng),不同任務(wù)模塊針對特定任務(wù)獨立設(shè)計(例如最典型的阿波羅架構(gòu)),在可解釋性、可驗證性和易于調(diào)試等方面具有優(yōu)勢,但是由于各個模塊優(yōu)化目標(biāo)不同,如感知模塊追求檢測精度,規(guī)劃模塊追求駕駛安全性和舒適性,所以整個系統(tǒng)可能會因為錯誤積累而失效,并且多任務(wù)和多模塊部署也會增加計算負擔(dān)。
和傳統(tǒng)的自動駕駛系統(tǒng)相比,“端到端”系統(tǒng)有以下優(yōu)勢——
1)可以將感知、預(yù)測和規(guī)劃集合到一個可以聯(lián)合訓(xùn)練的模型中。
2)整個系統(tǒng),包括其中間特征,都是針對最終目標(biāo)進行優(yōu)化。
3)共享了主干網(wǎng)絡(luò),提高了計算效率。
4)數(shù)據(jù)驅(qū)動的優(yōu)化任務(wù)可以通過擴展訓(xùn)練數(shù)據(jù)不斷優(yōu)化提升系統(tǒng)能力。
Q:除了“端到端”,是否還有其他選擇?相形之下,優(yōu)劣勢是?
朱西產(chǎn):目標(biāo)物感知模塊、地圖感知模塊、軌跡預(yù)測模塊、占用網(wǎng)絡(luò)模塊及運動規(guī)劃模塊,分功能分別開發(fā)AI算法模塊和人工準(zhǔn)則模塊,采用模塊組裝的方式構(gòu)建NOA算法模型,能夠彌補數(shù)據(jù)和AI訓(xùn)練算力不足的難題,對智能駕駛域控制器的AI推理芯片的算力需求也能夠大大降低,從而有效控制智能駕駛系統(tǒng)的BOM成本。對于15萬元以下的乘用車,用戶更關(guān)注實用性,不會花高價為“自動駕駛”的噱頭買單。
虞正華:傳統(tǒng)模塊化方法,在簡單的ODD場景下,能夠滿足大部分中端及以下產(chǎn)品的需求。
宋陽:行業(yè)對“端到端”有似乎神話的傾向,認為其無所不能。事實上,喧鬧之外,行業(yè)還需要對“端到端”有一些基本常識的認知。
第一,“端到端”并不是一個特別大的模型,比如理想汽車的“端到端”方案其實在一個Orin-x上就能跑通,并且有大量的rule-based兜底。
第二,“端到端”并非萬能,其“黑盒”特性決定了無法通過簡單而明確可解釋的規(guī)則約束系統(tǒng)的安全邊界,存在安全性挑戰(zhàn)。
第三,模型能力評測從模擬環(huán)境到真實環(huán)境,系統(tǒng)的適應(yīng)能力和泛化能力有待更廣泛的驗證。
所以,在目前量產(chǎn)落地的“端到端”方案中,幾乎所有玩家都會采取規(guī)則兜底的方式進行風(fēng)險規(guī)避。
Q:當(dāng)前的車企或智駕供應(yīng)商,如果想要做好“端到端”,必須要具備的核心要素是什么?目前有解嗎?如何解?
朱西產(chǎn):“人工準(zhǔn)則模型”拼人力,“AI模型”的訓(xùn)練測試拼數(shù)據(jù)和云平臺算力。
特斯拉FSD 12版本的“端到端”,是一個參數(shù)量高達10億的“黑箱”AI模,完全取消了人工準(zhǔn)則模型,其訓(xùn)練和測試所需要的數(shù)據(jù)量和云平臺算力需求都非常高。特斯拉的用戶數(shù)據(jù)閉環(huán)系統(tǒng)在美國以及全球有400多萬輛車型能夠為FSD 12版本的訓(xùn)練收集數(shù)據(jù),Dojo平臺算力高達100E Flops(折合英偉達A100算力,約30萬張卡),建設(shè)費用高達100億美元。
特斯拉已經(jīng)證明,與模塊化算法結(jié)構(gòu)對比,“端到端”結(jié)構(gòu)能夠提升智能駕駛的性能上限,這是風(fēng)魔“端到端”的原因。
但是,根據(jù)Scaling Low,國內(nèi)車企走“端到端”技術(shù)路線,將受到數(shù)據(jù)量和訓(xùn)練平臺計算能力的限制。由于AI熱,現(xiàn)在全球范圍內(nèi)高算力AI計算芯片一卡難求,再加上美國的限制,國內(nèi)企業(yè)要購買AI訓(xùn)練顯卡非常貴、并且難買到。國內(nèi)目前車企有萬卡訓(xùn)練平臺的企業(yè)就屈指可數(shù)。
目前國內(nèi)企業(yè)中,華為已經(jīng)具備破除“端到端”Scaling Low魔咒的能力,華為海思云計算高算力AI芯片昇騰910的性能,能夠匹敵英偉達A100;昇騰910B能夠匹敵英偉達H100。華為云并不缺高算力云計算平臺。
并且,由于問界系列車型的熱銷,以及華為系的智界、享界、阿維塔、極狐等車型的數(shù)據(jù)都可以通過“八爪魚”用戶數(shù)據(jù)閉環(huán)系統(tǒng)進行數(shù)據(jù)收集,能夠提供數(shù)據(jù)的車型也很快能夠達到百萬輛這個量級。相信我國智能駕駛計算不會被特斯拉甩開。
虞正華:
核心要素包括——
1)算法研究能力:算法團隊對VLM等AI算法有深入理解和創(chuàng)新能力,并可以結(jié)合開源社區(qū)的進展。
2)數(shù)據(jù)處理能力:包括數(shù)據(jù)挖掘、采集、清洗、標(biāo)注和增強。
3)算力資源:強大的計算資源來支持模型訓(xùn)練和部署。
4)測試驗證:建立有效的測試驗證流程和工具。
解決方案——
建立這些核心能力需要大量的投入,不是所有公司都有能力全部獨自進行。所以企業(yè)應(yīng)該了解自身優(yōu)勢,明確定位,在最核心的要素上發(fā)力,在其它技術(shù)要素上采取生態(tài)合作的方式,利用技術(shù)社區(qū)和行業(yè)分工的力量。
宋陽:“端到端”算法將帶來的研發(fā)模式地更改,這才是每個主機廠和自動駕駛公司需要關(guān)注的重點,也是最痛苦之處。
“端到端”以純數(shù)據(jù)驅(qū)動的多模態(tài)大模型為核心,如果某智駕公司之前的技術(shù)方案有很多規(guī)則,那這些規(guī)則基本上就都要被推翻了;如果之前的技術(shù)方案已經(jīng)大部分改為模型驅(qū)動,那么這部分代碼大概率能以某種形式重用。
除了模型端以外,“端到端”也需要進行更多數(shù)據(jù)方面的工作:重構(gòu)數(shù)據(jù)閉環(huán)體系及其迭代效率,“端到端”的測試和驗證。其中,如何將整個仿真平臺的傳感器輸入做得足夠真實,是目前非常有挑戰(zhàn)性的技術(shù)問題。
Q:您認為,現(xiàn)在中國車企或智駕供應(yīng)商,哪些是真正有實力來做這件事的?
朱西產(chǎn):華為肯定沒問題,暢銷車(獲取數(shù)據(jù)必備)、云計算、AI大模型能力、車端芯片、工程經(jīng)驗,一樣也不缺。并且華為有近千億的自有資金用于智能汽車研發(fā)。
理想汽車AI基礎(chǔ)設(shè)施雖然差一些,但是理想L系列車型持續(xù)熱銷,也即將進入百萬量級,數(shù)據(jù)是AI的基礎(chǔ),只要增加AI算力投入,也可期待。
供應(yīng)商角度,地平線、Momenta的生態(tài)做的好,也是可期的。
虞正華:華為是有實力做這事的一家企業(yè),其它頭部的AI算法能力極強的供應(yīng)商也有可能做成這件事。車企里面,估計極少數(shù)頭部的車企有可能做成這事。
魔視智能作為一家以AI算法為核心優(yōu)勢的供應(yīng)商,也會投入并期待在端到端的方向做出自己的貢獻。
宋陽:“端到端”所需的算力主要用于“訓(xùn)練”和“部署”兩方面?!安渴稹笔遣少彾嗌賶K域控數(shù)量的問題,其成本固定且較低,并與單車成本相關(guān)。最大的成本是“訓(xùn)練”成本,分自建買卡和跟云服務(wù)商合作兩種。對訂單量比較大的車企來說,自己造數(shù)據(jù)中心更加合算;但對訂單量沒有那么大或處在前期研發(fā)階段的車廠和供應(yīng)商來說,找云服務(wù)商租服務(wù)器是較好的選擇。
如果只是簡單的一次“端到端”自動駕駛模型訓(xùn)練,上百張大算力的 GPU 就可以支持。但是要長期投入,并保證“端到端”質(zhì)量的話,自動駕駛公司的訓(xùn)練算力規(guī)?;驹谏锨Э墑e,車企投入會更多。
從綜合成本來說,作為技術(shù)演進的純“端到端”算力投入,其實小于模塊化架構(gòu),每年成本約一到兩個億,知行會穩(wěn)步推進,持續(xù)漸進地賦能我們的核心客戶和伙伴。
Q:對當(dāng)下中國市場“端到端”的火熱,三位如何看待?
朱西產(chǎn):更多是為了流量,實際上國內(nèi)車企具備做“端到端”的技術(shù)實力的沒幾個,但是,嘴上不能輸啊,打仗呢,一躺下就再也起不來了。
虞正華:自動駕駛技術(shù)近幾年依然在快速迭代,端到端目前還只是一個比較寬泛的概念,實際的實現(xiàn)方法有很多的不同,而且端到端也不是技術(shù)的終局。在技術(shù)向前發(fā)展的大趨勢中,企業(yè)應(yīng)當(dāng)根據(jù)自身定位逐步打造核心能力,比如數(shù)據(jù)閉環(huán)的能力。
宋陽:在過去的2年里,AI的發(fā)展速度超過歷史任何時期,但即使如此迅速和火熱,我堅信我們還處于AI變革的早期。我們能看到的是“端到端”已經(jīng)在改變研發(fā)體系,加速智能車的電子電氣架構(gòu)變革和算力提升。
Q:從消費者的角度而言,他們更多關(guān)注“端到端”帶來的駕乘體驗。那么,“端到端”究竟會帶來哪些功能或體驗(智駕方向)?
朱西產(chǎn):“端到端”從用戶體驗角度是“絲滑”,與人工準(zhǔn)則模型不同,采用用戶數(shù)據(jù)閉環(huán)采集的數(shù)據(jù)訓(xùn)練出來的AI模型,駕駛風(fēng)格更像一個“老司機”。
虞正華:我更關(guān)注更好的用戶體驗,以及安全性。用戶體驗主要是在日常使用的城市路段可以應(yīng)對高峰期擁堵的車流,更好的安全性是可以比人開車更安全,包括端到端的主動安全功能。
宋陽:第一,在長尾場景的處理上,“端到端”系統(tǒng)能夠比原來的系統(tǒng)覆蓋更多的極限場景,如常識處理能力。
第二,自動駕駛系統(tǒng)的行為更加擬人化,也能夠更強地建立消費者和系統(tǒng)之間的信任,“端到端”在博弈性比較強的場景里更像人類司機。
第三,數(shù)據(jù)驅(qū)動能快速解決熱點問題,快速迭代優(yōu)化以回應(yīng)消費者的熱點訴求。
Q:那么,這些功能或體驗,是用戶的核心需求嗎?
朱西產(chǎn):我認為安全才是智能駕駛的核心需求,我不認為“端到端“技術(shù)能給用戶帶來核心需求。
虞正華:總體來說,用戶的核心需求是希望在其選定的車型上實現(xiàn)相對最好的智駕體驗。因此,對高階車型而言,最好的體驗是核心需求,這部分用戶對成本不敏感;對中階以下的車型而言,性價比是更核心的需求。
宋陽:安全、安心、好用、擬人、快速迭代,這些毫無疑問是目前所有智駕系統(tǒng)的核心需求。
Q:針對剛才描述的用戶體驗,對比車企為“端到端”付出,這樣的投入產(chǎn)出比,劃算嗎?
朱西產(chǎn):不劃算,但是對于50萬元以上的豪華車,沒必要去計較是否“合算”。但15萬元以下的主流車型,現(xiàn)在一窩蜂的“端到端”,肯定是不劃算的,走通“端到端”,企業(yè)投入巨大,而15萬元經(jīng)濟型車型的車主不會為“端到端”的噱頭買單,企業(yè)會賠的更多。
從電動化到智能化,汽車越造越好,但是汽車企業(yè)好像賠的越來越多,我覺得沒有幾個企業(yè)能繼續(xù)為“端到端”噱頭把自己賠死也要做的。
虞正華:這取決于車企的定位,個人認為需要量力而行。極少數(shù)的車企出于自身的定位和資源積累情況,需要做端到端,但是并不是所有的車企都能夠并且需要付出這么大的投入,做汽車行業(yè)智能化先驅(qū)。
宋陽:開個玩笑,每個人都得要買菜做飯吃飯,所以不能從“劃算不劃算”的角度考慮這么重要的事。
從大行情上說,參照《2024麥肯錫中國汽車消費者洞察》,中國消費者對自動駕駛功能的興趣有所提升,但相比2023年,愿意為自動駕駛功能付費的金額卻有所下降。
但是前面其實也談到了,“端到端”由if-else的規(guī)則人工堆疊變成數(shù)據(jù)驅(qū)動,迭代的效率、研發(fā)人員的數(shù)量、數(shù)據(jù)投入和AI基建這些因素都處于一個動態(tài)平衡的過程中,最后就是“什么時間,買什么菜,做什么飯”的經(jīng)濟性問題了。
在汽車行業(yè)日益激烈的“內(nèi)卷”競爭中,知行作為從業(yè)者,必須要將我們要交付的智駕系統(tǒng)做成像筷子一樣,人人可用,必用,愛用,所以我們會優(yōu)先考慮把“端到端”落地到泊車和安全類功能這些高頻剛需場景中。
Q:在「軒轅獎」入圍車型實測中,二位的公司負責(zé)智能駕駛方面的測試,請問對于目前“端到端上車”帶來的功能,您會怎樣測試?主要考量的維度是什么?
虞正華:作為軒轅獎測試合作伙伴,我們在測試中會關(guān)注系統(tǒng)的安全性、舒適性和人機交互友好程度。針對端到端技術(shù)帶來的變化,我們會重點關(guān)注對用戶體驗敏感的場景,比如復(fù)雜的交通流,不規(guī)范的道路,不清晰的路面標(biāo)識等場景。
宋陽:
1)系統(tǒng)配置(算力、傳感器配置等)
2)系統(tǒng)性能(邊界、復(fù)雜場景)
3)系統(tǒng)安全能力(安全場景表現(xiàn))
4)系統(tǒng)舒適性(交互、易用性、安心感)
5)通行效率(路徑優(yōu)化、功能速率等)
文章推薦
探索沃爾沃XC60:豪華SUV中的安全典范 傳祺gs4霧燈在哪開 傳祺gs4倒車燈型號 比亞迪元用什么機油好 gs4空調(diào)濾芯怎么換 gs4自動空調(diào)怎么用 傳祺gs4水箱在哪里 廣汽gs4傳祺換車門 傳祺gs4儀表盤圖標(biāo) 傳祺gs4雨刷怎么用最新文章
探索沃爾沃XC60:豪華SUV中的安全典范 傳祺gs4霧燈在哪開 傳祺gs4倒車燈型號 比亞迪元用什么機油好 gs4空調(diào)濾芯怎么換 gs4自動空調(diào)怎么用 傳祺gs4水箱在哪里 廣汽gs4傳祺換車門 傳祺gs4儀表盤圖標(biāo) 傳祺gs4雨刷怎么用