撰文 / 張霖郁
編輯 / 涂彥平
設(shè)計 / 趙昊然
種種跡象都在表明,除了電池技術(shù)以及成本控制外,自動駕駛是未來車企一決高低的重要戰(zhàn)場。
小米近期大規(guī)模地招聘自動駕駛?cè)瞬?,另外,在大家對Robotaxi開始保持冷靜時,6月16日,Waymo宣布,在第二輪外部融資中籌集了25億美元,Waymo曾在2020年籌集了32.5億美元資金,這顯示了投資者在自動駕駛技術(shù)商業(yè)化方面的耐心。
為期三天的中國汽車藍(lán)皮書論壇,唯獨(dú)自動駕駛這個話題設(shè)置了專場,6月10日的分論壇,整個下午,從單人的演講嘉賓到圓桌論壇都在討論自動駕駛,共有15位來自整車廠和自動駕駛科技公司的負(fù)責(zé)人貢獻(xiàn)了真知灼見。
目前,自動駕駛行業(yè)大家似乎達(dá)成的一個共識是認(rèn)為場景的打通是最重要的,至于L2+,還是L2++,L3或L4并不是當(dāng)務(wù)之急最重要區(qū)分和解決的事,事實(shí)上,因?yàn)榉ㄒ?guī)、安全等因素的限制,主機(jī)廠很難篤定官宣自己的高階自動駕駛功能?!癓4的體驗(yàn),L2功能,或者預(yù)埋L4的硬件”,這是中國藍(lán)皮書論壇反復(fù)聽到嘉賓們的說法。
“什么叫場景打通呢?大家都知道,過去的輔助駕駛,很多車上都有,ACC這樣的功能,但問題是很多的功能都是一些非常割裂的,大家要去判斷,我什么時候這個功能可以開始用,什么時候那個功能開始使用,用戶體驗(yàn)并不好。” 禾多科技創(chuàng)始人CEO倪凱說。
他認(rèn)為自動駕駛功能廣泛運(yùn)行比小范圍的無人化運(yùn)行在現(xiàn)在這個階段更重要。
“為什么呢?我們認(rèn)為更廣泛的運(yùn)行,才能夠真正的有更多的數(shù)據(jù)迭代出真正逼近無人駕駛的算法。可能大家要問,怎么去實(shí)現(xiàn)這樣廣泛的運(yùn)行?也就是所謂的大規(guī)模的搭載。優(yōu)秀的體驗(yàn)其實(shí)非常重要,這樣的體驗(yàn)體現(xiàn)在我們整個場景的打通,也體現(xiàn)在很多用戶的一些痛點(diǎn)的場景的問題的解決?!?/span>
以下是倪凱的演講內(nèi)容。
大家好,我是禾多科技的創(chuàng)始人倪凱,今天我給大家分享的題目是“自動駕駛?cè)珗鼍暗牧慨a(chǎn)落地”。
我們先來看一下什么是我們所說的全場景的自動駕駛?大家都知道,Waymo是最早做城市無人駕駛的公司,去年晚些時候,特斯拉開始在城區(qū)釋放FSD的功能。很多人都在問,為什么Waymo都在城區(qū)做了十年的無人駕駛了,特斯拉還要在這樣一個時間點(diǎn)上去往城區(qū)的自動駕駛做?
場景打通更重要
今天我匯報的前半部分來解釋一下我們理解的未來自動駕駛的一些方向和背后的邏輯。
首先我覺得有一點(diǎn)可能行業(yè)里面越來越形成共識的就是所謂的場景打通比級別更重要。什么叫場景打通呢?大家都知道,過去的輔助駕駛,很多車上都有,ACC這樣的功能,但問題是很多的功能都是一些非常割裂的,大家要去判斷,我什么時候這個功能可以開始用,什么時候那個功能開始使用,用戶體驗(yàn)并不好。
我記得第一次開特斯拉的時候,有一點(diǎn)印象非常深刻,甭管是高速還是城區(qū),可能城區(qū)差一些,但是這個功能還可以開起來,當(dāng)然這個背后我覺得是需要自動駕駛技術(shù)真正支撐全場景,但是反映用戶體驗(yàn)上的一點(diǎn)非常關(guān)鍵,就是用戶其實(shí)不喜歡一個割裂的自動駕駛的感受,所以我們認(rèn)為全場景的打通非常重要。
第二點(diǎn),我們認(rèn)為廣泛運(yùn)行比小范圍的無人化運(yùn)行在現(xiàn)在這個階段對于未來的自動駕駛、迭代更重要。為什么呢?我們認(rèn)為更廣泛的運(yùn)行,才能夠真正的有更多的數(shù)據(jù)迭代出真正逼近無人駕駛的算法。
可能大家要問,怎么去實(shí)現(xiàn)這樣廣泛的運(yùn)行?也就是所謂的大規(guī)模的搭載。優(yōu)秀的體驗(yàn)其實(shí)非常重要,這樣的體驗(yàn)體現(xiàn)在我們整個場景的打通,也體現(xiàn)在很多用戶的一些痛點(diǎn)的場景的問題的解決。
例如這邊統(tǒng)計了一些消費(fèi)者認(rèn)為無人駕駛最需要攻克的一些場景,包括有一些泊車的場景,一些城市,擁堵、高速這樣的場景。只有通過去把所有的這些場景打通,去把體驗(yàn)提高,用戶才會有動力去購買我們這樣的智能汽車,用戶才會有動力去使用這樣的功能,不然的話,這個功能可能放在車上也是用戶永遠(yuǎn)不會開啟的功能。
所以可以簡單來說,我認(rèn)為有時候可能慢其實(shí)就是快,怎么說呢?因?yàn)橥ㄟ^數(shù)據(jù)迭代升級,其實(shí)是一種相對來說比較慢的過程,我如果用Waymo的模式,裝很多激光雷達(dá)。
我記得當(dāng)時2013年的時候,百度做自動駕駛也是裝很多激光雷達(dá),很快就可以把一個小樣跑出來,但是如果要實(shí)現(xiàn)真正的廣泛運(yùn)行,其實(shí)你是需要用一個相對慢的方式去實(shí)現(xiàn)大規(guī)模的搭載,而且更難的地方是在大規(guī)模搭載的同時,幫助用戶創(chuàng)造價值,又能夠保證用戶的安全。
所以我們看到特斯拉現(xiàn)在的數(shù)據(jù)在L4上,領(lǐng)頭的Waymo數(shù)據(jù),不管是車的數(shù)量還是積累的里程數(shù)量,我們都看到了,通過這兩年已經(jīng)有了質(zhì)的拉開的差距,這種差距最后會體現(xiàn)在所有自動駕駛演進(jìn)的速度上。
全場景落地的挑戰(zhàn)
做自動駕駛?cè)珗鼍傲慨a(chǎn)落地,我認(rèn)為還是非常有挑戰(zhàn)的事情,尤其是大規(guī)模的運(yùn)行。有幾件事情是需要保證的:
第一件事情是怎么做一個安全可信任的系統(tǒng)?這個系統(tǒng)不是說自動駕駛廠商或者車廠來說就是安全可信的,整個市場端要反映你這個系統(tǒng)是一個安全的系統(tǒng),可能政府也會有相應(yīng)的對高階層自動駕駛的規(guī)定、政策出臺,判斷這樣的系統(tǒng)是不是安全可信任的系統(tǒng)?
第二個是可量產(chǎn)。
第三個就是商業(yè)模式的成立,因?yàn)槲覀冊谟懻摪偃f量級,甚至是全行業(yè)千萬量級的交付,必須有一個可以交付的商業(yè)模式。
自動駕駛領(lǐng)域,我們認(rèn)為可量產(chǎn)是什么?不同的領(lǐng)域,可量產(chǎn)定義不一樣。我們認(rèn)為在乘用車市場上,可量產(chǎn)一定是能夠通過未來五到十年,實(shí)現(xiàn)百萬臺級別的交付,能夠覆蓋百萬平方公里級別全場景數(shù)據(jù)的回傳。
這里面有兩個關(guān)鍵點(diǎn):第一個,需要有合理的商業(yè)模式,必須是賺錢的事,或者不是大規(guī)模虧錢的事,才能支持全場景大規(guī)模的交付;第二個是這個系統(tǒng)必須給用戶產(chǎn)生足夠多的價值,這樣你的車才能賣出去,你也能夠讓用戶支撐在大范圍上開啟功能。這兩點(diǎn)都是非常重要的,對于可量產(chǎn)的定義。
禾多現(xiàn)在關(guān)注的就是全場景量產(chǎn)的自動駕駛企業(yè),禾多的名字也是來自于移動的移,我們希望通過全場景量產(chǎn)的路徑實(shí)現(xiàn)最后的無人駕駛。
打造本土數(shù)據(jù)驅(qū)動的自動駕駛量產(chǎn)解決方案,禾多是怎么思考的?我們大概會把我們的整個系統(tǒng)分成兩部分。一部分是行車系統(tǒng),還有一部分是專門解決停車場,或者最后一公里的系統(tǒng)。
這邊也有一些簡單的視頻來展示我們之前做的一些高速,包括城區(qū)以及泊車。我們想法是在相對固定的量產(chǎn)配置上,給用戶提供一個完整的、可以讓絕大部分用戶覆蓋到的場景和體驗(yàn)。
禾多科技能做什么
具體禾多在哪些方面有一些思考?或者我們主要做什么工作呢?
第一個方面,我們聚焦在整個系統(tǒng)開發(fā)流程、功能安全、預(yù)期功能安全,這三個在行業(yè)里不是新的事情,但我相信等到這些事情會應(yīng)用在自動駕駛系統(tǒng)里或者開發(fā)的過程里面,其實(shí)還是有很多挑戰(zhàn)的。
那為什么我們要做?除了我們需要關(guān)注內(nèi)因,也要關(guān)注外因。具體我們在很多的系統(tǒng)設(shè)計上,禾多也在做很多方面的思考。
從功能安全的角度來說,我們更多的會從頂層設(shè)計去實(shí)現(xiàn)各種安全狀態(tài)的轉(zhuǎn)移,包括各種失效狀態(tài)我們?nèi)绾芜M(jìn)行降級,如何確保整個自動駕駛系統(tǒng)仍然處在安全的狀態(tài)中。第二個是預(yù)期功能安全,預(yù)期功能安全最核心的是建立整套的場景庫。
第二個方面,是整個車規(guī)級硬件的配置。硬件方面,和自動駕駛相關(guān)聯(lián)的是兩個部分,第一個是傳感器。對于禾多來說,是以集成為主,傳感器像毫米波雷達(dá)、相機(jī)、GNSS、IMU、超聲波雷達(dá)這樣已有的傳感器。
第二個是整個車規(guī)級域控,禾多現(xiàn)在有兩個方案,一個是幾百T的大算力的方案,不僅支持L4,未來還可以支持全場景;第二個是幾十T算力的性價比方案,而且短時間內(nèi)迅速擴(kuò)大用戶使用量的方案。尤其是在真正要走量的方案上,幾十T的方案上,甚至10T以下方案上,很多時候針對像素優(yōu)化變成關(guān)鍵的一點(diǎn),從這一點(diǎn)上,硬件轉(zhuǎn)向軟件開發(fā)如何與之相對應(yīng)。
接下來就是我們有了這么多的傳感器,我們的軟件怎么做?軟件名稱叫法不同,可能有的叫多傳感器融合算法,但其實(shí)我們看到最核心的就是我們所說的狹義的感知。
對于現(xiàn)階段量產(chǎn)最關(guān)鍵的還是多源融合能力,因?yàn)槲覀儸F(xiàn)在傳感器很多,如何把這些信息有效的結(jié)合起來?第二個是算法能力邊界,這可能又回到了剛才說的廣泛運(yùn)行的概念上,如果我們不能做廣泛運(yùn)行,不能明確知道算法能力的邊界,你簡簡單單跑幾條街道,或者跑一個城市或幾個城區(qū),我認(rèn)為相對來說還是比較容易的。
大家知道,最早為什么做視覺的Mobileye這么成功?本質(zhì)上,我想是它向行業(yè)證明了在這么廣泛的一個范圍內(nèi)實(shí)現(xiàn)了一些功能和產(chǎn)出。所以,基于一個已有的硬件探索算法極限,是整個關(guān)系到安全的長尾問題。
第3個是新型硬件的適配,包括4D的毫米波雷達(dá),激光雷達(dá),包括相機(jī)陣列。新的傳感器不僅僅是做加法,它可能會進(jìn)入下一個階段。
除了狹義的感知以外,更重要的是廣義的感知。包括地圖一直是感知的一部分,如果你把車輛的位置信息和姿態(tài)信息也認(rèn)為是感知信息的話,那定位也是一種感知,本質(zhì)上它也是多傳感器融合之后處理的一個結(jié)果。
第三就是預(yù)測,因?yàn)槲覀兊氖澜缡莿討B(tài)的世界,尤其自動駕駛從停車場、城區(qū)進(jìn)軍整個城市以后,運(yùn)動的軌跡會越來越復(fù)雜。其實(shí)人開車也是衡量一個駕駛員是新司機(jī)還是老司機(jī)的核心的事情。
解決方案
下面是我總結(jié)的一句話,就是自動駕駛的一切Hack,本質(zhì)上都是廣義的感知能力不足。
后面簡單展示幾個視頻,剛才也提到整個嵌入式平臺的重要性,禾多我們也花了很多力氣在車規(guī)級線路平臺上布局自動駕駛整個感知的算法。這樣一套系統(tǒng)能夠在非常有競爭力的性價比方案上實(shí)現(xiàn)主機(jī)廠需要的自動駕駛功能。
第二個就是基于因子圖的緊耦合的定位方案。我們和Frank Dellaert合作,最近他也剛獲得世界級機(jī)器人協(xié)會RSS頒發(fā)的獎。我們希望通過能真正在工況下實(shí)現(xiàn)高精定位的一套系統(tǒng)。
第三個視頻是我們關(guān)于整個泊車場景下的眾包建圖和動態(tài)更新。行業(yè)里面一個特點(diǎn),就是泊車上的地圖并不如高速公路或者城區(qū)道路的地圖商業(yè)化做得那么快,在這樣大的市場背景下,有非常好的眾包建圖能力在泊車場景上是優(yōu)先于其他行車的場景?;谲嚿系沫h(huán)視,通過這樣的建圖,也能夠?qū)崿F(xiàn)我們停車場相對來說環(huán)境比較擁擠、比較復(fù)雜的地圖更新的工作。
除了現(xiàn)在一些已經(jīng)量產(chǎn)的技術(shù)之外,我們正在和清華大學(xué)在視覺感知領(lǐng)域也有非常深的合作,現(xiàn)在做的其中一個項(xiàng)目是我們用多孔徑的相機(jī)陣列做的下一代智能視覺雷達(dá)的工作,因?yàn)榇蠹抑牢覀儸F(xiàn)在相機(jī)雖然在迭代,像素從100萬到200萬到800萬,其實(shí)這樣的迭代時間都是相對比較長的。
我們希望通過多孔徑相機(jī)陣列的工作,能夠真正地將現(xiàn)有的相機(jī)技術(shù)進(jìn)一步升級,讓相機(jī)陣列能夠傳回非常穩(wěn)定、高清的信息,進(jìn)一步增強(qiáng)我們整個車輛的自動駕駛系統(tǒng)安全性。
最后一部分說一說我們在做的一些算法驗(yàn)證上的工作。
我們自己的整個驗(yàn)證平臺,我們稱之為holoX,是我們自主研發(fā)的自動駕駛仿真驗(yàn)證平臺,很多朋友會問我,為什么不買一個商用的仿真軟件?
原因很簡單:第一個是商用仿真軟件比較慢;第二個,大家可以從下面列的功能里面可以看到,仿真只是我們想做的這個平臺里面非常小的一部分功能,具體包括高精度地圖,可視化,包括預(yù)期功能安全的場景庫,包括隨即交通流,那些場景并不能被仿真軟件所替代,所以我們必須要打造自有知識產(chǎn)權(quán),或者快速迭代的holoX平臺的一個基本的原因。
我們認(rèn)為這其中最核心的還是場景庫驗(yàn)證這一塊,我們基于不同的維度,包括天氣、道路、交通參與者,駕駛行為,甚至包括我們的一些硬件的狀態(tài)去建立我們整個的自動駕駛,仿真和測試的場景庫,能夠真正和路測數(shù)據(jù)匹配,一起共同服務(wù)一個高維度的,覆蓋盡可能多的場景。
除了剛才說的這種仿真、場景庫以外,我們也通過不斷的全國范圍內(nèi)的大規(guī)模的真實(shí)路測去積累這樣的數(shù)據(jù),當(dāng)然我認(rèn)為本質(zhì)上這樣的數(shù)據(jù),在車輛的搭載能夠進(jìn)行百萬輛級別的交付,這才是最后進(jìn)入到真正的無人駕駛所必須的門檻,但是通過這樣的門檻中,我相信每一步的自動駕駛的功能都是通過每一個階段的自動駕駛的驗(yàn)證能夠慢慢實(shí)現(xiàn)的??赡芪覀儨y一個ACC需要幾十萬公里,測一個更高級別功能需要幾百萬公里、甚至幾千萬公里這樣的數(shù)據(jù)。
最后就是數(shù)據(jù)閉環(huán)。禾多這邊的思考數(shù)據(jù)閉環(huán)的思考主要有兩塊:
第一個閉環(huán)是禾多現(xiàn)在主要以自己為主來做的,就是整個云端的模型到自動駕駛的模型更新、云端模型訓(xùn)練。
第二個閉環(huán)是右邊的閉環(huán),更多的是和行業(yè)合作伙伴一起來做的,更多的是包括眾包地圖、數(shù)據(jù)融合,這塊可能又會從停車場地圖開始,慢慢的延展到更多的場景,實(shí)現(xiàn)未來的全場景高精度地圖一個相對及時、實(shí)時、低成本的更新。
最后我也簡單的做一個小小的彩蛋,博世中國ADAS事業(yè)部的負(fù)責(zé)人未來一兩周時間內(nèi)會加入禾多。