9月初,美國加州通過了一項(xiàng)新法案:禁止特斯拉在輔助駕駛系統(tǒng)廣告中使用“自動駕駛”等詞語。美國今年至少有幾起死亡事件與特斯拉輔助駕駛系統(tǒng)Autopilot有關(guān),自動駕駛技術(shù)的虛假廣告有可能引發(fā)嚴(yán)重的安全問題,而2022 AI Day上,特斯拉FSD自動駕駛依然是重頭戲。
10月1號,特斯拉在美國加州舉辦2022 AI Day活動,本次發(fā)布會特斯拉首次亮相Optimus人形機(jī)器人,并展示了FSD輔助駕駛和Dojo超級計算機(jī)的最新進(jìn)展,我們今天重點(diǎn)來看看特斯拉FSD的最新進(jìn)展,因?yàn)槿诵螜C(jī)器人也用到了FSD的類似技術(shù)。
之前我們文章中提到過,目前參與FSD Beta版本測試的用戶已從2021年的2000人擴(kuò)大至16萬人,并且有可能在明年達(dá)到百萬用戶一起測試。在這一年之內(nèi),特斯拉自駕團(tuán)隊已經(jīng)測試了7萬5千個軟件模型,并且發(fā)布了多達(dá)281個模塊,更新了35個版本。這一年左右的更新,主要圍繞著一些細(xì)節(jié)場景的優(yōu)化,比如無保護(hù)左右轉(zhuǎn)等。
在最新的FSD版本上,特斯拉將提升交叉路口轉(zhuǎn)彎的決策優(yōu)化,通過更復(fù)雜場景中路面行人和其他車輛的軌跡的研究和模擬,提升決策的安全性和舒適性,并在100毫秒內(nèi)作出決策。
其中最重大的更新,就是上個月發(fā)布的Occupancy Network,直接在神經(jīng)網(wǎng)絡(luò)中完成2D的圖像平面到3D的BEV空間的變換,提升了多攝像頭感知下的準(zhǔn)確性和穩(wěn)定性。今年,進(jìn)一步將整個閉環(huán)流程優(yōu)化。工程師透過視頻來訓(xùn)練計算機(jī),實(shí)現(xiàn)可以自動Label模塊,可預(yù)測物體軌跡,計算出最佳路線,而運(yùn)算時間只需要10毫秒。
我們在網(wǎng)上看到過不少特斯拉自主躲避碰撞的視頻,這一次特斯拉首次展示出了自己的“避障方案”。
這是特斯拉依靠車身上的8顆攝像頭,輸出的3D占據(jù)網(wǎng)絡(luò),目前大多數(shù)自動駕駛公司的思路都是通過激光雷達(dá)、毫米波雷達(dá)甚至是4D成像毫米波雷達(dá)來掃描構(gòu)建3D世界,但上文我們提到了特斯拉用2D平面轉(zhuǎn)變?yōu)?D世界。
雖然看上去畫面很粗糙,但其實(shí)其位置精度很高,而且每個物體都是含有語義信息的,視覺的精準(zhǔn)程度還是不能精準(zhǔn)成像的雷達(dá)系統(tǒng)所比擬的。通過這樣的視覺占據(jù)網(wǎng)絡(luò),特斯拉FSD能夠擺脫曾經(jīng)“先識別再感知”的過程,像之前那種遇上不認(rèn)識的物體直接撞上去的事情,今后會越來越少下一版的 FSD 有望提升障礙物避讓的泛化能力。
想要用純視覺實(shí)現(xiàn) 3D 占據(jù)網(wǎng)絡(luò),最大的難題在于對海量數(shù)據(jù)的標(biāo)注處理,雖然特斯拉依靠百萬輛的搭載量,已經(jīng)獲取了數(shù)量龐大的數(shù)據(jù)集。
FSD Beta的車道模型也跟以前大不相同,大部分的車道模型是根據(jù)道路上的標(biāo)線而來,因此對行車環(huán)境有要求。但FSD Beta的車道,不僅有標(biāo)線,還可以依據(jù)現(xiàn)場環(huán)境自動繪制出的合理行車路線,這一點(diǎn)其實(shí)有些類似于之前我們提到過的比亞迪在無車道線的時候,依據(jù)周邊車輛的距離,進(jìn)行自主的車道居中保持功能。
特斯拉展示了在十字路口,F(xiàn)SD Beta現(xiàn)在可以標(biāo)示每個車道的起點(diǎn)、中間點(diǎn)和終點(diǎn),即使路口沒有轉(zhuǎn)彎標(biāo)線,計算機(jī)也能掌握車輛合理的行車路線,通過動態(tài)預(yù)測完成高難度的開放路口左轉(zhuǎn)。
特斯拉還介紹了FSD在為用戶進(jìn)行決策時使用的方式,以及收集數(shù)據(jù)對改進(jìn)自動駕駛算法的作用,并解釋占用及其在3D映射和提供汽車鳥瞰圖方面所起的作用。目前,F(xiàn)SD Beta的深度神經(jīng)網(wǎng)絡(luò)達(dá)到100萬參數(shù),15萬+神經(jīng)網(wǎng)絡(luò)層,37.5萬個連接。可以在5分鐘內(nèi)模擬出現(xiàn)實(shí)中未出現(xiàn)的場景。
自研訓(xùn)練芯片,比英偉達(dá)芯片更強(qiáng)?
面對數(shù)十萬的測試用戶所產(chǎn)生的巨大的數(shù)據(jù)量,特斯拉后臺的超算中心自然也不會弱,為了提升訓(xùn)練效率,特斯拉還自建了超算中心Dojo,并為此自研了訓(xùn)練芯片D1,沒錯,就是在自研了自動駕駛FSD芯片后,又自研了自動駕駛訓(xùn)練芯片。
D1芯片還使用了前沿的“晶圓封裝技術(shù)”,將25個D1芯片直接封裝在整個晶圓上面,每個Dojo ExaPod集成了120個訓(xùn)練模塊,內(nèi)置3000個D1芯片,擁有超過100萬個訓(xùn)練節(jié)點(diǎn),算力達(dá)到1.1 EFLOP(每秒千萬億次浮點(diǎn)運(yùn)算)。
單片芯片性能超越了英偉達(dá)的A100和H100芯片,在與英偉達(dá)A100的對比中,特斯拉的工程師給出了 Dojo 和英偉達(dá)A100在跑經(jīng)典圖像分類模型ResNet-50時的結(jié)果,Dojo可以實(shí)現(xiàn)比A100更高的幀率;而跑神經(jīng)網(wǎng)絡(luò)模型 Occupancy Network時,Dojo的性能倍增;最終的目標(biāo)是4.4倍于A100的單芯片訓(xùn)練速度,和更低的能耗、成本。英偉達(dá)的黃老板估計很快就會做出回應(yīng)了。
特斯拉在凡事都靠自己這條路上確實(shí)是越走越遠(yuǎn),這與其全球車企市值第一的地位,以及有一個志向不在地球的老板有密不可分的關(guān)系。
這一次,其實(shí)更受人關(guān)注的是首次亮相Optimus人形機(jī)器人,相比之前的概念版,原型機(jī)看起來十分粗糙。沒有外殼、涂裝,零件也完全裸露,就是為了讓它一絲不掛的,把最本真的一面展示給大家。
Optimus 使用了一顆特斯拉自研的 SoC 作為其智能中樞的關(guān)鍵組件,支持 WiFi 和 LTE(4G)網(wǎng)絡(luò)連接??紤]到機(jī)器人身處的場景與汽車的巨大差異,無線網(wǎng)絡(luò)、音頻輸入等支持,是保護(hù)人類用戶和 Optimus 雙方安全的必要組成,它的視覺感知系統(tǒng)類似于FSD的感知,目前還不知道它的具體感知邏輯,估計是比人類感知更加強(qiáng)大。
Optimus擎天柱的傳感器、控制系統(tǒng)全部整合在軀干上,全身擁有28個關(guān)節(jié)驅(qū)動器,完成200個以上不同角度的動作,最重要的手部,擁有6個驅(qū)動器,可以完成27個角度動作,可以負(fù)重10公斤并精準(zhǔn)抓握小型零件。
在Optimus的腹部軀干,裝有一個2.3 kWh的電池,足以提供它一整天工作所需電量,目前Optimus功耗并不大,靜坐時功耗約100瓦,慢走時功耗約為500瓦。
未來3至5年內(nèi)Optimus的開發(fā)就能成熟。在特斯拉機(jī)器人業(yè)務(wù)達(dá)到數(shù)百萬臺的量產(chǎn)規(guī)模時,其單臺售價將會大大低于汽車,預(yù)計價格將不會高于每臺2萬美元,差不多是特斯拉Model 3標(biāo)準(zhǔn)續(xù)航升級版4萬美元單價的一半。
想象一下,開車不用人為干預(yù),辦公伙伴還是機(jī)器人,你還需要做什么?
總結(jié):
馬斯克在社交網(wǎng)絡(luò)上說,這次活動的目的是招聘人工智能和機(jī)器人領(lǐng)域的工程師,開了個秀肌肉的大會,其實(shí)是一場招聘宣發(fā)會。
特斯拉的AI Day幾乎從來都不是PPT大會,而是用真材實(shí)料打動每一個人。面對這樣的企業(yè),我們也不能完全地只驚嘆于這些技術(shù),更要思考這些技術(shù)一旦全部付諸實(shí)際后,我們?nèi)祟愖陨碛謺窃鯓右粋€地位呢?