客戶端下載

logo

當前位置:首頁 > 資訊 > 資訊詳情

都在夸端到端,到底有哪些缺點?

Myautotime | 10-28

19816

端到端催熟了智能駕駛體驗,處于智駕領域絕對頭部領先身位的小鵬汽車成功翻身,足以證明端到端的巨大優(yōu)點。

但是,被國內(nèi)車企吹上天的端到端也有一些不容忽視的缺點。

01

萬事萬物大都既有優(yōu)點也有缺點,很多東西都是一把雙刃劍!

端到端重構了自動駕駛的技術棧,算法的全面AI化,使得數(shù)據(jù)成為驅動自動駕駛模型迭代的基礎養(yǎng)料。

從此,自動駕駛系統(tǒng)在一定程度上擺脫了傳統(tǒng)范式下有多少人工就有多少智能的尷尬,也杜絕了算法工程師有意無意埋一些bug的做法。

天道昭昭,人心可鑒,在裁員四起、人心惶惶的大背景下,理解一下程序員們養(yǎng)bug自重的無奈吧。

在給定參數(shù)量和模型架構的前提下,自動駕駛模型的能力完全取決于訓練的數(shù)據(jù)規(guī)模有多大、數(shù)據(jù)的質量有多高、分布性有多么豐富。

在規(guī)則+算法的范式下,自動駕駛系統(tǒng)尚有部分知識來自于人工設定的規(guī)則,到了完全轉向數(shù)據(jù)驅動的端到端范式之后,自動駕駛系統(tǒng)全面模型化,系統(tǒng)壓縮的所有駕駛知識完全來自訓練數(shù)據(jù)。

這就意味著,到了端到端時代,自動駕駛系統(tǒng)訓練的數(shù)據(jù)規(guī)模比海量更加海量了。

iPhone大屏化之后,宣稱“Bigger than bigger”,比逼格更逼格,華為引入全向防撞系統(tǒng)之后,宣稱“比安全更安全”,大家借此體會一下啥叫比海量更海量吧。

隨著智駕里程的增長以及自動駕駛系統(tǒng)能力的提升,訓練的數(shù)據(jù)量當然也會不斷增長。

如果非要刻舟求劍的話,蔚來截至今年4月份的視頻訓練量為1,000萬個clips,小鵬截至今年9月份的視頻訓練量為2,000萬個clips,特斯拉那么恐怖的訓練算力,至少5,000萬個clips。

以上說的只是訓練素材的數(shù)量單位,還得考慮訓練頻次和模型的迭代速度。

就跟學霸們通過反復刷題提升成績一樣,模型也是通過反復地訓練這些數(shù)據(jù),才把駕駛知識訓練到模型的參數(shù)里面的。

特斯拉每天迭代一個小版本,假設需要訓練20個頻次,每天就得訓練10億個clips!

02

科學分析有兩種方式:定量分析和定性分析。

比海量更海量屬于定性分析,它可以給你一種模模糊糊的感覺,你盡可以根據(jù)自己的立場宣泄對端到端或褒或貶的情緒,不過,最終還是得進行定量分析,用真實的數(shù)據(jù)做嚴謹?shù)膶Ρ取?/p>

看數(shù)據(jù),特斯拉每天用5,000萬個clips訓練模型20個輪次,相當于訓練10億個clips,訓練算力有限,F(xiàn)SD模型迭代的速度就會減慢,特斯拉將“訓練算力”推高到100E的核心原因就在這里。

這個100E其實不只包括訓練算力,還包括推理算力,更為準確的說法是訓推一體的AI算力。

隨著數(shù)據(jù)標注工具推理能力的增加,過去主要依靠人工實現(xiàn)的數(shù)據(jù)標注工作逐漸得以自動化實現(xiàn),數(shù)據(jù)標注效率大大提升了。

不過,和模型需要一遍又一遍地訓練一樣,訓練素材的精標結果也需要一遍一遍地刷出來,其結果就是,自動駕駛數(shù)據(jù)閉環(huán)中的自動標注過程需要消耗的推理算力也大大增加了。

也就是說,目前的自動駕駛數(shù)據(jù)閉環(huán)消耗的絕不僅僅是訓練算力,還包括推理算力,模型訓練階段消耗訓練算力,訓練之前的數(shù)據(jù)標注消耗推理算力,用的是不同的服務器。

之所以還在繼續(xù)沿用訓練算力這么一個術語,主要原因是是歷史沿襲的約定俗成,而且大部分人還沒有及時更新認知。

和分模塊時代主要在感知層面打標簽不同的是,到了決策層也要模型化當然也要做數(shù)據(jù)標注的端到端時代,視頻訓練片段的數(shù)據(jù)標注工作大大增加了。

這就意味著,端到端視頻訓練片段的數(shù)據(jù)標注工作量非常巨大。

特斯拉買英偉達H100做訓練,自家的Dojo做推理,玩的那叫一個溜!

而本土車企不只是訓練算力不足,捉襟見肘的推理算力更是被端到端需要的海量數(shù)據(jù)標注工作打了個措手不及!

03

最近大火的《黑神話 悟空》告訴我們一個深刻的道理;人生在世,最可怕的就是執(zhí)念。

自動駕駛領域就有一撥人,始終心懷消滅激光雷達的執(zhí)念。

他們始終認為,隨著視覺神經(jīng)網(wǎng)絡訓練數(shù)據(jù)的增加、參數(shù)的加大、模型的優(yōu)化,最終可以消滅激光雷達。

端到端方案出現(xiàn)之后,由于消除了大量的冗余模塊,實現(xiàn)了計算資源的集約化使用,端到端自動駕駛系統(tǒng)的參數(shù)量得以翻番。

視覺神經(jīng)網(wǎng)絡能力迎來大幅度提升,他們更是覺得拿到了尚方寶劍,認為攝像頭可以將激光雷達斬于馬下了。

其實,端到端和純視覺與多傳感器融合之爭沒有什么關聯(lián)關系,即便是傳統(tǒng)的分模塊方案,拿掉激光雷達后,也可以拿節(jié)省下來的計算資源提高視覺神經(jīng)網(wǎng)絡的參數(shù)量和性能上限。

之所以說端到端不排斥激光雷達,落腳點還是在安全上面。

激光雷達可以提供感知冗余,提升自動駕駛系統(tǒng)的安全,傳統(tǒng)端到端方案中的規(guī)劃控制網(wǎng)絡也需要規(guī)則兜底,來彌補安全下限低的缺點。

一個是感知冗余,一個是規(guī)控冗余,想一想,這里面是不是有個大哥不說二哥的道理。

技術的發(fā)展存在蹺蹺板效應,上限高固然是端到端方案的優(yōu)點,下限低也是它的缺點。

正如Mobileye揭示的那樣,端到端方案在常規(guī)場景下具備更加優(yōu)雅不慫、淡定從容的駕駛風格,可以實現(xiàn)更加舒適的駕駛體驗,但在非常規(guī)場景下,這種優(yōu)雅不慫很可能轉成急躁冒動,帶來安全風險。

華為在它的分段式端到端網(wǎng)絡中,加入了與其PDP預測決策規(guī)劃網(wǎng)絡并行的本能安全網(wǎng)絡,很好地詮釋了“安全就是最大的豪華”的理念。

比亞迪也在它的分段式端到端方案BAS3.0中加入了類人類安全網(wǎng)絡,端到端負責詩與遠方,類人類安全網(wǎng)提供安全兜底保障。

如果說數(shù)據(jù)訓練和標注工作量巨大是甜蜜的煩惱的話,安全下限低便是端到端真正的缺點了。

在更好的訓練范式出現(xiàn)之前,以規(guī)則代碼或安全網(wǎng)絡兜底是不可避免的中間階段,某些車企的OneModel端到端聽聽就得了,切莫當真!

水滴汽車公眾號
掃碼關注,獲取更多汽車資訊
水滴汽車
掃碼下載水滴汽車APP

熱門評論(0)

加載更多

熱門車系資訊

更多 >

D7 DMH

12.58-14.58萬元

雅閣

17.98-25.98萬元

奧迪 e-tron

54.68-64.88萬元

杰德

12.99-18.38萬元

思域

11.99-16.99萬元

  1. 北京水滴交互網(wǎng)絡科技有限公司

Copyright @ 水滴汽車 京ICP備17030485號-2 京公網(wǎng)備 11010102003639號