本期視頻專(zhuān)業(yè)性有點(diǎn)高,適合對(duì)智能汽車(chē)尤其是自動(dòng)駕駛感興趣的朋友們。
上一條視頻,給大家講了一下自動(dòng)駕駛整體上的工作原理,以及上一代自動(dòng)駕駛系統(tǒng)的工作模式和弊端,便于大家更好地理解這項(xiàng)技術(shù)的發(fā)展脈絡(luò)。今天我們聊一聊當(dāng)下最火的“端到端”、“神經(jīng)網(wǎng)絡(luò)算法”、“大語(yǔ)言模型”都是什么意思。
端到端算法架構(gòu)顧名思義,一端輸入原始信息,另一端直接輸出行動(dòng)指令,將整個(gè)駕駛行為“融會(huì)貫通”,相比上一代的模塊化算法架構(gòu),中間不再有流水線、半成品和一個(gè)個(gè)車(chē)間,取而代之的是一個(gè)整體化的神經(jīng)網(wǎng)絡(luò)。
關(guān)于神經(jīng)網(wǎng)絡(luò)算法的知識(shí)過(guò)于深?yuàn)W,這里不做展開(kāi),大家可以理解為,它模擬的是人類(lèi)神經(jīng)網(wǎng)絡(luò)的工作原理。想想人腦有多強(qiáng)大,就知道端到端算法架構(gòu)的優(yōu)勢(shì)了,首先它不再是生搬硬套程序員寫(xiě)好的規(guī)則,也不需要拿著高精地圖按圖索驥,而是像人一樣,在具備一些基本常識(shí)后,就可以通過(guò)不斷觀察和學(xué)習(xí),自己提煉應(yīng)對(duì)各種路況的方法,并且越開(kāi)越好。
其次,由于去掉了信息在流水線上傳遞的過(guò)程,誤差和延遲都大幅減少,靈活度大幅提升。這一點(diǎn)從自動(dòng)駕駛系統(tǒng)的代碼量上就能一目了然。馬斯克透露,通過(guò)使用端到端自動(dòng)駕駛算法,特斯拉只用2000行代碼就代替了原本的30萬(wàn)行代碼,系統(tǒng)效率提升了不止一星半點(diǎn)。
此外,感知、預(yù)測(cè)、規(guī)劃控制之間不再各自為政,工程師們可以站在自動(dòng)駕駛整體效果的維度,進(jìn)行全局優(yōu)化,杜絕了頭痛醫(yī)頭,腳痛醫(yī)腳的問(wèn)題。
簡(jiǎn)單總結(jié)一下,端到端算法架構(gòu)由于采用了像人腦一樣的工作模式,不僅給程序員減了負(fù),系統(tǒng)效率、準(zhǔn)確性、自動(dòng)駕駛體驗(yàn)的人性化程度,也都得到了大幅優(yōu)化。未來(lái)想要普及真正意義上的高階自動(dòng)駕駛,甚至是無(wú)人駕駛,必須依靠端到端算法。所以現(xiàn)在整個(gè)汽車(chē)行業(yè)都在從模塊化架構(gòu)向端到端架構(gòu)過(guò)渡。
但即便大家都叫端到端,層次也是有差別的。最初級(jí)的水平,叫顯式端到端,是將原有的算法模塊以神經(jīng)網(wǎng)絡(luò)拼接起來(lái),看圖就知道了,相當(dāng)于縫縫補(bǔ)補(bǔ),好處是簡(jiǎn)單、省事,還能有一定改進(jìn)效果。
更高一級(jí)的端到端算法叫隱式端到端,一般采用視覺(jué)或者多模態(tài)的感知信息作為輸入,算法模型直接輸出控制或者軌跡信號(hào),沒(méi)有中間環(huán)節(jié)。這種就是標(biāo)準(zhǔn)的端到端架構(gòu)了。
此外,還有基于大語(yǔ)言模型的端到端架構(gòu)。關(guān)于大語(yǔ)言模型,現(xiàn)在最火的就是ChatGPT,它能夠理解人類(lèi)的自然語(yǔ)義,并且通過(guò)學(xué)習(xí)互聯(lián)網(wǎng)的海量數(shù)據(jù),對(duì)我們提出的問(wèn)題給出優(yōu)質(zhì)反饋。
正是因?yàn)榇笳Z(yǔ)言模型擁有強(qiáng)大的認(rèn)知能力,所以越來(lái)越多的被應(yīng)用于駕駛場(chǎng)景。尤其是大語(yǔ)言模型可以和駕駛員對(duì)話,理解我們的想法,因此可以增強(qiáng)自動(dòng)駕駛給人的安全感。有觀點(diǎn)認(rèn)為大語(yǔ)言模型是最先進(jìn)的端到端架構(gòu),因?yàn)樗且环N通用的人工智能,可以解決所有問(wèn)題,但目前大語(yǔ)言模型剛剛起步,更多應(yīng)用于座艙系統(tǒng)。
好了,理論知識(shí)講的差不多了,接下來(lái)大家肯定會(huì)問(wèn),究竟誰(shuí)家的自動(dòng)駕駛能力更強(qiáng)?為什么落到實(shí)際使用中,各家感覺(jué)都是半斤八兩呢?下一期視頻我們接著說(shuō)。