侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

為啥有人認(rèn)為自動(dòng)駕駛純視覺(jué)方案比激光雷達(dá)方案好?

激光雷達(dá)曾被視為自動(dòng)駕駛不可或缺的“安全拐杖”,但以特斯拉為代表的自動(dòng)駕駛方案讓大家看到了純視覺(jué)的潛力。視覺(jué)方案不僅在成本上有優(yōu)勢(shì),更在模擬人類(lèi)駕駛行為、處理復(fù)雜語(yǔ)義信息以及系統(tǒng)決策的一致性上,提供了更接近通用人工智能的解法。

實(shí)現(xiàn)邏輯更像人?

由于人類(lèi)駕駛員僅憑雙眼獲取的光學(xué)信息,配合大腦的邏輯推理,就能應(yīng)對(duì)極其復(fù)雜的交通環(huán)境。純視覺(jué)路線(xiàn)的支持者認(rèn)為,攝像頭作為感知的核心載體,其提供的信息豐富度遠(yuǎn)超激光雷達(dá)。

激光雷達(dá)雖然能精準(zhǔn)測(cè)距,但它在本質(zhì)上是“色盲”,無(wú)法識(shí)別交通信號(hào)燈的顏色、路面的文字標(biāo)識(shí)或物體表面的紋理。而攝像頭捕捉的高分辨率圖像包含極深的語(yǔ)義維度,系統(tǒng)不僅能發(fā)現(xiàn)前方有障礙物,還能通過(guò)視覺(jué)特征判斷其身份,如識(shí)別出路邊是一個(gè)正在玩耍、隨時(shí)可能沖向馬路的小孩,還是一個(gè)隨風(fēng)飄動(dòng)的塑料袋。

這種對(duì)語(yǔ)義信息的深度理解,賦予了車(chē)輛更強(qiáng)的預(yù)判能力。傳統(tǒng)的激光雷達(dá)方案在面對(duì)異形物體或長(zhǎng)尾場(chǎng)景時(shí),會(huì)因?yàn)閿?shù)據(jù)庫(kù)中缺乏對(duì)應(yīng)的幾何模型而產(chǎn)生漏檢或誤判。

相比之下,視覺(jué)系統(tǒng)通過(guò)深度學(xué)習(xí)模仿人類(lèi)的認(rèn)知模式,可以學(xué)習(xí)不同物體的行為規(guī)律。當(dāng)視覺(jué)系統(tǒng)識(shí)別出物體的類(lèi)別和狀態(tài)后,它能根據(jù)經(jīng)驗(yàn)預(yù)測(cè)其下一步動(dòng)作,這種基于語(yǔ)義理解的“決策智商”是單純依靠點(diǎn)云測(cè)距難以實(shí)現(xiàn)的。

同時(shí),隨著高清CMOS技術(shù)的進(jìn)步,視覺(jué)方案在遠(yuǎn)距離感知和空間連續(xù)性上也展現(xiàn)出了追趕甚至超越激光雷達(dá)的潛力。

傳感器沖突的決策與冗余的代價(jià)

很多人認(rèn)為傳感器越多越安全,但多傳感器融合有時(shí)會(huì)帶來(lái)致命的“決策沖突”。由于攝像頭、激光雷達(dá)和毫米波雷達(dá)的物理特性不同,它們對(duì)同一環(huán)境的感知結(jié)果經(jīng)常存在偏差。

如當(dāng)毫米波雷達(dá)因?yàn)闃蛄悍瓷湔`報(bào)障礙物,而攝像頭看到路面暢通時(shí),系統(tǒng)就會(huì)陷入信任哪一方的僵局,這正是引發(fā)“幽靈剎車(chē)”的常見(jiàn)誘因。

與其在多個(gè)不完美的傳感器之間進(jìn)行痛苦且可能出錯(cuò)的邏輯取舍,純視覺(jué)方案選擇將算力和研發(fā)精力全部押注在信息量最豐富的數(shù)據(jù)源上,通過(guò)算法的純粹化來(lái)消除這種不確定性。

除了決策層面的隱患,激光雷達(dá)在實(shí)際維護(hù)和環(huán)境適應(yīng)性上也并不是全能。雖然它主動(dòng)測(cè)距的特性很受青睞,但在面對(duì)大雨、濃霧或暴雪時(shí),激光束會(huì)被空氣中的水汽散射,導(dǎo)致探測(cè)精度銳減或產(chǎn)生大量虛假信號(hào)。

激光雷達(dá)的硬件結(jié)構(gòu)極其精密且脆弱,安裝在車(chē)頂?shù)任恢脴O易受損,且后期的標(biāo)定和清潔維護(hù)成本遠(yuǎn)高于攝像頭。對(duì)于追求大規(guī)模量產(chǎn)的車(chē)企而言,這種高昂的隱性成本和硬件復(fù)雜性,在某種程度上限制了自動(dòng)駕駛系統(tǒng)的普及速度和系統(tǒng)架構(gòu)的輕量化演進(jìn)。

占用網(wǎng)絡(luò)崛起讓純視覺(jué)更具潛力?

過(guò)去純視覺(jué)方案最大的短板是深度感知,即很難像激光雷達(dá)那樣直接給出精確距離。而隨著占用網(wǎng)絡(luò)(Occupancy Network)和鳥(niǎo)瞰圖(BEV)技術(shù)的引入,這一難題正被算法重構(gòu)。

BEV技術(shù)將多個(gè)攝像頭的二維圖像統(tǒng)一轉(zhuǎn)換到三維俯視圖中,消除了視角遮擋帶來(lái)的判斷誤差。而占用網(wǎng)絡(luò)則更進(jìn)一步,它不再糾結(jié)于物體是什么標(biāo)簽,而是將周?chē)臻g切割成細(xì)小的“體素”,直接預(yù)測(cè)每個(gè)空間單位是否被占據(jù)以及其運(yùn)動(dòng)趨勢(shì)。

這種從“特征工程”向“空間重構(gòu)”的轉(zhuǎn)變,讓視覺(jué)系統(tǒng)擁有了類(lèi)似激光雷達(dá)的“空間直覺(jué)”,即使面對(duì)從未見(jiàn)過(guò)的異形障礙物,也能憑借對(duì)物理占用的感知進(jìn)行安全避讓。

這種算法進(jìn)步使得感知與規(guī)劃的邊界變得模糊。通過(guò)引入時(shí)序信息,系統(tǒng)能夠“記住”之前看到的場(chǎng)景并預(yù)測(cè)未來(lái)的變化,這極大增強(qiáng)了車(chē)輛在復(fù)雜路口和人車(chē)混行場(chǎng)景下的處理能力。

更重要的是,占用網(wǎng)絡(luò)輸出的幾何表達(dá)可以直接對(duì)接規(guī)劃模型,使車(chē)輛的行駛軌跡生成更加平滑,更符合物理規(guī)律和人類(lèi)司機(jī)的駕駛習(xí)慣。當(dāng)算力和模型精度達(dá)到臨界點(diǎn),純視覺(jué)方案實(shí)際上是用更靈活的軟件復(fù)雜度替代了僵硬的硬件堆疊。

數(shù)據(jù)閉環(huán)與端到端智能的上限

自動(dòng)駕駛的終極競(jìng)爭(zhēng)是數(shù)據(jù)的競(jìng)爭(zhēng)。純視覺(jué)硬件的低成本使得它能輕易地在數(shù)十萬(wàn)、甚至數(shù)百萬(wàn)輛量產(chǎn)車(chē)上普及,這構(gòu)建了一個(gè)極其龐大的數(shù)據(jù)采集網(wǎng)絡(luò)。每當(dāng)車(chē)輛在真實(shí)道路上遇到邊緣案例時(shí),這些數(shù)據(jù)都能回傳至云端,通過(guò)自動(dòng)標(biāo)注技術(shù)不斷喂養(yǎng)算法模型。

這種規(guī);(yīng)是激光雷達(dá)方案難以企及的。隨著訓(xùn)練數(shù)據(jù)的指數(shù)級(jí)增長(zhǎng),純視覺(jué)系統(tǒng)的泛化能力會(huì)變得極其強(qiáng)大,使其能夠擺脫對(duì)高精地圖的依賴(lài),實(shí)現(xiàn)真正意義上的通用自動(dòng)駕駛。

目前,自動(dòng)駕駛行業(yè)正向著“端到端”(End-to-End)大模型全面轉(zhuǎn)型。這種架構(gòu)將感知、預(yù)測(cè)和規(guī)劃整合進(jìn)一個(gè)統(tǒng)一的神經(jīng)網(wǎng)絡(luò),原始視頻流輸入后直接輸出車(chē)輛的控制指令。

端到端模型能像老司機(jī)一樣,通過(guò)模仿海量?jī)?yōu)質(zhì)駕駛數(shù)據(jù)來(lái)習(xí)得駕駛技巧,而不是死記硬背枯燥的規(guī)則代碼。由于這種模型的核心是處理視覺(jué)信息流,它與純視覺(jué)路線(xiàn)天然契合。

當(dāng)一個(gè)足夠聰明的“大腦”能夠完美解析視頻序列中的物理規(guī)律時(shí),激光雷達(dá)所能提供的測(cè)距信息就顯得邊際效應(yīng)遞減。純視覺(jué)方案通過(guò)對(duì)人工智能上限的追求,正試圖在更簡(jiǎn)約的硬件基礎(chǔ)上實(shí)現(xiàn)更具擴(kuò)展性的智能進(jìn)化。

-- END --

       原文標(biāo)題 : 為啥有人認(rèn)為自動(dòng)駕駛純視覺(jué)方案比激光雷達(dá)方案好?

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)